この記事では、Pythonのライブラリであるpandasを使用してCSVファイルを読み込む方法について詳しく解説します。具体的なコード例、その詳細な解説、そして応用例を含めています。
目次
CSVファイルとは
CSV(Comma-Separated Values)ファイルは、データをカンマで区切って保存するテキストファイルの一種です。エクセルで開くこともでき、多くのデータベースやプログラミング言語で扱うことができます。
pandasとは
pandasはPythonで使用するデータ解析ライブラリの一つです。特に、データフレームと呼ばれる表形式のデータ構造を持っており、それを用いてCSVファイルなどのデータを効率よく処理できます。
基本的な読み込み方
import pandas as pd
# CSVファイルを読み込む
df = pd.read_csv('sample.csv')
# 先頭の5行を表示
print(df.head())
コード解説
1. `import pandas as pd`:pandasライブラリを`pd`という名前でインポートします。
2. `pd.read_csv(‘sample.csv’)`:`read_csv`メソッドでCSVファイルを読み込みます。この時点でデータフレーム`df`が生成されます。
3. `df.head()`:データフレームの先頭5行を表示します。
応用例1: 列を指定して読み込む
# 'Name'と'Age'の列だけを読み込む
df = pd.read_csv('sample.csv', usecols=['Name', 'Age'])
# 結果を表示
print(df)
コード解説
`usecols=[‘Name’, ‘Age’]`とすることで、’Name’と’Age’の列のみを読み込んでいます。
応用例2: インデックス列を指定する
# 'ID'列をインデックスとして使用
df = pd.read_csv('sample.csv', index_col='ID')
# 結果を表示
print(df)
コード解説
`index_col=’ID’`とすることで、’ID’列をインデックスとして読み込んでいます。
まとめ
この記事では、pandasを使用してCSVファイルをいくつかの方法で読み込む方法を解説しました。基本的な読み込みから応用例まで、多角的に方法を押さえておくことで、さまざまなシナリオに対応できるようになります。
コメント