Pythonでデータフレームのカラムとインデックスを操作する方法

この記事では、PythonのPandasライブラリを使用してデータフレームのカラムとインデックスを操作する方法について解説します。具体的なコード例、その詳細な解説、および応用例を2つ以上提供します。

目次

データフレームとは

Pandasのデータフレーム(DataFrame)は、表形式のデータを効率的に操作できる高機能なデータ構造です。各カラムは異なるデータ型を持つことができ、インデックスを用いて行を識別します。

基本的な操作

カラムの追加と削除

データフレームに新しいカラムを追加する基本的な方法と、不要なカラムを削除する方法を説明します。

import pandas as pd

# データフレームの作成
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
print("初期データフレーム:")
print(df)

# カラムの追加
df['C'] = [7, 8, 9]
print("カラム追加後:")
print(df)

# カラムの削除
df.drop('A', axis=1, inplace=True)
print("カラム削除後:")
print(df)

コード解説

1. `import pandas as pd`: Pandasライブラリをpdとしてインポートします。
2. `df = pd.DataFrame(…)`: 初期のデータフレームを作成します。
3. `df[‘C’] = […]`: 新しいカラム`C`を追加し、その値を指定します。
4. `df.drop(…)`: カラム`A`を削除します。`inplace=True`にすると、元のデータフレーム自体が更新されます。

インデックスの操作

データフレームのインデックスを変更、リセットする基本的な方法について説明します。

# インデックスの設定
df.set_index('B', inplace=True)
print("インデックス設定後:")
print(df)

# インデックスのリセット
df.reset_index(inplace=True)
print("インデックスリセット後:")
print(df)

コード解説

1. `df.set_index(…)`: カラム`B`を新しいインデックスとして設定します。
2. `df.reset_index()`: インデックスをリセットし、デフォルトの数値インデックスに戻します。

応用例

複数のカラムを操作

複数のカラムを一度に追加、削除する方法について説明します。

# 複数のカラムの追加
df['D'] = [10, 11, 12]
df['E'] = [13, 14, 15]
print("複数のカラム追加後:")
print(df)

# 複数のカラムの削除
df.drop(['D', 'E'], axis=1, inplace=True)
print("複数のカラム削除後:")
print(df)

インデックスでフィルタリング

インデックスを使用してデータフレームをフィルタリングする方法を説明します。

# インデックスでフィルタリング
filtered_df = df[df.index > 1]
print("フィルタリング後:")
print(filtered_df)

まとめ

この記事では、PythonのPandasライブラリを用いて、データフレームのカラムとインデックスを操作する基本的な方法と応用例を解説しました。これらのテクニックは、データ解析やデータ前処理で非常に役立つスキルです。

コメント

コメントする

目次