PythonのPandasライブラリを用いたデータフレームに新しい列や行を追加する方法について詳しく解説します。具体的なコード例とその解説、応用例を含めています。
目次
はじめに
PythonのPandasライブラリは、データ解析において非常に有用なツールです。特にデータフレームは、表形式のデータを効率よく扱うことができます。今回は、データフレームに新しい列や行を追加する基本的な方法から応用テクニックまでを解説します。
基本的な方法
列を追加する
#### コード例
import pandas as pd
# 既存のデータフレームを作成
df = pd.DataFrame({
'A': [1, 2, 3],
'B': [4, 5, 6]
})
# 新しい列 'C' を追加
df['C'] = [7, 8, 9]
print(df)
この例では、既存のデータフレーム`df`に新しい列`C`を追加しています。列`C`にはリスト形式で[7, 8, 9]という値を追加しています。
行を追加する
#### コード例
# 新しい行を追加
new_row = {'A': 10, 'B': 11, 'C': 12}
df = df.append(new_row, ignore_index=True)
print(df)
この例では、`new_row`というディクショナリを作成し、それを`df.append()`メソッドで既存のデータフレームに追加しています。`ignore_index=True`はインデックスをリセットするオプションです。
応用例
条件に基づいて列を追加
#### コード例
# 'A'列の値が2より大きい場合、'D'列に1を設定
df['D'] = df['A'].apply(lambda x: 1 if x > 2 else 0)
print(df)
この例では、`apply()`メソッドとラムダ関数を使用して、’A’列の値が2より大きい場合に’D’列に1を設定しています。
複数のデータフレームを結合
#### コード例
# 2つ目のデータフレームを作成
df2 = pd.DataFrame({
'A': [11, 12],
'B': [13, 14],
'C': [15, 16]
})
# dfとdf2を結合
df_combined = pd.concat([df, df2], ignore_index=True)
print(df_combined)
この例では、新しいデータフレーム`df2`を作成し、`pd.concat()`関数を用いて既存の`df`と結合しています。
まとめ
Pandasライブラリを用いて、Pythonでデータフレームに列や行を追加する方法は多くあります。基本的な方法から応用例まで、データフレーム操作の幅を広げる重要なテクニックです。
コメント