Pythonでデータフレームをコンディショナルに操作する方法

この記事では、Pythonのデータフレームをコンディショナル(条件付き)に操作する方法について詳しく解説します。具体的なコード例とその解説、応用例を含めています。

目次

データフレームとは

データフレームは、Pythonのデータ分析ライブラリであるPandasで使用される2次元のデータ構造です。Excelのスプレッドシートのように、行と列でデータを管理できます。

環境の設定

Pandasのインストールが必要です。コマンドラインで以下のコードを実行してください。

pip install pandas

基本的なコンディショナルな操作

データフレームの生成

まずは基本的なデータフレームを作成しましょう。

import pandas as pd

# データフレームの生成
df = pd.DataFrame({
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'Occupation': ['Engineer', 'Doctor', 'Lawyer']
})

print(df)

条件に一致する行をフィルターする

30歳以上の人物のみを抽出する例です。

# 30歳以上の人物を抽出
df_filtered = df[df['Age'] >= 30]

print(df_filtered)

応用例

複数の条件に一致する行をフィルターする

この例では、30歳以上で、職業がエンジニアまたは医者の人物を抽出します。

# 複数の条件でフィルター
df_filtered_multi = df[(df['Age'] >= 30) & (df['Occupation'].isin(['Engineer', 'Doctor']))]

print(df_filtered_multi)

新しい列を条件に基づいて生成する

この例では、年齢に基づいて新しい列「Seniority」を生成します。

# 新しい列を生成
df['Seniority'] = ['Senior' if age >= 30 else 'Junior' for age in df['Age']]

print(df)

まとめ

PythonのPandasライブラリを用いて、データフレームをコンディショナルに操作する方法について詳しく見てきました。基本的なフィルタリングから、複数の条件を用いた高度な操作まで、様々な事例を紹介しました。

コメント

コメントする

目次