pandasで条件に基づくデータの変更方法

Pythonのpandasライブラリはデータ解析やデータ整理に非常に便利なツールです。この記事では、pandasを用いた条件に基づくデータの変更方法について詳しく解説します。具体的なコード例とその解説、さらに応用例を2つ含めています。

目次

pandasとは

pandasはPythonで利用されるデータ解析ライブラリです。Excelのような表形式のデータを効率的に扱うための機能が豊富に用意されています。特に、条件に基づくデータの変更が容易であり、データクレンジングから分析まで幅広く用いられます。

基本的な条件に基づくデータの変更

pandasで条件に基づくデータの変更を行う際には、主に`DataFrame.loc`を使用します。

基本的なコード例

以下は、あるDataFrame内で条件に合致するデータを変更する基本的なコード例です。

import pandas as pd

# サンプルデータ作成
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'city': ['NY', 'LA', 'Chicago']
})

# ageが30以上の行のcityを'Tokyo'に変更
df.loc[df['age'] >= 30, 'city'] = 'Tokyo'

print(df)

コード解説

このコードでは、まずサンプルのDataFrameを作成しています。次に、`DataFrame.loc`を用いてageが30以上の人物のcityを’Tokyo’に変更しています。

応用例1:複数条件に基づくデータの変更

複数の条件に基づいてデータを変更する場合もあります。その際には、条件を`&(AND)`や`|(OR)`で繋げます。

# ageが30以上かつ、nameが'Charlie'の行のcityを'Osaka'に変更
df.loc[(df['age'] >= 30) & (df['name'] == 'Charlie'), 'city'] = 'Osaka'

print(df)

コード解説

この応用例では、ageが30以上かつnameが’Charlie’の人物のcityを’Osaka’に変更しています。

応用例2:新しいカラムを条件に基づいて追加

条件に基づいて新しいカラムを追加する場合もあります。

# ageが30以上の場合、新しいカラム'status'を'Senior'に設定
df.loc[df['age'] >= 30, 'status'] = 'Senior'

print(df)

コード解説

この応用例では、ageが30以上の人物に対して新しいカラム’status’を追加し、その値を’Senior’に設定しています。

まとめ

pandasを用いると、条件に基づくデータの変更が非常に容易に行えます。基本的な使用方法から複数条件の適用、新しいカラムの追加まで、様々な操作が可能です。これを機に、pandasを使ってより高度なデータ操作を行ってみてはいかがでしょうか。

コメント

コメントする

目次