この記事では、Pythonのデータ可視化ライブラリSeabornを使ってペアプロット(pairplot)を作成し、変数間の関係を確認する方法について解説します。具体的なコード例とその詳細な解説、さらに応用例を2つ含めています。
目次
ペアプロットとは?
ペアプロットは、複数の変数間の関係を一度に確認できる強力な可視化手法です。主に散布図とヒストグラムを組み合わせて、各変数のペアについてその関係性を表示します。
必要な環境
Seabornを使うには、まず以下の環境が必要です。
Pythonのインストール
Python3.xの環境が必要です。
Seabornライブラリのインストール
Pythonのパッケージ管理ツールpipを使ってSeabornをインストールします。
# Seabornのインストール
pip install seaborn
基本的なペアプロットの作成方法
コード例
import seaborn as sns
import matplotlib.pyplot as plt
# データセットの読み込み
df = sns.load_dataset('iris')
# ペアプロットの作成
sns.pairplot(df, hue='species')
# グラフの表示
plt.show()
コードの解説
1. 必要なライブラリをインポートします。
2. Seabornに組み込まれている「iris」データセットを読み込みます。
3. `sns.pairplot()`関数でペアプロットを作成します。ここでは、`hue=’species’`として種類ごとに色を分けています。
4. `plt.show()`でグラフを表示します。
応用例
応用例1:グリッドのカスタマイズ
# グリッドとマーカーのスタイルをカスタマイズ
sns.pairplot(df, hue='species', markers=["o", "s", "D"], diag_kind='kde')
plt.show()
この応用例では、マーカーのスタイルを変更しています。また、対角線上のプロットをカーネル密度推定(KDE)で表示しています。
応用例2:特定の変数だけをプロット
# 特定の変数だけをプロット
sns.pairplot(df, hue='species', vars=['sepal_width', 'sepal_length'])
plt.show()
この応用例では、`vars`オプションを使用して特定の変数だけをプロットしています。
まとめ
Seabornを使用してペアプロットを作成する方法と、その応用例について解説しました。この手法を使うことで、多変数データの構造や関係性を効率よく把握することができます。
コメント