Seabornでペアプロットを作成して変数間の関係を確認する方法

この記事では、Pythonのデータ可視化ライブラリSeabornを使ってペアプロット(pairplot)を作成し、変数間の関係を確認する方法について解説します。具体的なコード例とその詳細な解説、さらに応用例を2つ含めています。

目次

ペアプロットとは?

ペアプロットは、複数の変数間の関係を一度に確認できる強力な可視化手法です。主に散布図とヒストグラムを組み合わせて、各変数のペアについてその関係性を表示します。

必要な環境

Seabornを使うには、まず以下の環境が必要です。

Pythonのインストール

Python3.xの環境が必要です。

Seabornライブラリのインストール

Pythonのパッケージ管理ツールpipを使ってSeabornをインストールします。

# Seabornのインストール
pip install seaborn

基本的なペアプロットの作成方法

コード例

import seaborn as sns
import matplotlib.pyplot as plt

# データセットの読み込み
df = sns.load_dataset('iris')

# ペアプロットの作成
sns.pairplot(df, hue='species')

# グラフの表示
plt.show()

コードの解説

1. 必要なライブラリをインポートします。
2. Seabornに組み込まれている「iris」データセットを読み込みます。
3. `sns.pairplot()`関数でペアプロットを作成します。ここでは、`hue=’species’`として種類ごとに色を分けています。
4. `plt.show()`でグラフを表示します。

応用例

応用例1:グリッドのカスタマイズ

# グリッドとマーカーのスタイルをカスタマイズ
sns.pairplot(df, hue='species', markers=["o", "s", "D"], diag_kind='kde')
plt.show()

この応用例では、マーカーのスタイルを変更しています。また、対角線上のプロットをカーネル密度推定(KDE)で表示しています。

応用例2:特定の変数だけをプロット

# 特定の変数だけをプロット
sns.pairplot(df, hue='species', vars=['sepal_width', 'sepal_length'])
plt.show()

この応用例では、`vars`オプションを使用して特定の変数だけをプロットしています。

まとめ

Seabornを使用してペアプロットを作成する方法と、その応用例について解説しました。この手法を使うことで、多変数データの構造や関係性を効率よく把握することができます。

コメント

コメントする

目次