データフレームをピボットする方法は?

PYTHON3 チュートリアル

データフレームのピボットとは

データフレームのピボットとは、行と列の入れ替えを行う操作です。特定の列に含まれる値を新しい列として配置し、その値に対応するデータを元の行から取り出して再構成します。この操作により、データの見やすさや分析のしやすさが向上します。

データフレームのピボット方法

PythonのPandasライブラリを使用してデータフレームをピボットする方法を説明します。以下に、具体的な例と結果を示します。

サンプルコード1: ピボットテーブルの作成

import pandas as pd

data = {
    'date': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02'],
    'city': ['Tokyo', 'Osaka', 'Tokyo', 'Osaka'],
    'temperature': [10, 15, 12, 14]
}

df = pd.DataFrame(data)
pivot_table = df.pivot(index='date', columns='city', values='temperature')
print(pivot_table)

上記のコードでは、’date’列を行インデックス、’city’列を列としてピボットし、’temperature’列の値を表示しています。

サンプルコード2: ピボットしたデータの結合

data = {
    'date': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02'],
    'city': ['Tokyo', 'Osaka', 'Tokyo', 'Osaka'],
    'temperature': [10, 15, 12, 14],
    'humidity': [60, 70, 65, 75]
}

df = pd.DataFrame(data)
pivot_table = df.pivot(index='date', columns='city')
print(pivot_table)

上記のコードでは、’date’列を行インデックス、’city’列を列としてピボットし、’temperature’と’humidity’の値を表示しています。

サンプルコード3: ピボットテーブルの欠損値処理

data = {
    'date': ['2022-01-01', '2022-01-01', '2022-01-02'],
    'city': ['Tokyo', 'Osaka', 'Tokyo'],
    'temperature': [10, 15, 12]
}

df = pd.DataFrame(data)
pivot_table = df.pivot(index='date', columns='city', values='temperature').fillna(0)
print(pivot_table)

上記のコードでは、ピボットテーブルで欠損値を0で埋める処理を行っています。

以上が、データフレームのピボット方法と具体的な例についての解説です。ピボットを活用することで、データの整理や分析が効率的に行えることがわかります。

データフレームをピボットする方法は、主に「pivot_table()」メソッドを使用することで行われます。このメソッドは、Pandasライブラリで提供されており、データフレームの行と列を入れ替えることができます。ピボット操作を行う際には、ピボットしたいデータフレームを指定し、行と列のインデックスと値を指定する必要があります。また、ピボット操作にはさまざまなパラメータを指定することで、集計や集計方法をカスタマイズすることも可能です。

購読
通知
0 Comments
Inline Feedbacks
View all comments