データフレームのピボットとは
データフレームのピボットとは、行と列の入れ替えを行う操作です。特定の列に含まれる値を新しい列として配置し、その値に対応するデータを元の行から取り出して再構成します。この操作により、データの見やすさや分析のしやすさが向上します。
データフレームのピボット方法
PythonのPandasライブラリを使用してデータフレームをピボットする方法を説明します。以下に、具体的な例と結果を示します。
サンプルコード1: ピボットテーブルの作成
import pandas as pd data = { 'date': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02'], 'city': ['Tokyo', 'Osaka', 'Tokyo', 'Osaka'], 'temperature': [10, 15, 12, 14] } df = pd.DataFrame(data) pivot_table = df.pivot(index='date', columns='city', values='temperature') print(pivot_table)
上記のコードでは、’date’列を行インデックス、’city’列を列としてピボットし、’temperature’列の値を表示しています。
サンプルコード2: ピボットしたデータの結合
data = { 'date': ['2022-01-01', '2022-01-01', '2022-01-02', '2022-01-02'], 'city': ['Tokyo', 'Osaka', 'Tokyo', 'Osaka'], 'temperature': [10, 15, 12, 14], 'humidity': [60, 70, 65, 75] } df = pd.DataFrame(data) pivot_table = df.pivot(index='date', columns='city') print(pivot_table)
上記のコードでは、’date’列を行インデックス、’city’列を列としてピボットし、’temperature’と’humidity’の値を表示しています。
サンプルコード3: ピボットテーブルの欠損値処理
data = { 'date': ['2022-01-01', '2022-01-01', '2022-01-02'], 'city': ['Tokyo', 'Osaka', 'Tokyo'], 'temperature': [10, 15, 12] } df = pd.DataFrame(data) pivot_table = df.pivot(index='date', columns='city', values='temperature').fillna(0) print(pivot_table)
上記のコードでは、ピボットテーブルで欠損値を0で埋める処理を行っています。
以上が、データフレームのピボット方法と具体的な例についての解説です。ピボットを活用することで、データの整理や分析が効率的に行えることがわかります。
データフレームをピボットする方法は、主に「pivot_table()」メソッドを使用することで行われます。このメソッドは、Pandasライブラリで提供されており、データフレームの行と列を入れ替えることができます。ピボット操作を行う際には、ピボットしたいデータフレームを指定し、行と列のインデックスと値を指定する必要があります。また、ピボット操作にはさまざまなパラメータを指定することで、集計や集計方法をカスタマイズすることも可能です。