リストの辞書をpandasのDataFrameに変換する

PYTHON3 チュートリアル

はじめに

PandasはPythonでデータ分析を行うための非常に強力なライブラリです。特に、リストの辞書をDataFrameに変換する機能は、データサイエンスの分野において頻繁に使用されます。この操作により、データの構造が整理され、分析や加工がしやすくなります。本記事では、リストの辞書をPandasのDataFrameに変換するいくつかの方法を紹介し、実際のコード例を通じてその使用方法を解説します。

方法1: 直接変換

最も基本的な方法は、PandasのDataFrame()コンストラクタを使用してリストの辞書を直接DataFrameに変換することです。以下にそのサンプルコードを示します。

import pandas as pd

# リストの辞書
data = [{'name': 'Alice', 'age': 25}, {'name': 'Bob', 'age': 30}, {'name': 'Charlie', 'age': 35}]

# DataFrameに変換
df = pd.DataFrame(data)

# 結果の表示
print(df)

このコードを実行すると、以下のようなDataFrameが得られます。

      name  age
0    Alice   25
1      Bob   30
2  Charlie   35

方法2: 列指定で変換

辞書に含まれるキーが多い場合や、特定の列だけをDataFrameに含めたい場合は、列を指定してDataFrameを生成する方法が便利です。以下のコードでは、特定の列のみを指定しています。

import pandas as pd

# リストの辞書
data = [{'name': 'Alice', 'age': 25, 'job': 'Engineer'}, {'name': 'Bob', 'age': 30, 'job': 'Doctor'}, {'name': 'Charlie', 'age': 35, 'job': 'Artist'}]

# 特定の列のみを指定してDataFrameに変換
df = pd.DataFrame(data, columns=['name', 'job'])

# 結果の表示
print(df)

この方法を使用すると、以下のように指定した列のみが含まれたDataFrameが作成されます。

      name       job
0    Alice  Engineer
1      Bob    Doctor
2  Charlie    Artist

方法3: データ加工を伴う変換

データをDataFrameに変換する際に、データ加工を行いたい場合もあります。例えば、新しい列を追加したり、条件に基づいてデータを変更したりすることが可能です。以下の例では、年齢に基づいて「category」列を追加しています。

import pandas as pd

# リストの辞書
data = [{'name': 'Alice', 'age': 25}, {'name': 'Bob', 'age': 30}, {'name': 'Charlie', 'age': 35}]

# DataFrameに変換
df = pd.DataFrame(data)

# 年齢に基づいてカテゴリ列を追加
df['category'] = df['age'].apply(lambda x: 'Young' if x < 30 else 'Old')

# 結果の表示
print(df)

このコードを実行すると、以下のような結果が得られます。

      name  age category
0    Alice   25    Young
1      Bob   30      Old
2  Charlie   35      Old

まとめ

この記事では、リストの辞書をPandasのDataFrameに変換するいくつかの方法を紹介しました。直接変換、列指定での変換、データ加工を伴う変換など、用途に応じて最適な方法を選択することができます。これらの技術を駆使して、データ分析の効率を向上させましょう。

購読
通知
0 Comments
Inline Feedbacks
View all comments