[pandasでの列の型の変更]

PYTHON3 チュートリアル

pandasにおけるデータ型の変更方法

pandasのデータフレームでは、データの分析や加工を行う際に、列のデータ型を適切に変更することが重要です。データ型を変更することで、メモリの使用効率を向上させたり、特定のデータ操作を容易に行えるようになります。以下では、pandasを使用してデータフレーム内の特定の列のデータ型を変更するいくつかの方法を示します。

整数型から浮動小数点型への変換

整数型の列を浮動小数点型に変換することは、データに小数点以下の値が必要な場合に役立ちます。以下のサンプルコードでは、データフレームの ‘age’ 列を整数型から浮動小数点型に変更しています。

import pandas as pd

# データフレームを作成
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35]
})

# 'age' 列を浮動小数点型に変換
df['age'] = df['age'].astype(float)

# 結果を表示
print(df)

文字列型から日付型への変換

文字列型で表されている日付データを日付型に変換することで、日付としての操作が可能になります。例えば、年月日が ‘-‘ で区切られた文字列から日付型に変換する方法を以下に示します。

import pandas as pd

# データフレームを作成
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'birthday': ['1990-01-01', '1985-05-11', '1975-10-23']
})

# 'birthday' 列を日付型に変換
df['birthday'] = pd.to_datetime(df['birthday'])

# 結果を表示
print(df)

カテゴリ型への変換

データに繰り返し出現する限られた数の値がある場合、それらをカテゴリ型に変換することでメモリの使用量を減らし、処理速度を向上させることができます。以下のコードでは、’gender’ 列をカテゴリ型に変換しています。

import pandas as pd

# データフレームを作成
df = pd.DataFrame({
    'name': ['Alice', 'Bob', 'Charlie'],
    'gender': ['female', 'male', 'male']
})

# 'gender' 列をカテゴリ型に変換
df['gender'] = df['gender'].astype('category')

# 結果を表示
print(df)

これらのサンプルを通じて、pandasでデータ型を変更する方法が理解できるでしょう。データ型を適切に管理することは、データ分析の効率と正確性を高めるために非常に重要です。

購読
通知
0 Comments
Inline Feedbacks
View all comments