既存のDataFrameに新しい列を追加する方法

PYTHON3 チュートリアル

DataFrameに新しい列を追加する方法

以下にPythonのPandasライブラリを使用して、DataFrameに新しい列を追加する3つの方法を示します。これらの方法はデータ分析を行う際に非常に役立ちます。

方法1: 既存の列から新しい列を計算して追加

既存のデータから新しい情報を計算し、それを新しい列としてDataFrameに追加することができます。例えば、商品の価格と数量から売上を計算する場合を考えます。

import pandas as pd

# データフレームを作成
df = pd.DataFrame({
    '価格': [200, 300, 150],
    '数量': [10, 5, 8]
})

# 売上列を追加(価格 * 数量)
df['売上'] = df['価格'] * df['数量']

print(df)

方法2: 条件に基づいて新しい列を追加

条件分岐を使用して、特定の条件に基づいて新しい列の値を設定することもできます。たとえば、価格が250より高い場合は「高価」と低い場合は「安価」と分類する例です。

import pandas as pd

# データフレームを作成
df = pd.DataFrame({
    '価格': [200, 300, 150]
})

# 条件に基づいて新しい列を追加
df['価格帯'] = ['高価' if x > 250 else '安価' for x in df['価格']]

print(df)

方法3: apply関数を使用して新しい列を追加

Pandasのapply関数を利用して、各行に対して複雑な計算を行い、その結果を新しい列として追加することができます。例として、価格に応じて税込み価格を計算する場合を示します。

import pandas as pd

# データフレームを作成
df = pd.DataFrame({
    '価格': [200, 300, 150]
})

# 税込み価格を計算する関数
def calculate_tax(price):
    return price * 1.1  # 10%の税率で計算

# apply関数を使用して新しい列を追加
df['税込み価格'] = df['価格'].apply(calculate_tax)

print(df)

これらの方法を用いることで、DataFrameに柔軟に新しい列を追加し、データ分析の精度を高めることが可能です。

購読
通知
0 Comments
Inline Feedbacks
View all comments