DataFrameに新しい列を追加する方法
以下にPythonのPandasライブラリを使用して、DataFrameに新しい列を追加する3つの方法を示します。これらの方法はデータ分析を行う際に非常に役立ちます。
方法1: 既存の列から新しい列を計算して追加
既存のデータから新しい情報を計算し、それを新しい列としてDataFrameに追加することができます。例えば、商品の価格と数量から売上を計算する場合を考えます。
import pandas as pd # データフレームを作成 df = pd.DataFrame({ '価格': [200, 300, 150], '数量': [10, 5, 8] }) # 売上列を追加(価格 * 数量) df['売上'] = df['価格'] * df['数量'] print(df)
方法2: 条件に基づいて新しい列を追加
条件分岐を使用して、特定の条件に基づいて新しい列の値を設定することもできます。たとえば、価格が250より高い場合は「高価」と低い場合は「安価」と分類する例です。
import pandas as pd # データフレームを作成 df = pd.DataFrame({ '価格': [200, 300, 150] }) # 条件に基づいて新しい列を追加 df['価格帯'] = ['高価' if x > 250 else '安価' for x in df['価格']] print(df)
方法3: apply関数を使用して新しい列を追加
Pandasのapply関数を利用して、各行に対して複雑な計算を行い、その結果を新しい列として追加することができます。例として、価格に応じて税込み価格を計算する場合を示します。
import pandas as pd # データフレームを作成 df = pd.DataFrame({ '価格': [200, 300, 150] }) # 税込み価格を計算する関数 def calculate_tax(price): return price * 1.1 # 10%の税率で計算 # apply関数を使用して新しい列を追加 df['税込み価格'] = df['価格'].apply(calculate_tax) print(df)
これらの方法を用いることで、DataFrameに柔軟に新しい列を追加し、データ分析の精度を高めることが可能です。