Python 3で複数のCSVファイルをpandasにインポートし、1つのDataFrameに連結する方法
複数のCSVファイルをpandasで処理する際には、pandas.concat()関数を使用してDataFrameを連結することができます。以下に具体的な手順とサンプルコードを示します。
手順:
- 必要なライブラリをインポートする
- CSVファイルを読み込み、それぞれのDataFrameを作成する
- 複数のDataFrameを連結する
サンプルコード:
import pandas as pd
# CSVファイルを読み込んでDataFrameを作成
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 複数のDataFrameを連結
combined_df = pd.concat([df1, df2], ignore_index=True)
print(combined_df)
上記のコードでは、2つのCSVファイル(file1.csvとfile2.csv)をそれぞれDataFrameに読み込み、pd.concat()関数を使用してこれらのDataFrameを連結しています。結果として、1つの結合されたDataFrameであるcombined_dfが作成されます。
別の方法: globモジュールを使用する
複数のCSVファイルを一度に処理する場合、globモジュールを使用してファイル名のパターンに一致するすべてのファイルを取得し、それらを連結する方法もあります。
サンプルコード:
import pandas as pd
import glob
# globモジュールを使用してファイル名のパターンに一致するすべてのファイルを取得
files = glob.glob('*.csv')
# 各ファイルを読み込んでDataFrameを作成し、連結
dfs = [pd.read_csv(file) for file in files]
combined_df = pd.concat(dfs, ignore_index=True)
print(combined_df)
このコードでは、glob.glob()関数を使用してCSVファイルのパターンに一致するすべてのファイルを取得し、それらをリスト内包表記を使って一括してDataFrameに読み込み、連結しています。
これらの方法を使うことで、Python 3で複数のCSVファイルをpandasを使用して効率的に処理し、1つのDataFrameに連結することができます。
Python 3を使用して複数のCSVファイルをpandasライブラリにインポートし、1つのDataFrameに連結する方法は、次の手順に従います。
1. pandasライブラリをインポートします。
“`python
import pandas as pd
“`2. 複数のCSVファイルを読み込みます。例えば、`file1.csv`と`file2.csv`という2つのCSVファイルがあるとします。
“`python
df1 = pd.read_csv(‘file1.csv’)
df2 = pd.read_csv(‘file2.csv’)
“`3. 読み込んだ各DataFrameをリストに格納します。
“`python
dfs = [df1, df2]
“`4. `pd.concat()`関数を使用して、リスト内のDataFrameを1つのDataFrameに連結します。
“`python
result = pd.concat(dfs)
“`これにより、`result`に複数のCSVファイルのデータが1つのDataFrameに連結されます。
