Python 3で複数のCSVファイルをpandasにインポートし、1つのDataFrameに連結する方法
複数のCSVファイルをpandasで処理する際には、pandas.concat()
関数を使用してDataFrameを連結することができます。以下に具体的な手順とサンプルコードを示します。
手順:
- 必要なライブラリをインポートする
- CSVファイルを読み込み、それぞれのDataFrameを作成する
- 複数のDataFrameを連結する
サンプルコード:
import pandas as pd # CSVファイルを読み込んでDataFrameを作成 df1 = pd.read_csv('file1.csv') df2 = pd.read_csv('file2.csv') # 複数のDataFrameを連結 combined_df = pd.concat([df1, df2], ignore_index=True) print(combined_df)
上記のコードでは、2つのCSVファイル(file1.csvとfile2.csv)をそれぞれDataFrameに読み込み、pd.concat()
関数を使用してこれらのDataFrameを連結しています。結果として、1つの結合されたDataFrameであるcombined_df
が作成されます。
別の方法: globモジュールを使用する
複数のCSVファイルを一度に処理する場合、glob
モジュールを使用してファイル名のパターンに一致するすべてのファイルを取得し、それらを連結する方法もあります。
サンプルコード:
import pandas as pd import glob # globモジュールを使用してファイル名のパターンに一致するすべてのファイルを取得 files = glob.glob('*.csv') # 各ファイルを読み込んでDataFrameを作成し、連結 dfs = [pd.read_csv(file) for file in files] combined_df = pd.concat(dfs, ignore_index=True) print(combined_df)
このコードでは、glob.glob()
関数を使用してCSVファイルのパターンに一致するすべてのファイルを取得し、それらをリスト内包表記を使って一括してDataFrameに読み込み、連結しています。
これらの方法を使うことで、Python 3で複数のCSVファイルをpandasを使用して効率的に処理し、1つのDataFrameに連結することができます。
Python 3を使用して複数のCSVファイルをpandasライブラリにインポートし、1つのDataFrameに連結する方法は、次の手順に従います。
1. pandasライブラリをインポートします。
“`python
import pandas as pd
“`2. 複数のCSVファイルを読み込みます。例えば、`file1.csv`と`file2.csv`という2つのCSVファイルがあるとします。
“`python
df1 = pd.read_csv(‘file1.csv’)
df2 = pd.read_csv(‘file2.csv’)
“`3. 読み込んだ各DataFrameをリストに格納します。
“`python
dfs = [df1, df2]
“`4. `pd.concat()`関数を使用して、リスト内のDataFrameを1つのDataFrameに連結します。
“`python
result = pd.concat(dfs)
“`これにより、`result`に複数のCSVファイルのデータが1つのDataFrameに連結されます。