Python 3でpandas DataFrameをCSVファイルに書き込む

PYTHON3 チュートリアル

Pythonとpandasを用いたCSVファイルへのデータ書き込み方法

Pythonのデータサイエンス分野において、pandasライブラリはデータの操作や分析を行う上で非常に重要なツールです。この記事では、pandasのDataFrameオブジェクトをCSVファイルに書き込む基本的な方法を説明します。具体的なサンプルコードとともに、いくつかの異なるシナリオを取り上げ、それぞれのコードの出力結果についても説明します。

基本的なCSV書き込み

まずは最も基本的なDataFrameからCSVへの書き込み方法から見ていきましょう。以下のサンプルコードは、簡単なデータフレームを作成し、それを’example.csv’という名前のファイルに書き込みます。

import pandas as pd

# データフレームの作成
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 22, 34, 42],
        'City': ['New York', 'Paris', 'Berlin', 'London']}
df = pd.DataFrame(data)

# CSVファイルへ書き込み
df.to_csv('example.csv', index=False)

上記のコードでは、index=Falseパラメータを指定しています。これはDataFrameのインデックスをCSVファイルに書き込まないようにするためです。生成されるCSVファイルには、ヘッダーとして列名が最初の行に書き込まれ、その後にデータが続きます。

特定の列のみを書き込む

次に、DataFrameの特定の列だけを選択してCSVファイルに書き込む方法を見ていきます。これは、不要なデータを排除してファイルサイズを節約する場合に便利です。

# 特定の列のみをCSVに書き込む
df.to_csv('selected_columns.csv', columns=['Name', 'Age'], index=False)

ここでは、’Name’と’Age’の2つの列のみを’selected_columns.csv’ファイルに書き込んでいます。columnsパラメータに列名のリストを渡すことで、書き込みたい列を指定できます。

日本語を含むデータの扱い

日本語を含むデータをCSVファイルに書き込む場合は、適切な文字コードを指定することが重要です。一般的には’utf-8’を使用しますが、場合によっては’utf-8-sig’や’shift_jis’を使用することもあります。

# 日本語を含むデータフレームの作成
data_jp = {'名前': ['山田', '佐藤', '鈴木', '高橋'],
           '年齢': [25, 30, 45, 20],
           '都市': ['東京', '大阪', '名古屋', '福岡']}
df_jp = pd.DataFrame(data_jp)

# CSVファイルへ書き込み、文字コードを指定
df_jp.to_csv('example_jp.csv', encoding='utf-8', index=False)

このコードでは、日本語のヘッダーとデータを含むDataFrameを作成し、’utf-8’を指定してCSVファイルに書き込んでいます。これにより、日本語の文字化けを防ぐことができます。

以上の方法を用いることで、Pythonとpandasを活用して様々なデータを効率的にCSVファイルに書き込むことが可能です。データの保存や他のプログラムでの利用に役立ててください。

購読
通知
0 Comments
Inline Feedbacks
View all comments