Python 3でSQLのように’in’と’not in’を使用してPandasデータフレームをフィルタリングする方法

PYTHON3 チュートリアル

Python 3でPandasデータフレームをフィルタリングする方法: ‘in’と’not in’の使用

PythonのPandasライブラリを使用してデータフレームをフィルタリングする際に、’in’と’not in’演算子を使うことができます。これらの演算子は、データフレーム内の特定の値や条件に一致する行を抽出するのに便利です。

‘in’演算子を使用したフィルタリング

‘in’演算子を使用すると、指定したリストやシーケンスに含まれる値を持つ行を抽出することができます。以下は、’in’演算子を使用してデータフレームをフィルタリングする例です。

import pandas as pd

data = {'A': [1, 2, 3, 4, 5],
        'B': ['apple', 'banana', 'orange', 'apple', 'grape']}
df = pd.DataFrame(data)

filtered_df = df[df['B'].isin(['apple', 'orange'])]
print(filtered_df)

上記のコードでは、’B’列の値が’apple’または’orange’である行を抽出しています。

‘not in’演算子を使用したフィルタリング

‘not in’演算子を使用すると、指定したリストやシーケンスに含まれない値を持つ行を抽出することができます。以下は、’not in’演算子を使用してデータフレームをフィルタリングする例です。

filtered_df = df[~df['B'].isin(['apple', 'orange'])]
print(filtered_df)

上記のコードでは、’B’列の値が’apple’または’orange’でない行を抽出しています。

その他のフィルタリング方法

他にも、Pandasではさまざまな方法でデータフレームをフィルタリングすることができます。例えば、条件式を組み合わせて複雑なフィルタリングを行うことも可能です。

以上が、Python 3でPandasデータフレームをフィルタリングする際に’ in’と’not in’演算子を使用する方法についての説明でした。これらの演算子を使うことで、データの抽出や処理を効率的に行うことができます。

Python 3でSQLのように’in’と’not in’を使用してPandasデータフレームをフィルタリングする方法は、Pandasのデータフレームを特定の条件に基づいてフィルタリングするための便利な手法です。

例えば、Pandasのデータフレームdfがあるとします。このデータフレームから特定の値を持つ行を抽出したい場合、’in’および’not in’演算子を使用することができます。

例えば、次のようにして、特定の値を持つ行を抽出できます。

“`python
filtered_df = df[df[‘column_name’].isin([‘value1’, ‘value2’])]
“`

このコードは、’column_name’列の値が’value1’または’value2’である行を抽出します。同様に、’not in’演算子を使用して特定の値を持たない行を抽出することもできます。

“`python
filtered_df = df[~df[‘column_name’].isin([‘value1’, ‘value2’])]
“`

このコードは、’column_name’列の値が’value1’または’value2’でない行を抽出します。これにより、PandasデータフレームをSQLのように簡単にフィルタリングすることができます。

購読
通知
0 Comments
Inline Feedbacks
View all comments