「データフレーム内の欠損値を削除する方法(具体例付き)」

python

概要

dropna()は、pandasライブラリで提供される関数であり、データフレームまたはシリーズ内の欠損値(NaN)を取り除くために使用されます。

この関数を使用することで、欠損値のある行や列を削除し、欠損値を含まないデータを取得することができます。

以下に具体的な使用例を示します。

詳細内容

以下のように、dropna()関数を使用してデータフレーム内の欠損値を削除するコードを示します。

import pandas as pd# サンプルのデータフレームを作成
data = {'A': [1, 2, None, 4],
        'B': [5, None, 7, 8],
        'C': [9, 10, 11, None]}
df = pd.DataFrame(data)# 欠損値の削除前のデータフレームを表示
print("=== 欠損値の削除前 ===")
print(df)# 欠損値の削除を行う
df_dropped = df.dropna()# 欠損値の削除後のデータフレームを表示
print("=== 欠損値の削除後 ===")
print(df_dropped)

実行すると、以下の結果が得られます。

=== 欠損値の削除前 ===
     A    B     C
0  1.0  5.0   9.0
1  2.0  NaN  10.0
2  NaN  7.0  11.0
3  4.0  8.0   NaN
=== 欠損値の削除後 ===
     A    B    C
0  1.0  5.0  9.0

このコードでは、まずpandasライブラリをインポートします。

次に、サンプルのデータを含むデータフレームを作成します。

データフレームには、’A’列、’B’列、’C’列の3つの列があります。

‘A’列と’B’列には欠損値が含まれています。

その後、dropna()関数を使用して欠損値を削除し、結果を新しいデータフレームであるdf_droppedに代入します。

最後に、元のデータフレームと欠損値を削除した後のデータフレームを表示します。

欠損値を削除した結果、df_droppedには欠損値を含まない行のみが残っており、元のデータフレームから欠損値のある行は削除されています。

コメント

タイトルとURLをコピーしました