概要
dropna()は、pandasライブラリで提供される関数であり、データフレームまたはシリーズ内の欠損値(NaN)を取り除くために使用されます。
この関数を使用することで、欠損値のある行や列を削除し、欠損値を含まないデータを取得することができます。
以下に具体的な使用例を示します。
詳細内容
以下のように、dropna()関数を使用してデータフレーム内の欠損値を削除するコードを示します。
import pandas as pd# サンプルのデータフレームを作成
data = {'A': [1, 2, None, 4],
'B': [5, None, 7, 8],
'C': [9, 10, 11, None]}
df = pd.DataFrame(data)# 欠損値の削除前のデータフレームを表示
print("=== 欠損値の削除前 ===")
print(df)# 欠損値の削除を行う
df_dropped = df.dropna()# 欠損値の削除後のデータフレームを表示
print("=== 欠損値の削除後 ===")
print(df_dropped)
実行すると、以下の結果が得られます。
=== 欠損値の削除前 ===
A B C
0 1.0 5.0 9.0
1 2.0 NaN 10.0
2 NaN 7.0 11.0
3 4.0 8.0 NaN
=== 欠損値の削除後 ===
A B C
0 1.0 5.0 9.0
このコードでは、まずpandasライブラリをインポートします。
次に、サンプルのデータを含むデータフレームを作成します。
データフレームには、’A’列、’B’列、’C’列の3つの列があります。
‘A’列と’B’列には欠損値が含まれています。
その後、dropna()関数を使用して欠損値を削除し、結果を新しいデータフレームであるdf_droppedに代入します。
最後に、元のデータフレームと欠損値を削除した後のデータフレームを表示します。
欠損値を削除した結果、df_droppedには欠損値を含まない行のみが残っており、元のデータフレームから欠損値のある行は削除されています。
コメント