pandasを使ったデータフレームのマージ方法-merge()関数の使い方

python

概要

Pythonには、複数のデータフレームを結合するためのmerge()関数があります。

この関数を使うことで、異なる条件に合わせてデータをマージし、1つのデータフレームとして扱うことができます。

詳細内容

merge()関数は、複数のデータフレームを結合するための関数です。

この関数を用いることで、「共通のキー」を用いて、複数のデータフレームに分割されている情報を統合することができます。

以下に具体的なコード例を示します。

まず、pandasをインポートします。

python
import pandas as pd

次に2つのデータフレームを生成します。

まず、以下のような`df1`を作成しましょう。

python
df1 = pd.DataFrame({
    'key': ['A', 'B', 'C', 'D'], 
    'value1': [1, 2, 3, 4]
})

ここでは、`key`という名前の列に’A’, ‘B’, ‘C’, ‘D’という文字列を割り当て、`value1`という名前の列にそれぞれ1, 2, 3, 4という整数を割り当てています。

同様に、以下のような`df2`を作成します。

python
df2 = pd.DataFrame({
    'key': ['B', 'D', 'E', 'F'],
    'value2': [5, 6, 7, 8]
})

ここでは、`key`という名前の列に’B’, ‘D’, ‘E’, ‘F’という文字列を割り当て、`value2`という名前の列にそれぞれ5, 6, 7, 8という整数を割り当てています。

これで、`df1`と`df2`がそれぞれ以下のようになっているはずです。


# df1
  key  value1
0   A       1
1   B       2
2   C       3
3   D       4
# df2
  key  value2
0   B       5
1   D       6
2   E       7
3   F       8

そして、これら2つのデータフレームを`key`という列を共通のキーとして結合することができます。

具体的には、以下のようなコードでマージします。

python
merged_df = pd.merge(df1, df2, on='key')

`on`パラメータに共通の列の名前を指定することで、共通の列をキーとしてデータフレームを結合することができます。

結合後のデータフレームは`merged_df`という変数に格納されます。

今回の例では、キーとして’B’と’D’が共通しているため、以下のような結果になります。


  key  value1  value2
0   B       2       5
1   D       4       6

このように、merge()関数を用いることで、異なる条件で分割された複数のデータフレームを、共通のデータを持つキーを基準に統合することができます。

コメント

タイトルとURLをコピーしました