概要
Pythonには、複数のデータフレームを結合するためのmerge()関数があります。
この関数を使うことで、異なる条件に合わせてデータをマージし、1つのデータフレームとして扱うことができます。
詳細内容
merge()関数は、複数のデータフレームを結合するための関数です。
この関数を用いることで、「共通のキー」を用いて、複数のデータフレームに分割されている情報を統合することができます。
以下に具体的なコード例を示します。
まず、pandasをインポートします。
python
import pandas as pd
次に2つのデータフレームを生成します。
まず、以下のような`df1`を作成しましょう。
python
df1 = pd.DataFrame({
'key': ['A', 'B', 'C', 'D'],
'value1': [1, 2, 3, 4]
})
ここでは、`key`という名前の列に’A’, ‘B’, ‘C’, ‘D’という文字列を割り当て、`value1`という名前の列にそれぞれ1, 2, 3, 4という整数を割り当てています。
同様に、以下のような`df2`を作成します。
python
df2 = pd.DataFrame({
'key': ['B', 'D', 'E', 'F'],
'value2': [5, 6, 7, 8]
})
ここでは、`key`という名前の列に’B’, ‘D’, ‘E’, ‘F’という文字列を割り当て、`value2`という名前の列にそれぞれ5, 6, 7, 8という整数を割り当てています。
これで、`df1`と`df2`がそれぞれ以下のようになっているはずです。
# df1
key value1
0 A 1
1 B 2
2 C 3
3 D 4
# df2
key value2
0 B 5
1 D 6
2 E 7
3 F 8
そして、これら2つのデータフレームを`key`という列を共通のキーとして結合することができます。
具体的には、以下のようなコードでマージします。
python
merged_df = pd.merge(df1, df2, on='key')
`on`パラメータに共通の列の名前を指定することで、共通の列をキーとしてデータフレームを結合することができます。
結合後のデータフレームは`merged_df`という変数に格納されます。
今回の例では、キーとして’B’と’D’が共通しているため、以下のような結果になります。
key value1 value2
0 B 2 5
1 D 4 6
このように、merge()関数を用いることで、異なる条件で分割された複数のデータフレームを、共通のデータを持つキーを基準に統合することができます。
コメント