더북(TheBook)

마지막으로 두 데이터프레임의 key를 모두 모아 두 데이터프레임을 합치는 경우다. 이때 how 매개변수를 'outer'로 지정한다. 이를 FULL OUTER JOIN 또는 OUTER JOIN이라고 한다.

▲ 그림 A-21 두 데이터프레임의 OUTER JOIN

pd.merge( leftDF, rightDF, on='key', how='outer' )

참고

또는

leftDF.merge( rightDF, on='key', how='outer' )

 

결과

(value 열 이름이 중복돼 자동으로 value_x와 value_y로 변경된 점에 유의)
    key     value_x     value_y
0     A         1.0         NaN
1     B         2.0         5.0
2     C         3.0         NaN
3     D         4.0         6.0
4     E         NaN         7.0
5     F         NaN         8.0

결과를 보면 두 데이터프레임의 key 값이 모두 포함돼 있으며, 해당하는 key 값이 없는 경우 valueNaN으로 표시된다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.