마지막으로 두 데이터프레임의 key를 모두 모아 두 데이터프레임을 합치는 경우다. 이때 how 매개변수를 'outer'로 지정한다. 이를 FULL OUTER JOIN 또는 OUTER JOIN이라고 한다.
▲ 그림 A-21 두 데이터프레임의 OUTER JOIN
pd.merge( leftDF, rightDF, on='key', how='outer' )
참고
또는
leftDF.merge( rightDF, on='key', how='outer' )
결과
(value 열 이름이 중복돼 자동으로 value_x와 value_y로 변경된 점에 유의) key value_x value_y 0 A 1.0 NaN 1 B 2.0 5.0 2 C 3.0 NaN 3 D 4.0 6.0 4 E NaN 7.0 5 F NaN 8.0
결과를 보면 두 데이터프레임의 key 값이 모두 포함돼 있으며, 해당하는 key 값이 없는 경우 value는 NaN으로 표시된다.