마지막으로 두 데이터프레임의 key를 모두 모아 두 데이터프레임을 합치는 경우다. 이때 how 매개변수를 'outer'로 지정한다. 이를 FULL OUTER JOIN 또는 OUTER JOIN이라고 한다.

    ▲ 그림 A-21 두 데이터프레임의 OUTER JOIN

    pd.merge( leftDF, rightDF, on='key', how='outer' )

    참고

    또는

    leftDF.merge( rightDF, on='key', how='outer' )

     

    결과

    (value 열 이름이 중복돼 자동으로 value_x와 value_y로 변경된 점에 유의)
        key     value_x     value_y
    0     A         1.0         NaN
    1     B         2.0         5.0
    2     C         3.0         NaN
    3     D         4.0         6.0
    4     E         NaN         7.0
    5     F         NaN         8.0

    결과를 보면 두 데이터프레임의 key 값이 모두 포함돼 있으며, 해당하는 key 값이 없는 경우 valueNaN으로 표시된다.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.