이번에는 leftDF 데이터프레임을 기준으로 합치는 것이다. 이때 how 매개변수를 'left'로 지정해보자. 이를 LEFT OUTER JOIN 또는 LEFT JOIN이라고 한다. leftDF 데이터프레임의 key 값 중 ACrightDF 데이터프레임에 없다는 점을 유의하면서 결과를 살펴보자.

    ▲ 그림 A-19 두 데이터프레임의 LEFT JOIN

    pd.merge( leftDF, rightDF, on='key', how='left' )

    참고

    또는

    leftDF.merge( rightDF, on='key', how='left' )

     

    결과

    (value 열 이름이 중복돼 자동으로 value_x와 value_y로 변경된 점에 유의)
        key     value_x     value_y
    0     A           1         NaN
    1     B           2         5.0
    2     C           3         NaN
    3     D           4         6.0

    rightDF 데이터프레임의 keyAC가 없으므로 데이터가 존재하지 않는다는 의미로 NaN으로 표시된다.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.