더북(TheBook)

이번에는 leftDF 데이터프레임을 기준으로 합치는 것이다. 이때 how 매개변수를 'left'로 지정해보자. 이를 LEFT OUTER JOIN 또는 LEFT JOIN이라고 한다. leftDF 데이터프레임의 key 값 중 ACrightDF 데이터프레임에 없다는 점을 유의하면서 결과를 살펴보자.

▲ 그림 A-19 두 데이터프레임의 LEFT JOIN

pd.merge( leftDF, rightDF, on='key', how='left' )

참고

또는

leftDF.merge( rightDF, on='key', how='left' )

 

결과

(value 열 이름이 중복돼 자동으로 value_x와 value_y로 변경된 점에 유의)
    key     value_x     value_y
0     A           1         NaN
1     B           2         5.0
2     C           3         NaN
3     D           4         6.0

rightDF 데이터프레임의 keyAC가 없으므로 데이터가 존재하지 않는다는 의미로 NaN으로 표시된다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.