조인은 관계형 데이터베이스에서 많이 쓰는 기법인데, 조인 기법을 사용하면 한 개 이상의 테이블과 테이블을 서로 연결하여 다른 테이블에 담겨 있는 다양한 정보를 조작할 수 있습니다. 주요 조인의 종류를 정리하면 다음 표와 같습니다.
표 7-1 | 주요 조인의 종류
조인 |
설명 |
|
이너 조인 |
조인 조건이 정확히 일치하는 경우 결과 출력(동등 조인) |
|
아웃터 조인 |
레프트 조인 |
조인 조건이 정확히 일치하지 않아도 결과 출력(왼쪽 기준 모두 출력) |
라이트 조인 |
조인 조건이 정확히 일치하지 않아도 결과 출력(오른쪽 기준 모두 출력) |
|
풀 조인 |
가능한 모든 행 조인(레프트 조인+라이트 조인) |
조인 기법은 dplyr 패키지에서도 사용할 수 있습니다. 먼저 이너 조인 기법을 사용하는 inner_join() 함수부터 알아보겠습니다. inner_join() 함수는 데이터 값이 일치할 때만 연결하는 이너 조인(inner join)9을 사용합니다.
그림 7-20 | 이너 조인 원리
9 내부 조인, 동등 조인(equi-join)이라고도 합니다.