다음은 데이터 프레임에서 위치, 이름, 인덱스로 선택하는 경우를 비교한 표입니다. 모두 동일한 결과를 출력합니다.
표 4-7 | 위치, 이름, 인덱스로 데이터 선택과 접근 비교
선택 방법 |
위치로 선택 |
이름으로 선택 |
인덱스로 선택 |
접근 수단 |
좌표 |
행과 열 이름 |
인덱스 |
1. 열을 선택 |
df[열좌표] |
df[“열이름”] |
df[인덱스] |
2. 데이터 값을 선택 |
df[ , 열좌표] |
df$열이름 |
df[[인덱스]] |
• 열을 선택 df[열좌표] = df[“열이름”] = df[인덱스]: 출력은 2차원 데이터 프레임형
그림 4-28 | 열을 선택할 때 데이터 프레임 형태로 출력
• 데이터 값을 선택 df[ , 열좌표] = df$열이름 = df[[인덱스]]: 출력은 1차원 벡터형
그림 4-29 | 데이터 값을 선택할 때 벡터 형태로 출력
다양한 선택 방법에 대한 출력 결과가 헷갈린다면, R은 데이터로 직접 접근하여 선택한 데이터 값들을 1차원 벡터 형태로 쭉 나열해서 출력한다는 것만 기억하면 됩니다.
인덱스로 데이터를 선택하는 방법을 따로 소개한 이유는 자체가 위치 선택에 포함되고, 위치나 이름을 이용한 데이터 선택 방법으로 설명하는 것보다 이해하기 어려우며, 사용 빈도 또한 상대적으로 덜하기 때문입니다. 이 책은 입문서이기 때문에 혼동을 막고자 일부러 구분하여 나중에 정리했습니다. 알아야 할 내용이 너무 많다고 느껴진다면 이 책에서 제안하는 순서와 중요도에 따라 학습하길 권장합니다.