잠 깐 만 요
R에 다양한 데이터 선택 방법이 존재하는 이유
데이터를 선택할 때 다양한 방법이 다소 혼란스러워 “한 가지 방법만 있다면 헷갈리지 않을 텐데.”라고 생각하는 독자도 있을 것입니다. 그렇다면 R은 데이터를 선택하는 방법을 왜 다양하게 만들어 놓았을까요? 그것은 경우에 따라 유리한 데이터를 선택하는 방법이 다르기 때문입니다. 예를 들어 하루가 지날 때마다 데이터 위치가 증가하거나 감소하는 자동화 프로그램이 필요한 경우, 좌표나 인덱스 숫자를 사용하여 증가하거나 감소하는 형태로 프로그램을 만들면 이름으로 접근하는 것보다 훨씬 쉽게 데이터를 처리할 수 있습니다. 하지만 일반적인 상황이라면 이름으로 선택하는 것이 더 직관적이고 쉽겠지요. 이처럼 R은 다양한 상황에 대비한 대책을 이미 마련해 놓았습니다. 여러분은 상황에 맞게 적절한 방법을 선택해서 사용하면 됩니다. 가끔은 R의 이런 배려심이 과도하다고 느껴질 때도 있지만, 거꾸로 생각하면 이것이 R의 장점이기도 합니다.
NOTE
R의 데이터 프레임과 데이터베이스 테이블 비교
혹시 관계형 데이터베이스(RDBMS)와 SQL을 알고 있나요? R의 데이터 프레임은 엑셀 시트와 유사하지만, 관계형 데이터베이스의 기본 데이터 저장 구조인 테이블과도 유사합니다.
표 4-8 | R 데이터 프레임과 데이터베이스 테이블 비교
구분 |
R에서의 이름 |
DB에서의 이름 |
데이터 구조 |
데이터 프레임 |
테이블 |
행 |
관측 값 |
로우 |
열 |
변수 |
컬럼 |