더북(TheBook)

2.5.7 데이터 읽고 쓰기

실제 문제에서 일반적으로 데이터는 파일로 저장한다. R은 파일에서 테이블을 읽거나 파일에 데이터 프레임을 저장하는 여러 가지 함수를 제공한다. 파일에 테이블을 저장한다면 보통은 잘 구성되며, 행과 열의 배치를 지정하는 일반적인 규칙을 따른다. 대부분은 파일을 바이트 단위로 읽을 필요가 없고, read.table()이나 read.csv() 같은 함수를 호출하면 된다.

가장 대중적이면서 모든 소프트웨어에서 널리 사용하는 데이터 형식은 CSV(Comma-Separated Values)다. 이 형식은 기본적으로 서로 다른 열에 해당하는 값을 쉼표로 구분한다. 그리고 첫 번째 행은 기본적으로 헤더로 간주한다. 예를 들어 개인 정보를 담은 데이터를 다음과 같이 CSV 형식으로 표현할 수 있다.

persons.csv

Name,Gender,Age,Major
Ken,Male,24,Finance
Ashley,Female,25,Statistics
Jennifer,Female,23,Computer Science
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.