더북(TheBook)

4장 데이터 조작 I: 벡터 기반 처리와 외부 데이터 처리

R에서는 주로 벡터 기반으로 데이터를 처리한다. 벡터 기반 처리는 개별 요소를 for 루프 등으로 하나씩 처리하는 방식보다 빠르게 수행될 뿐만 아니라 손쉽게 병렬화가 가능하다. 이 장에서는 이러한 벡터 기반 처리를 돕는 R의 기본 함수들을 설명할 것이다. 이러한 함수는 데이터 처리를 위한 핵심적인 함수다. 앞으로 보게 될 대부분의 R 코드에서 이 함수들을 사용하고 있을 것이다. 따라서 이 함수들의 사용법을 잘 아는 것이 R 코드를 작성하고 이해하는 데 중요한 역할을 한다.

이 장의 또 다른 주제는 외부 데이터를 처리하는 방법이다. 파일에 저장된 데이터를 메모리에 불러오거나 처리된 결과를 파일에 저장하는 일은 데이터 분석에서 필수적인 부분이다. 또한, MySQL 등과 같은 데이터베이스를 사용한 처리에 대해서도 다룬다. 데이터베이스를 활용하면 SQL에 능숙한 사용자의 경우 SQL 문으로 쉽게 데이터를 조회하고 조작할 수 있는 장점이 있다. 데이터베이스 기술은 디스크에 저장된 대량의 데이터를 고속으로 처리하는 장점이 있으므로 프로그램의 성능을 위해서도 알아둘 필요가 있다.

01  아이리스 데이터

02  파일 입출력

03  데이터 프레임의 행과 컬럼 합치기

04  apply 계열 함수

05  데이터를 그룹으로 묶은 후 함수 호출하기

06  데이터 분리 및 병합

07  데이터 정렬

08  데이터 프레임 컬럼 접근

09  조건에 맞는 데이터의 색인 찾기

10  그룹별 연산

11  편리한 처리를 위한 데이터의 재표현

12  MySQL 연동

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.