더북(TheBook)

5장 데이터 조작 II: 데이터 처리 및 가공

기계 학습 또는 데이터 마이닝 프로젝트에서 모델을 만드는 데 소요되는 시간은 전체 프로젝트의 14% 정도에 해당하며, 오히려 그 외의 작업(데이터 수집, 전처리 및 후처리)에 더 긴 시간이 소요된다.[1] 또 데이터 분석 모델을 R 코드로 작성하다 보면 데이터를 원하는 형태로 변환해야 하는 필요가 수도 없이 발생한다. 따라서 데이터를 원하는 형태로 바꾸거나 조작하는 능력은 R을 사용할 때 절대적으로 중요하다.

01  데이터 처리 및 가공 패키지

02  SQL을 사용한 데이터 처리

03  분할, 적용, 재조합을 통한 데이터 분석

04  데이터 구조의 변형과 요약

05  데이터 테이블: 더 빠르고 편리한 데이터 프레임

06  더 나은 반복문

07  병렬 처리

08  유닛 테스팅과 디버깅

09  코드 수행 시간 측정

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.