더북(TheBook)

UNIT 03
R과 데이터 마이닝

데이터 마이닝(data mining)은 데이터(data)와 마이닝(mining) 두 단어를 조합한 단어로, 말 그대로 광산에서 금을 채굴하듯이 데이터에서 귀중한 어떤 정보를 찾아내는 것이라고 할 수 있습니다. 즉, 데이터 마이닝이란 데이터에서 의미 있는 정보들을 추출하고, 유용한 의미를 발견하여 미래에 실행 가능한 정보로 만들어 내어 의사 결정을 하는 데 이용하는 것입니다.

 

데이터 마이닝을 하려면 데이터 분석 과정을 거쳐야 하는데, 데이터 분석 과정에는 통계학을 이용하기도 합니다. 통계 분석과 데이터 마이닝, 데이터 분석 관계를 그림으로 그리면 다음과 같습니다. 의미가 일부 겹치기 때문에 때로는 데이터 마이닝과 데이터 분석을 같은 의미로 사용하기도 합니다.

 

그림 2-12 | 데이터 마이닝과 데이터 분석

 

R은 통계 분석, 데이터 마이닝, 데이터 분석에 유용합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.