더북(TheBook)

이 파이썬 예제에서 사용한 데이터셋은 데이터 여섯 개를 사용하여 진행했기 때문에 정확도(accuracy)가 낮습니다. 좀 더 정확한 데이터를 원한다면 캐글(Kaggle)에서 유사한 데이터셋을 구할 수 있으므로 내려받아 진행하길 권합니다.


캐글이란

2010년에 설립한 예측 모델 및 분석 대회 플랫폼으로 기업 및 단체에서 데이터와 해결 과제를 등록하면, 이것을 데이터 과학자들이 경쟁하면서 해결합니다.

호주인 앤서니 골드블룸은 빅데이터 전문가 수요가 급증하리라 예상하고는 2010년 캐글을 만들었는데, 2017년에 구글이 인수했습니다. 현재 세계 190여 개국 개발자 100만 명 이상이 캐글에서 문제 해결법을 찾느라 경쟁을 벌이고 있습니다. 경쟁에서 승리한 사람에게는 상금과 명예가 주어집니다.

캐글 웹 사이트(https://www.kaggle.com/)에는 초보자용 연습 데이터 및 전문가 코드들도 볼 수 있는데, 초보자부터 전문가까지 모두 사용할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.