더북(TheBook)

1.1.4 빅데이터에 대한 논의

 

역설적으로 빅데이터의 예측 분석 문제는 상대적으로 간단한 알고리즘으로 해결된다.2, 3 따라서 빅데이터 예측의 어려움은 사용한 알고리즘에 있는 게 아니라 컴퓨터로 빅데이터를 저장하고 실행하는 데 있다고 할 수 있다(또한, 누구나 표본 크기에 대한 젤먼의 충고를 고려하여 “내가 정말 빅데이터를 갖고 있는가?”를 자문해야 한다).

더 어려운 분석 문제는 미디엄 데이터(medium data)이며, 특히 성가신 건 아주 작은 스몰 데이터(small data)다. 젤먼의 주장대로 만일 데이터가 많아 빅데이터 문제를 쉽게 해결할 수 있다면 이제는 크지 않은 데이터셋에 좀 더 관심을 기울여야 한다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.