LESSON OT
들어가며
이 장에서는 댓글을 군집화해 분석해 볼 것이다. 댓글 분석은 왜 필요할까? 분석해서 어디에 활용할 수 있을까? 다음과 같은 상황을 생각해 보자.
• 수백 수천 개 댓글을 다 읽어야 한다면?
• 댓글 속에 제품에 대한 관심을 빈도수로 추출해야 한다면?
• 쇼핑몰에서 제품 관련 이벤트를 진행할 때 고객이 어떤 제품을 선호하는지 알고 싶다면?
• 고객 DB와 연계해 이벤트나 마케팅 세그먼트로 활용한다면?
• 향후 마케팅이나 전략을 세울 때 활용한다면?
데이터는 IT 교육 사이트인 (주)인프런1의 새해 다짐 이벤트 댓글을 사용한다. 이 장에서는 정답 레이블이 없는 데이터를 분류하고 시각화하는 방법에 초점을 맞출 것이다. 앞에서 살펴본 정답 레이블이 있는 학습 방법을 ‘지도학습’, 이 장에서 살펴볼 정답 레이블이 없는 학습 방법을 ‘비지도학습’으로 분류한다. 각 학습 방법에는 크게 다음과 같은 분석 방법이 있으며, 여기서는 군집화를 실습해 볼 것이다.