더북(TheBook)
df["cluster"].value_counts().head(10)

실행 결과

1     1663
5       54
4       43
10      42
3       37
7       32
0       29
31      28
2       28
27      25

 

1번 그룹에 1,663개 데이터가 있고 2번 그룹에 28개 데이터가 있다. 구체적인 데이터를 보면서 분석하는 것은 다음 절에서 MiniBatchKMeans의 성능을 실험한 후에 해 보자.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.