df["cluster"].value_counts().head(10)

    실행 결과

    1     1663
    5       54
    4       43
    10      42
    3       37
    7       32
    0       29
    31      28
    2       28
    27      25

     

    1번 그룹에 1,663개 데이터가 있고 2번 그룹에 28개 데이터가 있다. 구체적인 데이터를 보면서 분석하는 것은 다음 절에서 MiniBatchKMeans의 성능을 실험한 후에 해 보자.

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.