더북(TheBook)

bcluster의 빈도수를 계산한다.

df["bcluster"].value_counts().head(10)

실행 결과

25    1108
0      243
3      147
9       76
7       64
38      48
1       44
47      39
27      37
22      36
Name: bcluster, dtype: int64

 

어떤 강의명이 있는지 특정 클러스터(여기서는 21번)의 값을 보자.

df.loc[df["bcluster"] == 21, "course"].value_counts().head(1)

실행 결과

데이터 분석가가 되고 싶은 현업 종사자 입니다. 2020년 목표는 파이썬을 통한 콜드/핫 데이터의 전처리 능력 습득, 데이터 유형과 목적에 맞는 머신러닝 알고리즘을 적용한 모델링 구축입니다. \n관심있는 강의는 ***의 파이썬 실전 활용입니다. 1
Name: course, dtype: int64
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.