더북(TheBook)

빈도수로 정렬하면 댓글에서 어떤 강의를 가장 많이 언급했는지 확인할 수 있다.

df_course = df_course.sort_values(by="freq", ascending=False)
df_course.head(8)

실행 결과

 

course

freq

course_find

319

nodebird sns 만들기

60

nodebird sns 만들기

1094

스프링 데이터 jpa

59

스프링 데이터 jpa

885

리액트로 nodebird sns 만들기

49

리액트로 nodebird sns 만들기

1761

파이썬 머신러닝 완벽

49

파이썬 머신러닝 완벽

906

머신러닝 완벽 가이드

49

머신러닝 완벽 가이드

884

리액트로 nodebird sns

49

리액트로 nodebird sns

1891

프로그래밍과 자바스크립트 es6

48

프로그래밍과 자바스크립트 es6

1762

파이썬 머신러닝 완벽 가이드

48

파이썬 머신러닝 완벽 가이드

 

전처리가 다 되었다면 csv 형태로 저장할 수 있다.

df_course.to_csv("event-course-name-freq.csv")
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.