빈도수로 정렬하면 댓글에서 어떤 강의를 가장 많이 언급했는지 확인할 수 있다.
df_course = df_course.sort_values(by="freq", ascending=False) df_course.head(8)
실행 결과
|
course |
freq |
course_find |
319 |
nodebird sns 만들기 |
60 |
nodebird sns 만들기 |
1094 |
스프링 데이터 jpa |
59 |
스프링 데이터 jpa |
885 |
리액트로 nodebird sns 만들기 |
49 |
리액트로 nodebird sns 만들기 |
1761 |
파이썬 머신러닝 완벽 |
49 |
파이썬 머신러닝 완벽 |
906 |
머신러닝 완벽 가이드 |
49 |
머신러닝 완벽 가이드 |
884 |
리액트로 nodebird sns |
49 |
리액트로 nodebird sns |
1891 |
프로그래밍과 자바스크립트 es6 |
48 |
프로그래밍과 자바스크립트 es6 |
1762 |
파이썬 머신러닝 완벽 가이드 |
48 |
파이썬 머신러닝 완벽 가이드 |
전처리가 다 되었다면 csv 형태로 저장할 수 있다.
df_course.to_csv("event-course-name-freq.csv")