빈도수로 정렬하면 댓글에서 어떤 강의를 가장 많이 언급했는지 확인할 수 있다.

    df_course = df_course.sort_values(by="freq", ascending=False)
    df_course.head(8)

    실행 결과

     

    course

    freq

    course_find

    319

    nodebird sns 만들기

    60

    nodebird sns 만들기

    1094

    스프링 데이터 jpa

    59

    스프링 데이터 jpa

    885

    리액트로 nodebird sns 만들기

    49

    리액트로 nodebird sns 만들기

    1761

    파이썬 머신러닝 완벽

    49

    파이썬 머신러닝 완벽

    906

    머신러닝 완벽 가이드

    49

    머신러닝 완벽 가이드

    884

    리액트로 nodebird sns

    49

    리액트로 nodebird sns

    1891

    프로그래밍과 자바스크립트 es6

    48

    프로그래밍과 자바스크립트 es6

    1762

    파이썬 머신러닝 완벽 가이드

    48

    파이썬 머신러닝 완벽 가이드

     

    전처리가 다 되었다면 csv 형태로 저장할 수 있다.

    df_course.to_csv("event-course-name-freq.csv")
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.