더북(TheBook)

결과를 보면 두 번 이상 나오는 것들이 있다(nodebird sns, 머신러닝 완벽 등). 앞에서 ngram_range로 3 이상을 가져오도록 했기 때문에 중복이 생긴 것이다. 이 중복을 처리해 주자. ["course", "freq"]라는 열의 이름을 주어 위에서 만든 데이터 프레임을 변환한다.

df_freq_T = df_freq.T.reset_index()
df_freq_T.columns = ["course", "freq"]
df_freq_T.head()

실행 결과

 

course

freq

0

12개 만들면서 배우는

2

1

12개 만들면서 배우는 ios

2

2

12개 만들면서 배우는 ios 아이폰

2

3

12개 만들면서 배우는 ios 아이폰 개발

2

4

12개를 만들며 배우는

2

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.