결과를 보면 두 번 이상 나오는 것들이 있다(nodebird sns, 머신러닝 완벽 등). 앞에서 ngram_range로 3 이상을 가져오도록 했기 때문에 중복이 생긴 것이다. 이 중복을 처리해 주자. ["course", "freq"]라는 열의 이름을 주어 위에서 만든 데이터 프레임을 변환한다.
df_freq_T = df_freq.T.reset_index() df_freq_T.columns = ["course", "freq"] df_freq_T.head()
실행 결과
|
course |
freq |
0 |
12개 만들면서 배우는 |
2 |
1 |
12개 만들면서 배우는 ios |
2 |
2 |
12개 만들면서 배우는 ios 아이폰 |
2 |
3 |
12개 만들면서 배우는 ios 아이폰 개발 |
2 |
4 |
12개를 만들며 배우는 |
2 |