모두의 한국어 텍스트 분석 with 파이썬: LESSON 05 벡터화하기

결과를 보면 두 번 이상 나오는 것들이 있다(nodebird sns, 머신러닝 완벽 등). 앞에서 ngram_range로 3 이상을 가져오도록 했기 때문에 중복이 생긴 것이다. 이 중복을 처리해 주자. ["course", "freq"]라는 열의 이름을 주어 위에서 만든 데이터 프레임을 변환한다.

df_freq_T = df_freq.T.reset_index()
df_freq_T.columns = ["course", "freq"]
df_freq_T.head()

실행 결과

	course	freq
0	12개 만들면서 배우는	2
1	12개 만들면서 배우는 ios	2
2	12개 만들면서 배우는 ios 아이폰	2
3	12개 만들면서 배우는 ios 아이폰 개발	2
4	12개를 만들며 배우는	2

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.