➊ 중복을 제거하기 위해 강의명에서 지식공유자의 이름(***)을 빈 문자열로 변경한다.
➋ lambda 식을 사용해서 강의명을 x.split()으로 나눈 다음 [:4], 즉 앞에서 4개까지만 텍스트를 가져오고 다시 join으로 합친다. 중복된 텍스트를 구분해서 보기 위해서다.
➌ 빈도수를 기준으로 내림차순으로 10개를 미리 보기로 확인한다.
df_freq_T["course_find"] = df_freq_T["course"].str.replace("박조은", "") ————➊ df_freq_T["course_find"] = df_freq_T["course_find"].apply(lambda x : " ". join(x.split()[:4])) ————➋ df_freq_T.sort_values(["course_find", "freq"], ascending=False).head(10) ————➌
실행 결과
|
course |
freq |
course_find |
1999 |
활용한 파이썬 프로그래밍 |
2 |
활용한 파이썬 프로그래밍 |
1998 |
활용한 메신져 만들기 android |
2 |
활용한 메신져 만들기 android |
1997 |
활용한 메신져 만들기 |
2 |
활용한 메신져 만들기 |
1996 |
활용한 리액트 native 개발 |
8 |
활용한 리액트 native 개발 |
1995 |
활용한 리액트 native |
8 |
활용한 리액트 native |
1994 |
활용한 데이터분석과 it보안 |
2 |
활용한 데이터분석과 it보안 |
1992 |
활용한 다양한 자동화 어플리케이션 |
13 |
활용한 다양한 자동화 어플리케이션 |
1993 |
활용한 다양한 자동화 어플리케이션 제작하기 |
12 |
활용한 다양한 자동화 어플리케이션 |
1991 |
활용한 다양한 자동화 |
13 |
활용한 다양한 자동화 |
1989 |
활용2 api 개발과 성능 |
16 |
활용2 api 개발과 성능 |