더북(TheBook)

중복을 제거하기 위해 강의명에서 지식공유자의 이름(***)을 빈 문자열로 변경한다.

lambda 식을 사용해서 강의명을 x.split()으로 나눈 다음 [:4], 즉 앞에서 4개까지만 텍스트를 가져오고 다시 join으로 합친다. 중복된 텍스트를 구분해서 보기 위해서다.

빈도수를 기준으로 내림차순으로 10개를 미리 보기로 확인한다.

df_freq_T["course_find"] = df_freq_T["course"].str.replace("박조은", "") ————
df_freq_T["course_find"] = df_freq_T["course_find"].apply(lambda x : " ". join(x.split()[:4])) ————
df_freq_T.sort_values(["course_find", "freq"], ascending=False).head(10) ————

실행 결과

 

course

freq

course_find

1999

활용한 파이썬 프로그래밍

2

활용한 파이썬 프로그래밍

1998

활용한 메신져 만들기 android

2

활용한 메신져 만들기 android

1997

활용한 메신져 만들기

2

활용한 메신져 만들기

1996

활용한 리액트 native 개발

8

활용한 리액트 native 개발

1995

활용한 리액트 native

8

활용한 리액트 native

1994

활용한 데이터분석과 it보안

2

활용한 데이터분석과 it보안

1992

활용한 다양한 자동화 어플리케이션

13

활용한 다양한 자동화 어플리케이션

1993

활용한 다양한 자동화 어플리케이션 제작하기

12

활용한 다양한 자동화 어플리케이션

1991

활용한 다양한 자동화

13

활용한 다양한 자동화

1989

활용2 api 개발과 성능

16

활용2 api 개발과 성능

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.