더북(TheBook)

LESSON 04
문자열 분리로 ‘관심강의’ 분리하기

이 댓글 이벤트에는 ‘관심강의’라는 텍스트가 있다. 대부분 관심강의 뒤에 강의명을 적었으므로 ‘관심강의’를 기준으로 이전 텍스트는 제거하고 이후 텍스트를 새로운 변수에 담는, 문자열 분리(split)로 관심강의를 분리해 보자.

실수를 방지하기 위해 "course"라는 새로운 열에 담아 진행했으며, ‘관심 강의’나 ‘관심 강좌’에 대해서도 똑같이 처리하고 특수 문자인 ‘:’는 빈 문자로 변경한다.

df["course"] = df["text"].apply(lambda x: x.split("관심강의")[-1])
df["course"] = df["course"].apply(lambda x: x.split("관심 강의")[-1])
df["course"] = df["course"].apply(lambda x: x.split("관심 강좌")[-1])
df["course"] = df["course"].str.replace(":", "")
df["course"].head()
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.