더북(TheBook)
df["len"] = df["title"].apply(lambda x : len(x)) ———— ➊,➋
df["word_count"] = df["title"].apply(lambda x : len(x.split())) ———— ➌
df["unique_word_count"] = df["title"].apply(lambda x : len(set(x.split()))) ———— ➍

파생 변수가 잘 만들어졌는지는 head()로 확인한다.

df.head()

실행 결과

 

index

title

topic_idx

topic

len

word_count

unique_word_count

0

0

인천→핀란드 항공기 결항…휴가철 여행객 분통

4.0

세계

24

5

5

1

1

실리콘밸리 넘어서겠다…구글 15조원 들여 美전역 거점화

4.0

세계

30

6

6

2

2

이란 외무 긴장완화 해결책은 미국이 경제전쟁 멈추는 것

4.0

세계

30

8

8

3

3

NYT 클린턴 측근韓기업 특수관계 조명…공과 사 맞물려종합

4.0

세계

32

7

7

4

4

시진핑 트럼프에 중미 무역협상 조속 타결 희망

4.0

세계

25

7

7

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.