더북(TheBook)
p = r'.*(돌봄|육아|초등|보육).*'
care = df[df['title'].str.match(p) |
           df['content'].str.match(p, flags=re.MULTILINE)]
care.shape

실행 결과

(14960, 7)

 

head(2)로 미리 보기를 해서 데이터가 잘 들어왔는지 확인한다.

care.head(2)

실행 결과

article_id

start

end

answered

votes

category

title

content

24

2017-08-19

2017-08-26

0

53

일자리

공공기관 무조건적인 정규직전환을 반대합니다.

현정부에서 정규직 일자리를 늘리는 것에 찬성합니다. 그런데 공공기관 비정규직들은 인...

36

2017-08-19

2017-08-26

0

1

인권/성평등

한국채식인구 100만명. 학교 급식 및 군대에서 현미채식 선택권을 보장해주십시오!

문재인 대통령님과 각 정부 인사분들께 마음속 깊이 존경과 감사를 표합니다. 대한민국...

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.