더북(TheBook)

True/False가 아닌 문자가 들어 있는 행을 출력할 수도 있다. 데이터 프레임으로 다시 한번 감싸 주면 해당 데이터만 가져온다.

 

df_doc[df_doc["문서"].str.contains("찾으려는 문자")]

 

다음 코드를 보면 df_doc 안을 다시 감싸는 방식을 사용했다.

# 특정 문자가 들어간 텍스트를 찾아
# 데이터 프레임으로 다시 감싸 주면 해당 데이터만 가져온다.
df_doc[df_doc["문서"].str.contains("버스")]

실행 결과

 

문서

2

버스 운행시간 문의입니다.

 

참고로 문자를 찾을 때 내부에 정규표현식을 함께 사용할 수도 있다. "버스"를 입력하면 "버스"가 들어간 데이터만 가져오지만 "버스|지하철"을 입력하면 "버스" 또는 "지하철"이 들어간 데이터를 모두 찾아온다. "버스|지하철" 문자 사이에 있는 | 연산자가 OR 조건을 의미하기 때문이다(| 키는 Enter 키 위에 있다). 마찬가지로 & 연산자를 사용하면 AND 조건으로 데이터를 찾을 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.