True/False가 아닌 문자가 들어 있는 행을 출력할 수도 있다. 데이터 프레임으로 다시 한번 감싸 주면 해당 데이터만 가져온다.
• df_doc[df_doc["문서"].str.contains("찾으려는 문자")]
다음 코드를 보면 df_doc 안을 다시 감싸는 방식을 사용했다.
# 특정 문자가 들어간 텍스트를 찾아 # 데이터 프레임으로 다시 감싸 주면 해당 데이터만 가져온다. df_doc[df_doc["문서"].str.contains("버스")]
실행 결과
|
문서 |
2 |
버스 운행시간 문의입니다. |
참고로 문자를 찾을 때 내부에 정규표현식을 함께 사용할 수도 있다. "버스"를 입력하면 "버스"가 들어간 데이터만 가져오지만 "버스|지하철"을 입력하면 "버스" 또는 "지하철"이 들어간 데이터를 모두 찾아온다. "버스|지하철" 문자 사이에 있는 | 연산자가 OR 조건을 의미하기 때문이다(| 키는 Enter 키 위에 있다). 마찬가지로 & 연산자를 사용하면 AND 조건으로 데이터를 찾을 수 있다.