만약 특정 구분자로 나누고 싶다면 괄호 안에 구분자를 넣어 주면 된다. 예를 들어 공백이 아닌 "-" 등의 문자로 구분되어 있다면 Series.str.split("-")로 구분자를 넣어 준다.
반환값은 리스트 형태인데, 만약 데이터 프레임으로 반환받고 싶다면 expand=True를 사용하면 된다. series.str.split(expand=True)로 나누면 반환된 값을 데이터 프레임에서 색인해 활용할 수 있다.
# 어절을 나누고 데이터 프레임으로 반환받기 df_doc["문서"].str.split(expand=True)
실행 결과
|
0 |
1 |
2 |
3 |
4 |
0 |
코로나 |
상생지원금 |
문의입니다. |
None |
None |
1 |
지하철 |
운행시간 |
문의입니다. |
None |
None |
2 |
버스 |
운행시간 |
문의입니다. |
None |
None |
3 |
사회적 |
거리두기로 |
인한 |
영업시간 |
안내입니다. |
4 |
Bus |
운행시간 |
문의입니다. |
None |
None |
5 |
Taxi |
승강장 |
문의입니다. |
None |
None |