2 str 접근자로 문자열 다루기
이 절에서는 판다스로 문자열을 다룰 때 편리하게 사용할 수 있는 str 접근자에 대해 알아보고, 실제로 문자열 전처리에 사용되는 기능을 사용해 본다.
◼︎ str 접근자란?
데이터 프레임에서 행이나 열을 인덱싱하면 시리즈 형태로 반환된다. 판다스의 시리즈는 데이터 타입별 접근자(Accessor)에서 특정 메서드를 제공한다. 이들은 특정 데이터 유형에만 적용되는 시리즈 내 별도 네임스페이스로 시간, 기간, 문자열, 범주형, 희소 행렬 등에 사용된다. 문자열에 해당하는 네임스페이스는 Series.str이다.
표 3-3 | 데이터 타입별 접근자
|
데이터 타입 |
접근자 |
시간, 기간 |
Datetime, Timedelta, Period |
dt |
문자열 |
String |
str |
범주형 |
Categorical |
cat |
희소값 |
Sparse |
sparse |