더북(TheBook)

2.12 ‘split’을 활용한 입력 값 쪼개기

입력받은 문자를 다루는 가장 흔한 프로그래밍 작업은 토큰화(tokenizing)이다. 즉, 입력받은 문장을 각 단어, 구, 숫자로 분리하는 것이다. 파이썬 split 메서드는 이 토큰화 작업을 쉽고 편리하게 해 준다.

입력_문자열.split(구분_문자열=None)

이 메서드가 호출되면 ‘입력_문자열’의 부분 문자열로 이루어진 리스트를 반환한다. ‘구분_문자열’은 단어를 쪼개는 기준인 구분자로 동작한다.

‘구분_문자열’이 생략되거나 None이 설정되면 공백 문자(빈칸, 탭, 개행 문자)를 기준으로 토큰을 구분한다.

가령 기본 구분자로 빈칸을 사용하는 split 메서드는 여러 이름을 쪼개는 데 사용할 수 있다.

stooge_list = 'Moe Larry Curly Shemp'.split()

반환되는 리스트는 다음과 같다.

['Moe', 'Larry', 'Curly', 'Shemp']
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.