2.12 ‘split’을 활용한 입력 값 쪼개기
입력받은 문자를 다루는 가장 흔한 프로그래밍 작업은 토큰화(tokenizing)이다. 즉, 입력받은 문장을 각 단어, 구, 숫자로 분리하는 것이다. 파이썬 split 메서드는 이 토큰화 작업을 쉽고 편리하게 해 준다.
입력_문자열.split(구분_문자열=None)
이 메서드가 호출되면 ‘입력_문자열’의 부분 문자열로 이루어진 리스트를 반환한다. ‘구분_문자열’은 단어를 쪼개는 기준인 구분자로 동작한다.
‘구분_문자열’이 생략되거나 None이 설정되면 공백 문자(빈칸, 탭, 개행 문자)를 기준으로 토큰을 구분한다.
가령 기본 구분자로 빈칸을 사용하는 split 메서드는 여러 이름을 쪼개는 데 사용할 수 있다.
stooge_list = 'Moe Larry Curly Shemp'.split()
반환되는 리스트는 다음과 같다.
['Moe', 'Larry', 'Curly', 'Shemp']