2.12 ‘split’을 활용한 입력 값 쪼개기

    입력받은 문자를 다루는 가장 흔한 프로그래밍 작업은 토큰화(tokenizing)이다. 즉, 입력받은 문장을 각 단어, 구, 숫자로 분리하는 것이다. 파이썬 split 메서드는 이 토큰화 작업을 쉽고 편리하게 해 준다.

    입력_문자열.split(구분_문자열=None)

    이 메서드가 호출되면 ‘입력_문자열’의 부분 문자열로 이루어진 리스트를 반환한다. ‘구분_문자열’은 단어를 쪼개는 기준인 구분자로 동작한다.

    ‘구분_문자열’이 생략되거나 None이 설정되면 공백 문자(빈칸, 탭, 개행 문자)를 기준으로 토큰을 구분한다.

    가령 기본 구분자로 빈칸을 사용하는 split 메서드는 여러 이름을 쪼개는 데 사용할 수 있다.

    stooge_list = 'Moe Larry Curly Shemp'.split()

    반환되는 리스트는 다음과 같다.

    ['Moe', 'Larry', 'Curly', 'Shemp']
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.