더북(TheBook)

Q&A 문자열

 

 

Q. 파이썬은 문자열을 내부에 어떻게 저장하는가?

A. 문자열은 최신 텍스트 인코딩 표준인 유니코드(Unicode)로 인코딩된 문자들을 나열한 것이다. 유니코드는 100여 개 언어에서 사용하는 10만 개 이상의 문자를 지원하며, 수학이나 음악에서 사용하는 기호도 지원한다.

 

Q. 문자 하나를 표현하기 위해 파이썬에서는 어떤 데이터 타입을 제공하는가?

A. 파이썬에는 문자 하나를 표현하기 위한 별도의 데이터 타입이 없다. 'A' 등의 문자는 그저 요소가 하나만 들어 있는 문자열일 뿐이다.

파이썬 2의 문자열 | 파이썬 2는 문자를 인코딩하기 위해 유니코드가 아닌 아스키코드(ASCII)를 사용한다. 예전에 사용되던 표준인 아스키코드는 영문자, 숫자, 구두점 등 128개 문자를 지원한다. 파이썬 2에서는 유니코드 문자열을 표현하기 위해 unicode라는 별도의 데이터 타입을 제공하지만, 이를 지원하지 않는 파이썬 2 라이브러리도 많다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.