더북(TheBook)


3.3UTF-32


UTF-32도 유니코드 인코딩 방식의 하나로 모든 문자를 4바이트로 표현합니다. 코드 유닛의 크기는 32 비트입니다.

char32_t * str3 = U"가";


UTF-32는 모든 문자를 4바이트 단위로 인코딩하므로 기본 다국어 평면의 문자뿐만 아니라 모든 평면에 있는 문자를 한 개 단위로 담을 수 있습니다. char32_t는 4바이트 자료형으로 UTF-32로 인코딩된 데이터를 담기 위해 만들어졌습니다.

그림 4-6은 문자 ‘가’가 UTF-32로 인코딩되어 메모리에 담긴 모습입니다.

054_2

그림 4-6 문자 '가' UTF-32


모든 문자가 4바이트로 표현되므로 문자 ‘가’도 4바이트로 표현됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.