3.3UTF-32
UTF-32도 유니코드 인코딩 방식의 하나로 모든 문자를 4바이트로 표현합니다. 코드 유닛의 크기는 32 비트입니다.
char32_t * str3 = U"가";
UTF-32는 모든 문자를 4바이트 단위로 인코딩하므로 기본 다국어 평면의 문자뿐만 아니라 모든 평면에 있는 문자를 한 개 단위로 담을 수 있습니다. char32_t는 4바이트 자료형으로 UTF-32로 인코딩된 데이터를 담기 위해 만들어졌습니다.
그림 4-6은 문자 ‘가’가 UTF-32로 인코딩되어 메모리에 담긴 모습입니다.
그림 4-6 문자 '가' UTF-32
모든 문자가 4바이트로 표현되므로 문자 ‘가’도 4바이트로 표현됩니다.