더북(TheBook)

만약 1바이트 정수만 저장할 수 있는 시스템이라면 3바이트짜리 정수는 저장할 수 없으므로 이 시스템에서는 한글을 표현할 수 없습니다. 그러므로 다양한 코드 유닛을 갖는 인코딩 방식을 두어 유연하게 대처해야 합니다. 유니코드 인코딩 방식에도 다양한 종류가 있지만 이 책에서는 UTF-8, UTF-16, UTF-32에 대해서만 다루겠습니다.

지금부터 각 인코딩 방식을 알아볼 텐데 설명의 편의를 위해 C++ 코드를 함께 보면서 이야기를 이어 나가겠습니다.

코드 인코딩 방식에 따른 자료형: C++ 코드

char * str1 = u8"가";

char16_t * str2 = u"가";

char32_t * str3 = U"가";


우리의 목표는 이 코드를 완벽하게 이해하는 것이 아니라 각 인코딩 방식의 특징을 아는 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.