더북(TheBook)

1 아스키코드


이야기를 시작하기 전에 몇 가지 용어를 정리하겠습니다.

문자 인코딩(character encoding)은 문자 집합을 메모리에 저장하거나 통신하는 데 사용하기 위해 부호화하는 방식을 말합니다. 대표적인 예로 모스 부호를 들 수 있습니다.

문자 집합(character set)은 문자(character)를 모아 둔 것입니다. 예를 들면 라틴 문자가 있습니다. 주목할 점은 다양한 언어(영어, 프랑스어, 독일어 등)가 라틴 문자를 사용한다는 점입니다.

0과 1밖에 모르는 컴퓨터에 문자를 인식시키려면 문자를 0과 1로 이루어진 2진수로 나타내야 합니다. 문자 하나에 정수 하나를 매핑해 두면 이 정수는 특정 문자를 표현하게 됩니다. 이렇게 매핑된 정수를 코드 포인트(code point)라고 하고, 문자와 문자에 매핑된 코드 포인트를 모아 놓은 집합을 부호화된 문자 집합(Coded Character Set, CCS)이라고 합니다.

용어가 직관적으로 이해되지는 않지만 이번 절을 읽고 나면 어느 정도 이해할 수 있을 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.