더북(TheBook)

디지털 데이터는 0과 1의 연속적인 비트열로 저장된다. 이 책을 포함하여 여러분이 읽는 모든 책도 비트열로 표현된다. “I am seated in an office”라는 구문을 고려해 보자. 이것은 컴퓨터에서 어떻게 표현될까?

컴퓨터는 문장의 각 문자를 비트열 패턴으로 저장한다. 다양한 방식이 있지만, 영어에서 가장 간단한 방법은 아스키(ASCII) 인코딩이다. 아스키는 미국 정보교환 표준부호(American Standard Code for Information Interchange, ASCII)의 약자로, 로마자 알파벳과 구두점, 일부 제어문자를 표현하는 데 128개의 문자를 사용하는 인코딩 방법이다. 이것은 최근 표준이 아니라 1960년대 이후로 다양한 개정이 있었다.

아스키코드는 라틴 문자 집합을 사용하는 언어에서는 잘 작동되지만, 라틴 문자 계열이 아닌 언어들은 잘 수용하지 못한다. 그래서 비 라틴 계열 언어에서는 110,000개 이상의 문자를 표현할 수 있는 유니코드(Unicode) 같은 인코딩 방법을 사용해야 한다. 아스키코드는 문자당 7비트를 사용하는데, 7비트로 표현할 수 있는 문자 수는 27 = 128이 되므로 오직 128개 문자만 표현할 수 있다. 이 7비트로 표현할 수 있는 각 숫자는 개별 문자들에 대응된다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.