더북(TheBook)

2 유니코드


아스키코드를 보면 알파벳만 있고 한글이 없습니다. 아스키코드만 보면 우리는 컴퓨터에서 한글을 사용할 수 없을 것 같습니다. 하지만 저는 물론 여러분도 컴퓨터에서 한글을 쓰고 있습니다. 한글은 아스키코드의 범위를 벗어나는데 우리는 어떻게 한글을 쓰고 있는 걸까요?

전 세계적으로 컴퓨터가 보급되고 인터넷을 통해 세계 각국의 사람들이 커뮤니케이션을 하면서 컴퓨터에서 쓸 수 있는 언어가 좀 더 많이 필요해졌습니다. 이때 나온 해결 방법이 7비트로 표현한 문자를 16비트로 확장하는 것이었습니다. 7비트일 때는 128개 문자를 표현할 수 있지만 16비트로 확장하면 65,536개 문자를 표현할 수 있습니다. 여기에 더해 수 하나에 다시 문자 하나를 일대일로 대응한 새로운 표를 만들었는데, 이 테이블이 바로 유니코드입니다.

아예 처음부터 새로 대응한 것은 아니고 아스키코드인 0x0000부터 0x007F(2진수 0000 0000 0000 0000 ~ 0000 0000 0111 1111 즉, 기존 아스키코드 앞에 0으로 채워진 8비트를 붙인 것)까지는 그대로 유지하고 이후부터 숫자 하나에 문자 하나씩을 대응하였습니다. 문자에는 한글, 중국어, 일본어 같은 언어 대부분이 포함되었습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.