더북(TheBook)

icon_wait


encode( ) 함수

파이썬에서 encode( ) 함수는 문자를 주어진 유니코드 인코딩 방식에 따라 코드 유닛을 나열하는 방식으로 변환하는 함수입니다. 다음은 한글 ‘가’(유니코드 코드 포인트: U+AC00)를 각 인코딩 방식으로 변환한 결과입니다.

>>> ch = '가'

>>> ch.encode()

b'\xea\xb0\x80'

>>> ch.encode('UTF-8')

b'\xea\xb0\x80'

>>> ch.encode('UTF-16')

b'\xff\xfe\x00\xac'

>>> ch.encode('UTF-32')

b'\xff\xfe\x00\x00\x00\xac\x00\x00'


encode( ) 함수의 인자 중 하나인 인코딩 방식을 각각 다르게 적용하면 결과 값과 크기가 모두 다르게 나타나는 걸 확인할 수 있습니다. encode( ) 함수의 인자에 아무것도 전달하지 않으면 ‘UTF-8’이 인자일 때와 값이 같으므로 파이썬에서는 기본값이 UTF-8이라는 것도 알 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.