더북(TheBook)

1-2 임베딩과 다르게 입력을 표현하는 전통적인 방법 중 하나는 1장에서 소개한 원-핫 인코딩입니다. 원-핫 인코딩에서는 각 범주 변수를 이진 벡터로 표현합니다. 이 벡터의 하나의 값만 “1” 또는 “핫(hot)”이고 다른 모든 위치는 0입니다.

임베딩이 아닌 또 다른 표현은 히스토그램입니다. 전형적인 예는 이미지 히스토그램입니다.1 이런 히스토그램은 디지털 이미지의 색조 분포를 그래픽으로 표현하며, 픽셀 강도의 분포를 제공합니다.

또한 BoW(bag of words) 모델은 임베딩과 다른 접근 방법을 제공합니다. 이 모델의 경우 입력 문장은 문법과 단어 순서를 무시하고 순서가 없는 단어의 집합 또는 “가방(bag)”으로 표현됩니다. BoW 모델에 대한 자세한 내용은 위키백과를 참고하세요.2

연습문제

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.