임베딩이란?
임베딩(embedding)은 복잡한 데이터를 간단한 형태로 바꾸는 것을 말합니다.
▲ 그림 3-14 임베딩
즉, 컴퓨터가 이해할 수 있도록 정보를 숫자(벡터)로 바꾸는 것인데요. 구체적으로 예를 들어 볼까요? ‘사과’, ‘바나나’, ‘컴퓨터’라는 세 단어가 있다고 가정해봅시다. 이제 이 단어들을 컴퓨터가 이해할 수 있는 숫자로 바꿔야 합니다. 변환되는 첫 번째 숫자는 ‘과일(fruit)’을, 두 번째 숫자는 ‘기술(technology)’을 나타낸다고 하면 다음과 같이 변환될 수 있습니다.
• ‘사과’는 [1.0, 0.0]으로 변환
• ‘바나나’는 [0.9, 0.1]로 변환
• ‘컴퓨터’는 [0.1, 0.9]로 변환