1.2.2 벡터 처리 과정
그럼 벡터 처리 과정에 대해 살펴봅시다. RAG에서 검색을 위해 문서를 벡터화하는 과정은 다음과 같습니다.
(1) 텍스트를 벡터로 변환(임베딩)
텍스트 문서는 임베딩(Embedding) 모델을 이용하여 벡터로 변환됩니다. 이를 위해 text-embedding-ada-002, BERT, Sentence-BERT 등의 임베딩 모델을 활용하여 각 문장을 고차원 벡터 공간에서 표현합니다. 이때 변환된 벡터들은 의미적으로 유사하다면 서로 가까운 위치에 배치됩니다.

▲ 그림 1-8 유사한 의미의 벡터는 가까운 곳에 위치