다음은 키워드 검색과 벡터 검색을 비교한 것입니다.
▼ 표 1-1 키워드 검색과 벡터 검색
|
구분 |
키워드 검색(TF-IDF, BM25) |
벡터 검색 |
|
검색 방식 |
특정 단어가 포함된 문서 찾기 |
문장의 의미적 유사성을 분석하여 유사한 문서 찾기 |
|
언어적 유연성 |
단어가 다르면 검색되지 않음 |
동의어나 문장 구조가 달라도 의미가 같으면 검색 가능 |
|
예시 |
“AI 기술 발전”을 검색하면 “AI 기술 발전”이 포함된 문서만 검색됨 |
“AI 기술 발전”을 검색하면 “인공지능의 역사”, “딥러닝 혁신” 등 의미적으로 유사한 문서도 검색됨 |
벡터는 숫자로 이루어진 리스트(배열) 형태이며, 각 숫자는 특정 차원의 값을 나타냅니다. 일반적으로 1차원 벡터, 2차원 벡터, 3차원 벡터, 고차원 벡터(N차원)로 표현할 수 있습니다.
1차원 벡터는 스칼라(Scalar)라고도 부르며, 크기(길이)만 있고 방향이 없는 경우에 사용됩니다.