더북(TheBook)

다음은 키워드 검색과 벡터 검색을 비교한 것입니다.

▼ 표 1-1 키워드 검색과 벡터 검색

구분

키워드 검색(TF-IDF, BM25)

벡터 검색

검색 방식

특정 단어가 포함된 문서 찾기

문장의 의미적 유사성을 분석하여 유사한 문서 찾기

언어적 유연성

단어가 다르면 검색되지 않음

동의어나 문장 구조가 달라도 의미가 같으면 검색 가능

예시

“AI 기술 발전”을 검색하면 “AI 기술 발전”이 포함된 문서만 검색됨

“AI 기술 발전”을 검색하면 “인공지능의 역사”, “딥러닝 혁신” 등 의미적으로 유사한 문서도 검색됨

벡터는 숫자로 이루어진 리스트(배열) 형태이며, 각 숫자는 특정 차원의 값을 나타냅니다. 일반적으로 1차원 벡터, 2차원 벡터, 3차원 벡터, 고차원 벡터(N차원)로 표현할 수 있습니다.

1차원 벡터는 스칼라(Scalar)라고도 부르며, 크기(길이)만 있고 방향이 없는 경우에 사용됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.