주석
Chapter 1
1 벡터 검색은 문서나 텍스트를 숫자로 변환하여 의미적으로 가까운 데이터를 빠르고 정확하게 찾아내는 방법을 말합니다.
2 문장이나 단어를 숫자의 나열인 벡터로 변환해, 의미가 비슷한 것들끼리 서로 가까운 위치에 나타나도록 표현하는 방법을 ‘임베딩(embedding)’이라고 합니다.
3 웹 페이지를 가져와서 데이터를 추출하는 행위를 말합니다.
4 차원의 저주는 차원이 증가할수록 데이터가 희소해지고 거리 기반 분석이 어려워지는 문제를 말합니다.
5 개체(예 개념, 사람, 장소)와 그 관계를 연결하여 시각적으로 표현하는 데이터 구조를 말합니다.
6 시맨틱 검색은 단순히 키워드가 포함된 문서를 찾는 것이 아니라, 문장의 의미와 맥락을 분석하여 가장 관련성이 높은 정보를 검색하는 방식입니다.