더북(TheBook)

주석

 

Chapter 1

 

1 벡터 검색은 문서나 텍스트를 숫자로 변환하여 의미적으로 가까운 데이터를 빠르고 정확하게 찾아내는 방법을 말합니다.

 

2 문장이나 단어를 숫자의 나열인 벡터로 변환해, 의미가 비슷한 것들끼리 서로 가까운 위치에 나타나도록 표현하는 방법을 ‘임베딩(embedding)’이라고 합니다.

 

3 웹 페이지를 가져와서 데이터를 추출하는 행위를 말합니다.

 

4 차원의 저주는 차원이 증가할수록 데이터가 희소해지고 거리 기반 분석이 어려워지는 문제를 말합니다.

 

5 개체( 개념, 사람, 장소)와 그 관계를 연결하여 시각적으로 표현하는 데이터 구조를 말합니다.

 

6 시맨틱 검색은 단순히 키워드가 포함된 문서를 찾는 것이 아니라, 문장의 의미와 맥락을 분석하여 가장 관련성이 높은 정보를 검색하는 방식입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.