더북(TheBook)

그림에서 표현하고 있는 데이터 흐름을 하나씩 살펴보겠습니다.

1. 사용자가 새로운 트윗을 작성하면 트윗 서비스가 트윗 데이터를 검색 서비스로 보냅니다.

2. 검색 서비스는 트윗에서 텍스트, 해시태그, 멘션, 사용자 정보를 추출합니다.

3. 추출한 데이터를 엘라스틱서치에 등록하여 각 단어와 트윗 ID를 연결하는 역색인(inverted index)을 생성합니다.

4. 마찬가지로 새로운 사용자를 등록하거나 프로필 정보를 변경하면 사용자 서비스가 해당 사용자 데이터를 검색 서비스로 전달합니다.

5. 검색 서비스는 사용자 이름, 소개, 위치 정보 등 중요한 데이터를 추출하여 엘라스틱서치에 저장하고, 이를 기반으로 검색 기능을 구성합니다.

지금까지 검색 서비스에서 데이터를 인덱싱하는 과정을 살펴보았습니다. 이제 검색 쿼리를 처리하는 방법을 알아보겠습니다.

 

 

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.