더북(TheBook)

마르코프 연쇄에 대해 많은 연구가 수행되었지만, 1998년에 세르게이 브린(Sergey Brin)과 로렌스 페이지(Lawrence Page), 두 명의 대학원생이 마르코프 연쇄를 만들어 랜덤 서퍼가 전 세계 웹의 모든 페이지에 방문할 확률을 계산해낸 후에야 웹에 영향을 미치기 시작했다. 이들의 연구는 웹 검색의 혁명을 이끌었고, 이들이 설립한 구글에서 이 페이지 랭킹 기법을 사용해 커다란 성공을 거두었다. 구글은 랜덤 서퍼가 각 페이지에 도달할 확률을 주기적으로 다시 계산한다. 그러고 나서 사용자가 검색할 때 검색 키워드에 관련된 페이지 목록을 랭크 순서로 나열한다. 이 페이지 랭크는 웹 검색으로 찾으려는 관련 웹 페이지를 신뢰성 있게 찾아내어 전형적인 웹 사용자의 기대에 부응하므로 상당히 뛰어난 결과를 만들어낸다. 웹에 존재하는 웹 페이지가 어마어마하게 많으므로 이 계산에는 시간이 아주 많이 소요되지만, 검색 결과의 수익성이 뛰어나므로 이 비용을 지불할 가치가 있게 만든다. markov.py에서 사용한 기법은 랜덤 서퍼의 행동을 시뮬레이션하는 것보다 훨씬 더 효율적이지만, 웹에 있는 모든 페이지를 담은 거대한 행렬의 확률을 계산하기에는 너무 느리다. 페이지 랭크를 더욱 효율적으로 계산하려면 그래프를 처리하기 위한 더 나은 데이터 구조가 필요하다(4장 참조).

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.