더북(TheBook)

연습문제

 

 

1.6.1 랜덤 서퍼가 URL을 직접 입력해 페이지를 이동할 확률(leap probability)을 명령 줄에서 입력받도록 transition.py를 수정하고, 이 프로그램을 이용해 80-20이나 95-5 규칙으로 바꾼 후 페이지 랭크에 어떤 영향이 있는지 확인해보라.

 

1.6.2 다중 링크를 무시하도록 transition.py를 수정하라. 즉 한 페이지에서 다른 페이지로 가는 링크가 여러 개 있을 때, 링크가 하나만 있는 것으로 간주하는 것이다. 그리고 이렇게 규칙을 바꿔 페이지 랭크 순서도 바뀌는 예를 보여라.

 

1.6.3 나가는 링크가 없는 페이지에 해당하는 행 요소들의 값을 모두 1/n로 설정하도록 transition.py를 수정하라.

 

1.6.4 randomsurfer.py의 코드는 p[page] 행의 확률의 합이 1이 아닐 때 제대로 랜덤 서핑하지 못한다. 이럴 때 어떤 문제가 생기는지 설명하고 이 문제를 해결할 수 있는 방법을 제안하라.

 

1.6.5 randomsurfer.pytiny.txt에 대해 소수점 네째 자리와 다섯째 자리까지 정확한 페이지 랭크를 계산하기 위해 필요한 반복 횟수를 10단위로 알아내라.

 

1.6.6 markov.pytiny.txt에 대해 소수점 셋째 자리, 넷째 자리, 열 번째 자리까지 정확한 값을 계산하기 위해 필요한 반복 횟수를 알아내라.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.