더북(TheBook)

클릭하면 <a> 태그의 하위 정보가 나옵니다. 그림 5-29와 같이 <a> 태그 밑에 ‘맨뒤’라는 글자가 포함되어 있는 것을 알 수 있습니다. HTML을 알고 있다면 태그에 입히는 class와 id를 이해하겠지만 HTML을 모르는 사람을 위해 간단히 설명하겠습니다. 이 웹 페이지에 있는 여러 <td> 태그와 <a> 태그 중 필요한 요소를 구별할 수 있는 별도의 구분자가 있어야 합니다. 이를 위해 사용하는 것이 바로 해당 태그의 클래스이며, 우리가 확인하고 싶은 [맨뒤] 버튼은 여러 <td> 중에서 클래스가 pgRR<td> 태그 바로 밑에 있는 <a> 태그에 있다는 것을 알 수 있습니다.

따라서 해당 버튼을 다음과 같이 특정 지을 수 있습니다.

td.pgRR > a

이것을 조금 더 해석해 보면 클래스명이 pgRR(class='pgRR')<td> 태그 밑에 있는 <a> 태그를 선택하겠다는 의미입니다. 이렇게 선택된 <a> 태그가 우리가 찾고자 하는 [맨뒤] 버튼을 구성하는 요소입니다. 이 선택된 <a> 태그를 좀 더 살펴보면, <a href="/sise/sise_market_sum.nhn?sosok=0&page=32">처럼 href 값 마지막에 page=32라는 부분이 있습니다. 이것은 우리 눈에 보이는 웹 페이지에서 맨뒤를 누르면 사실은 <a href="/sise/sise_market_sum.nhn?sosok=0&page=32">를 누르게 되어 마지막 페이지인 32로 이동하는 것입니다. 따라서 이 <a> 태그의 href 값을 추출하면 마지막 페이지 번호를 알아낼 수 있는 것입니다.

지금까지 작업은 프로그래밍을 처음 접하는 사람에게는 상당히 어려웠을 것입니다. 더 자세히 설명하고 싶었지만 HTML까지 다루는 것은 이 책 범위를 벗어나므로 최대한 간략히 설명했습니다. 이 과정은 단순히 웹 페이지를 구성하는 요소를 가져오는 작업이라고 생각하기 바랍니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.