UNIT 13
HTML 파일 처리하기
DATA SCIENCE FOR EVERYONE
첫 번째로 다룰 정형 문서는 HTML이다. HTML은 정보를 사람이 읽을 수 있는 형태로 웹에서 표현하려고 사용하는 마크업 언어다. HTML 문서는 텍스트, 텍스트 표현과 해석을 통제하는 태그(tag)(산형괄호 <>로 씌운)로 구성된다. 태그는 속성(attributes)도 가질 수 있다. 표 3-1에서 몇 가지 HTML 태그와 속성을 알아보자.