data_description.txt 파일은 내려받은 데이터의 각 속성이 무엇을 의미하는지 설명하고 있습니다. train.csv 파일은 집 값과 해당 집이 어떤 속성을 가졌는지 정리된 파일입니다. 우리는 15장에서 이미 이 데이터를 다루었습니다.
test.csv 파일은 이 train.csv 파일을 이용해 학습한 결과를 테스트하기 위한 데이터입니다. train.csv 파일과 모든 항목이 같지만 맨 마지막 집 값(SalePrice) 항목만 빠져 있습니다. 이 항목을 예측하는 것이 우리의 과제입니다.
sample_submission.csv 파일은 Id와 SalePrice 두 개의 열만 존재하는 파일입니다. 각 Id별로 우리가 예측한 SalePrice를 채워 넣어 캐글에 업로드하면 됩니다.