4.3.1 보스턴 주택 가격 데이터셋
이 절에서는 1970년 중반 보스턴 외곽 지역의 범죄율, 지방세율 등의 데이터가 주어졌을 때 주택 가격의 중간 값을 예측해 보겠습니다.21 여기에서 사용할 데이터셋은 이전 2개의 예제와 다릅니다. 데이터 포인트가 506개로 비교적 개수가 적고 404개는 훈련 샘플로, 102개는 테스트 샘플로 나뉘어 있습니다. 입력 데이터에 있는 각 특성(feature)(예를 들어 범죄율)의 스케일이 서로 다릅니다. 어떤 값은 0과 1 사이의 비율을 나타내고, 어떤 것은 1과 12 사이의 값을 가지거나 1과 100 사이의 값을 가집니다.
코드 4-23 보스턴 주택 데이터셋 로드하기
from tensorflow.keras.datasets import boston_housing
( , ), ( , ) = (
boston_housing.load_data())
데이터를 살펴보겠습니다.
>>> train_data.shape (404, 13) >>> test_data.shape (102, 13)