4.4 요약
• 벡터 데이터를 사용하는 가장 일반적인 머신 러닝 작업은 이진 분류, 다중 분류, 스칼라 회귀입니다.
▪︎ 이 장의 ‘정리’ 절에서 이런 종류의 작업을 통해 배울 중요한 사항들을 정리해 놓았습니다.
▪︎ 회귀에서 사용하는 손실 함수와 평가 지표는 분류와 다릅니다.
• 보통 원본 데이터를 신경망에 주입하기 전에 전처리해야 합니다.
• 데이터에 범위가 다른 특성이 있다면 전처리 단계에서 각 특성을 독립적으로 스케일 조정해야 합니다.
• 훈련이 진행됨에 따라 신경망의 과대적합이 시작되고 새로운 데이터에 대해 나쁜 결과를 얻게 됩니다.
• 훈련 데이터가 많지 않으면 과대적합을 피하기 위해 1개 또는 2개의 중간층을 가진 모델을 사용합니다.
• 데이터가 많은 범주로 나뉘어 있을 때 중간층이 너무 작으면 정보의 병목이 생길 수 있습니다.
• 데이터양이 적을 때는 K-겹 검증이 신뢰할 수 있는 모델 평가를 도와줍니다.