더북(TheBook)

4.4 요약

벡터 데이터를 사용하는 가장 일반적인 머신 러닝 작업은 이진 분류, 다중 분류, 스칼라 회귀입니다.

▪︎ 이 장의 ‘정리’ 절에서 이런 종류의 작업을 통해 배울 중요한 사항들을 정리해 놓았습니다.

▪︎ 회귀에서 사용하는 손실 함수와 평가 지표는 분류와 다릅니다.

보통 원본 데이터를 신경망에 주입하기 전에 전처리해야 합니다.

데이터에 범위가 다른 특성이 있다면 전처리 단계에서 각 특성을 독립적으로 스케일 조정해야 합니다.

훈련이 진행됨에 따라 신경망의 과대적합이 시작되고 새로운 데이터에 대해 나쁜 결과를 얻게 됩니다.

훈련 데이터가 많지 않으면 과대적합을 피하기 위해 1개 또는 2개의 중간층을 가진 모델을 사용합니다.

데이터가 많은 범주로 나뉘어 있을 때 중간층이 너무 작으면 정보의 병목이 생길 수 있습니다.

데이터양이 적을 때는 K-겹 검증이 신뢰할 수 있는 모델 평가를 도와줍니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.