더북(TheBook)

모델 크기를 감소시키면 과대적합을 줄일 수 있다는 전통적인 편향-분산 이론: Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie, “Model Selection and Bias-Variance Tradeoff,” Chapter 2.9, in The Elements of Statistical Learning (Springer, 2009).

지식 정제를 적용하여 원본 네트워크와 동일한 예측 성능을 갖는 작은 네트워크를 찾는 로터리 티켓 가설: Jonathan Frankle and Michael Carbin, “The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks” (2018), https://arxiv.org/abs/1803.03635

이중 하강에 대한 더 자세한 내용: https://en.wikipedia.org/wiki/Double_descent

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.