• 디퓨전 모델(diffusion model)을 사용하여 표 형식 합성 데이터를 생성하는 TabDDPM 방식: Akim Kotelnikov et al., “TabDDPM: Modelling Tabular Data with Diffusion Models” (2022), https://arxiv.org/abs/2209.15421
• 모델 성능을 향상시킬 수 있는 특성 스케일 조정과 정규화 같은 데이터 전처리 기법을 소개하는 사이킷런(scikit-learn)의 사용자 가이드: https://scikit-learn.org/stable/modules/preprocessing.html
• 잘못되거나 오류가 있는 타깃 값의 영향을 완화하는 기법을 탐색하기 위해 잡음 섞인 레이블로 딥러닝 모델을 훈련하는 방법에 관한 서베이 논문: Bo Han et al., “A Survey of Label-noise Representation Learning: Past, Present and Future” (2020), https://arxiv.org/abs/2011.04406