5.1.2 데이터 증강
데이터 증강은 기존의 데이터를 기반으로 새로운 데이터 샘플이나 특성을 생성합니다. 이 기법을 사용하면 데이터를 추가로 모으지 않고도 데이터셋을 확장시킬 수 있습니다.
데이터 증강을 사용하면 원본 입력 데이터의 다른 버전을 만들어 모델의 일반화 성능을 향상시킬 수 있습니다. 왜 그럴까요? 증강된 데이터는 훈련 샘플이나 특성에 있는 가짜 정보(예를 들어 이미지 데이터의 경우, 특정 위치의 픽셀 값)를 기억하기 어렵게 만들기 때문에 모델의 일반화 능력을 개선할 수 있습니다. 그림 5-2는 명도(brightness) 증가, 반전, 자르기 등 일반적인 이미지 데이터 증강 기법을 보여 줍니다.