6. 모델 성능을 편향 없이 평가하려면 데이터셋을 어떻게 분할해야 하는가?
답 신경망을 훈련시키기 전에 데이터셋을 훈련 데이터셋, 검증 데이터셋, 테스트 데이터셋으로 나눠야 한다. 훈련 데이터셋은 신경망을 훈련시키는 데 사용한다. 검증 데이터셋은 초매개변수를 튜닝하는 데 사용한다. 마지막으로 테스트 데이터셋은 신경망의 성능을 최종 평가하는 데 사용한다.
7. 다중 레이어 퍼셉트론의 모델 아키텍처가 가진 특징은 무엇인가?
답 다중 레이어 퍼셉트론은 전방향 신경망이며 은닉 레이어를 최소 한 개 이상 가진다. 각 레이어에는 비선형 활성화 함수가 결과를 출력한다. 이 구조로 비선형 결정 경계를 만들 수 있다.
8. 신경망에서 활성화 함수의 역할은 무엇인가?
답 활성화 함수는 가중치와 편향으로 계산한 출력값에 비선형 변환을 적용해 다음 레이어로 넘긴다. 은닉 레이어에는 ReLU 활성화 함수가 가장 효과적이며 널리 쓰인다.
9. 이진 분류 문제를 예측하는 신경망에 가장 적합한 손실 함수는 무엇인가?
답 이진 분류 문제를 위한 신경망에는 이진 교차 엔트로피(binary cross entropy) 함수가 좋다.
10. 혼동 행렬로 어떤 지표를 볼 수 있고 신경망의 성능을 어떻게 평가할 수 있는가?
답 혼동 행렬은 신경망이 예측한 결과의 진음성, 위양성, 위음성, 진양성 지표를 보여준다. 단순히 정확도만 확인하는 것이 아니라, 신경망의 예측이 빗나간 결과를 위양성과 위음성으로 나눠 한층 더 깊게 확인할 수 있다.