더북(TheBook)

3.3 다중 분류

3.2절에서 이진 분류 문제를 다루는 방법을 살펴보았습니다. 이제 이진이 아닌, 즉 세 개 이상의 클래스를 가진 분류 문제를 다루는 방법을 잠시 알아보겠습니다.29 다중 분류를 위해 사용할 데이터셋은 통계 분야에서 유래된 유명한 데이터셋인 붓꽃 데이터셋입니다(https://en.wikipedia.org/wiki/Iris_flower_data_set 참조). 이 데이터셋은 setosa, versicolor, virginica라는 세 개의 붓꽃 품종으로 구성되어 있습니다. 세 품종은 꽃의 모양과 크기로 서로 구분할 수 있습니다. 20세기 초 영국의 통계학자 로널드 피셔(Ronald Fisher)가 150개 붓꽃 샘플의 (꽃의 다른 부위인) 꽃잎과 꽃받침의 길이 및 폭을 측정했습니다. 이 데이터셋은 타깃 레이블마다 정확히 50개의 샘플로 구성되어 있습니다.

이 문제에서 모델은 네 개의 수치 특성인 꽃잎 길이, 꽃잎 너비, 꽃받침 길이, 꽃받침 너비를 입력으로 받고 타깃 레이블(세 품종 중 하나)을 예측합니다. 이 예제는 iris 폴더 안에 있고 다음 명령으로 실행할 수 있습니다.

> cd deep-learning-with-javascript/
> npx http-server

그다음, 브라우저를 열고 http://127.0.0.1:8080/iris에 접속합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.