더북(TheBook)

이진 분류와 다중 클래스 분류

간단한 분류를 생각해보자. 어떤 것이 사각형이고, 어떤 것이 원형인지 알아내려고 한다(사각형이나 원형 대신 원하는 것으로 대체할 수 있다. 개와 고양이, 인간과 외계인 등). 그림 7-1에 두 개체가 있다.

▲ 그림 7-1 분류할 두 개체

 

이 작업은 두 가지 결과(이것 또는 저것)만 있기 때문에 이진 분류 문제로 생각할 수 있다. 결과를 0 또는 1로 생각해보라. 우리는 지도 학습으로 신뢰할 만한 수준에서 이 클래스들이 어디에 놓여있는지 신속하게 파악할 수 있다.

클래스가 둘 이상 있다면 어떻게 될까? 예를 들어 그림 7-2와 같이 사각형과 원형 외에 삼각형을 추가한다.

▲ 그림 7-2 분류할 세 개체

 

그림 7-2에서는 이진 분류가 쓸모가 없다. 이제 다중 클래스 분류 문제에 맞닥뜨렸다. 클래스가 둘 이상이므로 클래스를 분류하는 알고리즘을 사용해야 한다. 어떤 다중 클래스 방법은 이진 분류기를 쌍으로 묶어 예측에 사용하려고 하는데, 의미 없는 일이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.