더북(TheBook)

그렇다면 결정 경계는 어디에 위치하면 가장 좋을까요? 다음 그림의 (a)~(c) 중에서 어떤 그림이 가장 안정적으로 보이나요? (b)가 가장 안정적으로 보이지 않나요?

▲ 그림 3-6 서포트 벡터 머신 결정 경계의 위치 결정

결정 경계는 데이터가 분류된 클래스에서 최대한 멀리 떨어져 있을 때 성능이 가장 좋습니다. 서포트 벡터 머신을 이해하려면 결정 경계 외에도 마진이라는 개념을 이해해야 합니다.

마진(margin)은 결정 경계와 서포트 벡터 사이의 거리를 의미합니다. 그럼 서포트 벡터는 무엇일까요? 서포트 벡터(support vector)는 결정 경계와 가까이 있는 데이터들을 의미합니다. 이 데이터들이 경계를 정의하는 결정적인 역할을 한다고 할 수 있습니다. 즉, 정리하면 최적의 결정 경계는 마진을 최대로 해야 합니다.

▲ 그림 3-7 서포트 벡터 머신의 서포트 벡터

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.