더북(TheBook)

3.1.2 서포트 벡터 머신

▼ 표 3-3 서포트 벡터 머신을 사용하는 이유와 적용 환경

왜 사용할까?

주어진 데이터에 대한 분류

언제 사용하면 좋을까?

서포트 벡터 머신은 커널만 적절히 선택한다면 정확도가 상당히 좋기 때문에 정확도를 요구하는 분류 문제를 다룰 때 사용하면 좋습니다. 또한, 텍스트를 분류할 때도 많이 사용합니다.

서포트 벡터 머신(Support Vector Machine, SVM)은 분류를 위한 기준선을 정의하는 모델입니다. 즉, 분류되지 않은 새로운 데이터가 나타나면 결정 경계(기준선)를 기준으로 경계의 어느 쪽에 속하는지 분류하는 모델입니다. 따라서 서포트 벡터 머신에서는 결정 경계를 이해하는 것이 중요합니다.

결정 경계는 데이터를 분류하기 위한 기준선입니다. 다음 그림과 같이 주황색 공과 녹색 공이 있을 때 이 공들을 색상별로 분류하기 위한 기준선이 결정 경계입니다.

▲ 그림 3-5 서포트 벡터 머신 결정 경계

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.