더북(TheBook)

코드를 실행하면 그림 3-12와 같이 랜덤한 잡음이 섞인 XOR 데이터셋이 만들어집니다.

▲ 그림 3-12 간단한 XOR 데이터셋

확실히 양성 클래스와 음성 클래스를 선형 초평면으로 구분할 수 없을 것 같습니다. 앞 절에서 배운 선형 로지스틱 회귀나 선형 SVM을 사용한 결정 경계가 여기에 해당합니다.

이렇게 선형적으로 구분되지 않는 데이터를 다루는 커널 방법(kernel method)의 기본 아이디어는 매핑 함수 를 사용하여 원본 특성의 비선형 조합을 선형적으로 구분되는 고차원 공간에 투영하는 것입니다. 그림 3-13에서 볼 수 있듯이 2차원 데이터셋을 다음과 같은 투영을 통해 새로운 3차원 특성 공간으로 변환하면 클래스를 구분할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.