더북(TheBook)

비지도 학습 사례 살펴보기2 - 차원 축소

다음으로, 비지도 학습을 사용하면 차원 축소(dimensionality redution)를 할 수 있습니다. 여기에서 말하는 차원이란 바로 데이터의 특징을 의미합니다. 데이터의 특징을 전문 용어로 피처(feature)라고 합니다. 지도 학습에서 예로 들었던 집값을 예측하기 위해 필요한 데이터들이 각각의 피처들인 것이죠.

다음 그림과 같이 집값을 예측하는 상황이라고 가정해 봅시다. 방의 개수, 범죄율, 고속도로 접근성, 편의시설, 가격 등 집을 선택하는 데 작용하는 데이터는 여러 종류가 있습니다. 모든 조건(데이터)을 고려할 수 없으므로 이 중에서 몇 가지 특징만으로 좁혀 나갑니다. 이를 “데이터의 피처를 줄인다.”라고 표현합니다.

그림 2-8 | 집값을 예측하기 위한 데이터의 피처를 줄이는 과정

이러한 데이터의 특징들이 많으면 좋지만 그 수가 컴퓨터가 처리하기 힘들 정도로 많거나 의미 없는 데이터가 있다면 그것을 굳이 모두 분석할 필요는 없습니다.

이러한 상황에서 비지도 학습을 사용하여 데이터의 특징들을 줄여줍니다. 바로 데이터의 피처를 줄이는 것이라고 볼 수 있습니다. 비지도 학습을 사용하여 데이터를 가장 잘 표현할 데이터의 피처를 찾아주기 때문에 데이터를 더욱 효율적으로 사용할 수 있죠.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.