2 비지도 학습
■ 비지도 학습 의미 살펴보기
비지도 학습은 지도 학습이 아닌 학습을 의미합니다. 비지도 학습의 영문명은 unsupervised learning입니다. 지도 학습이 supervised learning인데 반대를 의미하는 접두사 un이 결합된 단어지요.
지도 학습은 정답이 있는 데이터를 사용하여 인공지능을 학습시켰지만, 비지도 학습은 정답이 있는 데이터가 아닌, 정답이 없는 데이터를 사용합니다. 그렇다면 비지도 학습에서의 인공지능은 어떻게 학습하는 것일까요?
인공지능이 사과와 배를 학습한다고 생각해 봅시다. 여기서 달라지는 것은 바로 무엇이 사과 사진이며, 무엇이 배 사진인지 정답을 알려주지 않는다는 것입니다.
인공지능이 무엇이 사과인지, 배인지 알 수 없기 때문에 사과와 배를 정확하게 구분하라고 할 수는 없습니다. 그 대신 인공지능에게 수많은 사진을 보여주고 그것을 2개로 나누어 보라고 하면 인공지능은 여러 사진을 비교하며 스스로 형태를 나눕니다. 대상의 특징을 살펴보고 스스로 그 특징에 따라 구분해 나가는 것입니다. 이때 인공지능은 높은 확률로 사과는 사과대로, 배는 배대로 구분해 나갑니다. 하지만 정답이 없기 때문에 무엇이 사과인지, 무엇이 배인지는 결코 알지 못하죠.
만약 사과와 배 사진으로 2개가 아니라 3~4개로 구분하라고 한다면 어떻게 될까요? 아마 사과와 배의 품종별로 구분될 수도 있겠죠? 이처럼 정답이 없는 데이터에서 그 데이터의 특징을 찾아서 스스로 구분해 나갑니다. 이렇게 구분해 나가면 새로운 데이터가 들어왔을 때 그 데이터가 어떤 그룹에 속하는지 스스로 판단할 수 있습니다. 정답이 없는 데이터를 사용해서 스스로 판단할 수 있는 지능을 가지게 되는 것이죠.
그림 2-6 | 데이터를 보고 스스로 구분하는 비지도 학습