그렇다면 데이터인데 정답이 있는 데이터란 무엇을 의미하는 것일까요? 데이터의 모습을 살펴보면 그 안에 정답이 들어 있습니다. 바로 레이블이라는 이름으로 말이죠.
그림 2-4 | 데이터의 정답: 레이블
이때 사과 사진과 배 사진은 서로 다른 수많은 종류의 사진이지만, 사과와 배라는 ‘이름’은 일정합니다. 이 이름을 전문 용어로 레이블(Label)이라고 부릅니다. 그리고 이 레이블이 바로 데이터의 정답을 의미합니다. 사과 사진과 배 사진이 각각 무엇을 의미하는지 데이터만 보고도 알 수 있게 해주기 때문입니다.
이제 이러한 형태의 데이터를 인공지능에 입력하여 학습시키면 인공지능은 여러 장의 사과 사진을 보며 사과만의 특성을 찾아내고, 여러 장의 배 사진을 보며 배만의 특성을 찾아냅니다. 이렇게 수많은 데이터를 사용하여 학습한 인공지능에게 새로운 사진을 보여주며 “이것이 사과야? 배야?”라고 물으면 인공지능은 학습한 내용을 바탕으로 답을 말할 수 있습니다.