그렇다면 누가 이 감독자의 역할을 하는 것일까요? 바로 ‘데이터’입니다. 인공지능에게 데이터를 제공할 때 ‘강아지 사진’과 강아지라는 ‘명칭’을 한 쌍으로 묶어서 제공합니다. 마찬가지로 ‘고양이 사진’과 고양이라는 ‘명칭’을 한 쌍으로 묶어 제공하겠죠. 이때 강아지와 고양이의 사진은 서로 다르고 수많은 종류가 있지만, 강아지와 고양이라는 명칭은 일정합니다. 전문적인 용어로 명칭을 ‘레이블(Label)’이라고 부릅니다.
이제 이러한 형태의 데이터를 인공지능에 입력하여 학습시키면 인공지능은 각 사진의 특성에 강아지와 고양이라는 명칭을 사용하여 학습을 진행합니다. 다양한 강아지 사진들을 보며 강아지만의 특성을 찾아내고, 마찬가지로 다양한 고양이 사진들을 보며 고양이만의 특성을 찾아냅니다. 이러한 수많은 데이터를 사용하여 학습한 인공지능에게 새로운 사진을 주면서 “이것은 고양이야? 아니면 강아지야?”라고 묻는다면 인공지능은 학습한 내용을 바탕으로 답을 말할 수 있습니다.