2 딥러닝 실행을 위해 필요한 세 가지
딥러닝을 실행하기 위해 반드시 갖추어야 할 세 가지 준비 사항이 있습니다. 데이터, 컴퓨터, 그리고 프로그램입니다.
◼︎ 데이터
딥러닝은 데이터를 이용해 예측 또는 판별을 수행합니다. 이때 사용되는 데이터는 이름표가 달려 있는지에 따라 두 종류로 나뉩니다.
예를 들어 개와 고양이 사진으로 이루어진 데이터가 있다고 해 봅시다. 각각 사진에 ‘개’ 또는 ‘고양이’라고 이름표가 붙어 있다면, 개 사진을 보고 ‘개’라고 판별하고 고양이 사진을 ‘고양이’라고 판별하는 딥러닝 모델을 만들 수 있습니다. 이렇게 이름표가 주어진 데이터를 이용해 그 이름표를 맞히는 것을 ‘지도 학습’이라고 합니다.
반대로 이름표가 없이 개와 고양이 사진이 그냥 마구잡이로 섞여 있다고 생각해 봅시다. 이때도 딥러닝을 활용할 수 있습니다. 사진 속에서 개 사진들의 공통적인 특징을 찾아내고 고양이 사진들의 특징을 찾아내 이 두 그룹을 분류해 낼 수 있습니다. 이렇게 이름표가 없는 데이터를 이용하는 것을 ‘비지도 학습’이라고 합니다. 딥러닝을 설계할 때는 이처럼 주어진 데이터에 이름표가 있는지 없는지에 따라 지도 학습을 사용할지, 아니면 비지도 학습을 사용할지 결정하게 됩니다. 이 책은 CNN, RNN 등의 지도 학습과 GAN, 오토인코더 등의 비지도 학습 계열을 모두 다루게 됩니다. 우리가 이 책에서 다루는 대부분의 예제는 이름표가 있는 지도 학습이지만, 책 후반부에서는 비지도 학습 계열인 GAN과 오토인코더도 배웁니다.