아무리 딥러닝의 성능이 좋다고 하더라도 이미지 데이터로부터 특정 숫자가 어떻게 분류되는지의 과정을 설명하기란 쉽지가 않다. 실제 딥러닝 모형을 살펴본다면 이러한 설명을 하는 시도가 일면 불가능해 보인다. 하지만 딥러닝 기법은 앞에 제시된 숫자의 사진만 보고도 어떤 숫자를 나타내고 있는지를 잘 분류한다. 예를 들어 간단한 딥러닝 기법을 앞 데이터셋에 테스트하면 숫자 이미지 1,000개 가운데 985개 이상을 어떤 숫자인지 잘 분류해낸다(혹은 더 많은 숫자를 잘 분류할 수 있다). 왜 이런 결과를 나왔는지 관심이 없다면 즉, 오로지 그 결과와 성능만이 중요하다면 딥러닝은 꽤 고무적인 기법이다.
이제 예측 중심의 모형 중에서도 딥러닝의 중요성과 활용도가 크게 증가하고 있다. 딥러닝은 2000년 중후반부터 큰 관심과 함께 계속 발전하고 있다. 딥러닝은 은닉층을 계산에 활용하는 방식에 따라 합성곱 신경망(convolutional neural network), 심층 신뢰 신경망(deep belief network), 순환 신경망(recurrent neural network) 등으로 나눌 수 있으며, 충분한 성능을 얻기 위해서는 대용량 계산의 처리가 가능해야 하므로 GPU 또는 클라우드 컴퓨팅 환경의 사용이 필요하다. 예를 들어 ILSVRS(ImageNet Large Scale Visual Recognition Challenge) 대회2에서는 2012년 이후 딥러닝 기반의 모형이 항상 선두를 달리고 있다.
▲ 그림 8-6 ILSVRS 홈페이지
2 대규모 객체 감지 및 이미지 분류를 위한 알고리즘을 평가하는 이미지넷 인식 대회이다.