16.1.1 신경망과 딥러닝
딥러닝(deep learning)은 2000년대부터 사용되고 있는 심층 신경망(deep neural network)의 또 다른 이름입니다. 신경망(neural network)은 인공 신경망(artificial neural network)이라고도 불리며, 이는 사람의 뇌 신경 세포(neuron)에서 일어나는 반응을 모델링하여 만들어진 고전적인 머신 러닝 알고리즘입니다. 즉, 딥러닝이란 신경망을 여러 계층(layer)으로 쌓아서 만든 머신 러닝 알고리즘 일종입니다. 컴퓨터 비전 분야에서 딥러닝 기술이 크게 주목받고 있는 이유는 객체 인식, 얼굴 인식, 객체 검출, 분할 등의 다양한 영역에서 딥러닝이 적용된 기술이 기존의 컴퓨터 비전 기반 기술보다 월등한 성능을 보여 주고 있기 때문입니다.
영상을 인식하는 분류 문제에서 전통적인 머신 러닝과 딥러닝에 의한 학습 및 인식 과정을 그림 16-1에 나타냈습니다. 기존의 머신 러닝 학습에서는 영상으로부터 인식에 적합한 특징을 사람이 추출하여 머신 러닝 알고리즘 입력으로 전달합니다. 그러면 머신 러닝 알고리즘이 특징 벡터 공간에서 여러 클래스 영상을 상호 구분하기에 적합한 규칙을 찾아냅니다. 이때 사람이 영상에서 추출한 특징이 영상 인식에 적합하지 않다면 어떤 머신 러닝 알고리즘을 사용한다고 하더라도 좋은 인식 성능을 나타내기 어렵습니다. 그러나 최근의 딥러닝은 특징 추출과 학습을 모두 딥러닝이 알아서 수행합니다. 즉, 여러 영상을 분류하기 위해 적합한 특징을 찾는 것과 이 특징을 잘 구분하는 규칙까지 딥러닝이 한꺼번에 찾아낼 수 있습니다.
▲ 그림 16-1 전통적인 머신 러닝과 딥러닝 학습 과정