더북(TheBook)

8.2 딥러닝의 배경 및 개요

이번 장에서는 현재 많은 인기를 얻고 있는 대표적인 머신 러닝 기법인 딥러닝에 대해 구체적으로 살펴보고자 한다. 딥러닝은 인공 신경망의 한 갈래이기 때문에 인공 신경망의 개요에 대해서 살펴본다. 앞서 설명한 바와 같이 우리가 접하는 데이터 분석의 문제는 바꿔 말해, 추론과 예측을 위한 머신 러닝의 문제는 모두 주어진 X로부터 Y와의 관계를 알아내거나, 주어진 XY를 예측하고자 하는 것이다. 즉, XY의 관계를 찾아 Y를 예측하는 데에 활용하는 것이 머신 러닝 중 지도 학습의 핵심이 된다. 앞장에서 살펴보았던 회귀 분석은 XY의 관계를 직선식으로 나타냈으며, 트리(tree) 계열의 기법은 간단한 규칙들로 그 관계를 나타내기도 한다. 이때 XY의 관계가 잘 나타날 수도 있지만, 경우에 따라서는 그렇지 못할 수도 있으니 기존과 다른 방식으로 XY의 관계를 찾고자 한다.

그림 8-9을 살펴보자. 각 동그라미를 노드라고 부르며 변수 하나를 의미한다. 좌측의 주어진 X(입력)는 Y(출력)와 바로 피팅되지 않고 한 단계를 거치게 된다. 그림에서의 화살표는 각 변수 X에 적용될 가중치라고 생각할 수 있다. 그리고 각 변수 X에 적용된 가중치는 중간 단계에 있는 노드의 입력 값이 된다. 즉, 주어진 문제는 X로부터 Y의 관계를 찾는 것이나, 그림 8-9에서는 X를 적절하게 변환하여 새로운 변수들을 만들어 내고, 그 변수들과 Y를 적합시키는 것이다.

이번에는 그림 8-9에서 중간 단계의 노드 하나를 잘 살펴보자. 이 노드는 입력층에 있는 각 노드에 가중치가 적용된 값들의 합을 입력 값으로 받는다. 입력 받은 값은 노드 내 어떤 기준(예를 들어 입력 값의 합이 0.5보다 크면 사용, 아니면 버리기 등)에 의해 소화될 것이고, 이 값을 그대로 혹은 약간 변환하여 출력한다. 이러한 노드의 작동 원리는 인간 뇌의 뉴런을 모방하였다. 그림 8-9는 이러한 노드들이 X에서 Y의 방향으로 복잡하게 연결된 상태를 나타내고, 이를 인공 신경망(artificial neural network)이라 부르며 행렬로 표현된 X와 가중치의 행렬곱으로 계산된다.

▲ 그림 8-9 인공 신경망 예

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.