더북(TheBook)

 

6잘못 그은 선 바로잡기

 

우리는 앞서 기울기 a와 y 절편 b를 찾기 위해 최소 제곱법을 사용했습니다. 하지만 이는 변수가 ‘공부한 시간’ 하나뿐일 때였습니다. 2장에서 살펴본 폐암 수술 환자의 생존율 데이터를 보면, 입력 데이터의 종류가 17개나 됩니다. 모든 딥러닝 프로젝트는 이처럼 여러 개의 입력 변수를 다룹니다. 따라서 기울기 a와 y 절편 b를 찾아내는 다른 방법이 필요합니다.

가장 많이 사용하는 방법은 ‘일단 그리고 조금씩 수정해 나가기’ 방식입니다. 가설을 하나 세운 뒤 이 값이 주어진 요건을 충족하는지 판단하여 조금씩 변화를 주고, 이 변화가 긍정적이면 오차가 최소가 될 때까지 이 과정을 계속 반복하는 방법입니다. 이는 딥러닝을 가능하게 해 주는 가장 중요한 원리 중 하나입니다.

그런데 선을 긋고 나서 수정하는 과정에서 빠지면 안 되는 것이 있습니다. 나중에 그린 선이 먼저 그린 선보다 더 좋은지 나쁜지를 판단하는 방법입니다. 즉, 각 선의 오차를 계산할 수 있어야 하고, 오차가 작은 쪽으로 바꾸는 알고리즘이 필요한 것이지요.

그럼 지금부터 오차를 계산하는 방법을 알아보겠습니다. 앞서 나온 공부한 시간과 성적의 관계도를 다시 한번 볼까요?

 

054

그림 3-5 공부한 시간과 성적의 관계도

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.