더북(TheBook)

15.1.1 머신 러닝 개요

머신 러닝(machine learning)이란 주어진 데이터를 분석하여 규칙성, 패턴 등을 찾고, 이를 이용하여 의미 있는 정보를 추출하는 과정을 말합니다. 예를 들어 다수의 사과와 바나나 사진으로부터 사과와 바나나를 구분할 수 있는 특징 또는 규칙을 찾고, 이를 이용하여 새로운 사진이 들어왔을 때 이것이 사과인지 또는 바나나인지를 판별하는 작업이 머신 러닝이 하는 일입니다. 이때 데이터로부터 규칙을 찾아내는 과정을 학습(train) 또는 훈련이라고 하고, 학습에 의해 결정된 규칙을 모델(model)이라고 합니다. 그리고 새로운 데이터를 학습된 모델에 입력으로 전달하고 결과를 판단하는 과정을 예측(predict) 또는 추론(inference)이라고 합니다.

머신 러닝은 크게 지도 학습(supervised learning)과 비지도 학습(unsupervised learning)으로 구분합니다. 지도 학습은 정답을 알고 있는 데이터를 이용하여 학습을 진행하는 방식입니다. 이때 훈련 데이터에 대한 정답에 해당하는 내용을 레이블(label)이라고 합니다. 예를 들어 사과 사진과 바나나 사진을 구분하기 위해 지도 학습을 수행하려면 각각의 사진이 사과 사진인지 바나나 사진인지를 함께 알려 주어야 합니다. 이 경우 머신 러닝 알고리즘은 사과 사진과 바나나 사진을 구분 지을 수 있는 규칙을 찾기 위해 수학적 또는 논리적 연산을 수행합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.