여기서 [ ]에 들어갈 내용을 ‘정보’라고 합니다. 머신 러닝과 딥러닝은 이 정보가 필요합니다. 정보를 정확히 준비해 놓기만 하면 성적을 예측하는 방정식을 만들 수도 있습니다.
이 단순한 정의를 이번에는 좀 더 수학적인 언어로 표현해 보겠습니다. 성적을 변하게 하는 ‘정보’ 요소를 x라고 하고, 이 x 값에 따라 변하는 ‘성적’을 y라고 합시다. 이를 정의하면 ‘x 값이 변함에 따라 y 값도 변한다’가 됩니다. 이 정의 안에서 독립적으로 변할 수 있는 값 x를 독립 변수라고 합니다. 또한, 이 독립 변수에 따라 종속적으로 변하는 y를 종속 변수라고 합니다. 선형 회귀란 독립 변수 x를 사용해 종속 변수 y의 움직임을 예측하고 설명하는 작업을 의미합니다.
독립 변수가 x 하나뿐이어서 이것만으로 정확히 설명할 수 없을 때는 x1, x2, x3 등 x 값을 여러 개 준비해 놓을 수도 있습니다. 하나의 x 값만으로도 y 값을 설명할 수 있다면 단순 선형 회귀(simple linear regression)라고 합니다. 또한, x 값이 여러 개 필요하다면 다중 선형 회귀(multiple linear regression)라고 합니다.