더북(TheBook)

선형 회귀에서 입력(독립) 변수와 타깃(종속) 변수는 반드시 수치형(numeric)이어야 합니다. 이들이 형성하는 최상의 관계는 각 데이터 포인트와 직선 사이 수직 거리의 제곱 합을 최소화함으로써 구할 수 있습니다. 예측 변수와 타깃 변수가 형성하는 관계는 선형(linear)이라고 가정합니다. 예를 들어, 연구 개발 투자액을 늘리는 만큼 매출액이 증가한다고 보는 것입니다.

더 구체적인 사례를 살펴봅시다. 마케팅 지출액과 매출액 간 관계를 공식으로 표현해 볼까요? 이 두 변수는 서로 직접 연관되어 있습니다. 다음 2차원 플롯에서 마케팅 지출액과 매출액은 빨간색 다이아몬드로 표시되어 있습니다. 데이터 포인트들을 통과하는 검은색 직선을 그으면 두 변수 사이의 관계를 가장 잘 표현할 수 있습니다.

▲ 그림 7-9 선형적 관계를 갖는 두 변수

직선을 긋고 나면, 마케팅 지출액과 매출액 사이의 관계를 수학적으로 표현할 수 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.