다음 그림과 같이 그래픽으로 살펴보면 선형 회귀는 직선을 출력하고, 로지스틱 회귀는 S-커브를 출력합니다.
▲ 그림 3-22 선형 회귀와 로지스틱 회귀
이번에는 선형 회귀에 대해 코드로 확인해 보겠습니다. 캐글에서 제공하는 날씨 데이터셋을 이용할 것입니다.8
▲ 그림 3-23 선형 회귀 예제
날씨 데이터셋에는 전 세계 여러 기상 관측소에서 매일 기록된 기상 조건 정보가 포함되어 있습니다. 강수량, 강설량, 기온, 풍속 및 그 날의 뇌우 등 정보들이 포함되어 있으나, 예제에서는 최대 온도를 예측하기 때문에 최소/최대 기온(MinTemp, MaxTemp) 정보만 사용합니다.
8 호주 기상 관측소(http://www.bom.gov.au/climate/data)의 날씨 데이터를 정리한 데이터셋입니다(https://www.kaggle.com/akdagmelih/rain-prediction-logistic-regression-example/data?select=weatherAUS.csv).