필요한 라이브러리를 호출합니다.
코드 3-22 라이브러리 호출
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as seabornInstance
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn import metrics
%matplotlib inline
내려받은 예제 파일의 data 폴더에서 날씨 데이터셋 weather.csv 파일을 불러옵니다.
코드 3-23 weather.csv 파일 불러오기
dataset = pd.read_csv('../chap3/data/weather.csv')
MinTemp와 MaxTemp 데이터 간 분포를 확인하고자 2D 그래프로 시각화합니다.
코드 3-24 데이터 간 관계를 시각화로 표현
dataset.plot(x='MinTemp', y='MaxTemp', style='o')
plt.title('MinTemp vs MaxTemp')
plt.xlabel('MinTemp')
plt.ylabel('MaxTemp')
plt.show()