전처리 과정에 필요한 라이브러리를 임포트한다. 이전 장과 마찬가지로 데이터 분석을 위한 판다스와 수치 계산을 위한 넘파이를 불러온다. 그리고 전처리가 잘 되었는지 시각화해 확인하기 위해 시본을 불러온다. 시본은 맷플롯립 위에서 구동하므로 맷플롯립도 불러와 준비한다.
import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt
판다스 데이터 프레임 형태로 수집한 데이터 세트를 불러온다.
df = pd.read_csv("https://bit.ly/seoul-120-text-csv") df.shape
실행 결과
(2645, 5)