더북(TheBook)

전처리 과정에 필요한 라이브러리를 임포트한다. 이전 장과 마찬가지로 데이터 분석을 위한 판다스와 수치 계산을 위한 넘파이를 불러온다. 그리고 전처리가 잘 되었는지 시각화해 확인하기 위해 시본을 불러온다. 시본은 맷플롯립 위에서 구동하므로 맷플롯립도 불러와 준비한다.

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

판다스 데이터 프레임 형태로 수집한 데이터 세트를 불러온다.

df = pd.read_csv("https://bit.ly/seoul-120-text-csv")
df.shape

실행 결과

(2645, 5)
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.