2 다운로드한 데이터 살펴보기
다운로드한 csv 파일을 판다스의 데이터 프레임 형태로 불러올 수 있다. 불러와서 shape를 사용해 데이터의 행과 열의 수를 확인해 보자.
petitions = pd.read_csv(f"{base_path}/petition.csv", index_col="article_id", parse_dates=['start', 'end']) # 데이터의 행과 열의 수 확인 petitions.shape
실행 결과
(377756, 7)
데이터가 총 377,756건이 있다. petitions.info()를 사용하면 행 개수, 데이터 개수, 데이터 타입을 알 수 있다.
# 데이터 세트의 정보를 볼 수 있다. # 어떤 열(columm)이 있고 몇 개의 데이터가 있고 어떤 타입인지 볼 수 있다. petitions.info()