더북(TheBook)

2 다운로드한 데이터 살펴보기

 

다운로드한 csv 파일을 판다스의 데이터 프레임 형태로 불러올 수 있다. 불러와서 shape를 사용해 데이터의 행과 열의 수를 확인해 보자.

petitions = pd.read_csv(f"{base_path}/petition.csv", index_col="article_id",
                    parse_dates=['start', 'end'])
 
# 데이터의 행과 열의 수 확인
petitions.shape

실행 결과

(377756, 7)

 

데이터가 총 377,756건이 있다. petitions.info()를 사용하면 행 개수, 데이터 개수, 데이터 타입을 알 수 있다.

# 데이터 세트의 정보를 볼 수 있다.
# 어떤 열(columm)이 있고 몇 개의 데이터가 있고 어떤 타입인지 볼 수 있다.
petitions.info()
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.