2 다운로드한 데이터 살펴보기

     

    다운로드한 csv 파일을 판다스의 데이터 프레임 형태로 불러올 수 있다. 불러와서 shape를 사용해 데이터의 행과 열의 수를 확인해 보자.

    petitions = pd.read_csv(f"{base_path}/petition.csv", index_col="article_id",
                        parse_dates=['start', 'end'])
     
    # 데이터의 행과 열의 수 확인
    petitions.shape

    실행 결과

    (377756, 7)

     

    데이터가 총 377,756건이 있다. petitions.info()를 사용하면 행 개수, 데이터 개수, 데이터 타입을 알 수 있다.

    # 데이터 세트의 정보를 볼 수 있다.
    # 어떤 열(columm)이 있고 몇 개의 데이터가 있고 어떤 타입인지 볼 수 있다.
    petitions.info()
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.