더북(TheBook)

데이터프레임

데이터프레임(dataframe)은 2차원 자료 구조로 행과 열이 있다. 각 열은 다른 유형의 값을 가지며, 데이터 분석에서 가장 효과적으로 사용될 수 있는 자료 구조이다. 2차원의 ndarray와 유사하지만 ndarray보다 자료를 유연하게 다룰 수 있게 지원한다. 크기를 변형할 수 있어서(size mutable) 행 또는 열을 삭제하거나 추가할 수도 있다.

▲ 그림 1-28 데이터프레임 구조

그림 1-28은 행 8개와 열 4개로 이뤄진 2차원 데이터프레임이고, 이때 열은 각각 다른 형태의 값을 가질 수 있다. 또한, NA를 표현하는 것도 데이터프레임의 중요한 특징 중 하나다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.