16. 데이터프레임을 다양하게 생성해보기
# 판다스에서 시리즈와 데이터프레임 함수 불러오기 >>> from pandas import Series, DataFrame # 딕셔너리로부터 데이터프레임을 생성 >>> raw_data = {'col0': [1, 2, 3, 4], >>> 'col1': [10, 20, 30, 40], >>> 'col2': [100, 200, 300, 400]} >>> data = DataFrame(raw_data) >>> print(data) col0 col1 col2 0 1 10 100 1 2 20 200 2 3 30 300 3 4 40 400 >>> a = np.array([[1.0, 2], [3, 4]]) # 배열로부터 데이터프레임을 생성 >>> df = DataFrame(a, columns=['dogs', 'cats'], index=['Alice', 'Bob']) >>> print(df) dogs cats Alice 1.0 2.0 Bob 3.0 4.0
Note ≡
데이터프레임은 인덱스가 같은 여러 개의 시리즈 객체로 구성된 자료 구조이다.
▲ 그림 1-30 데이터프레임의 자료 구조