더북(TheBook)

16. 데이터프레임을 다양하게 생성해보기

# 판다스에서 시리즈와 데이터프레임 함수 불러오기
>>> from pandas import Series, DataFrame
# 딕셔너리로부터 데이터프레임을 생성
>>> raw_data = {'col0': [1, 2, 3, 4],
>>>     'col1': [10, 20, 30, 40],
>>>     'col2': [100, 200, 300, 400]}
>>> data = DataFrame(raw_data)
>>> print(data)
    col0   col1   col2
0     1     10    100
1     2     20    200
2     3     30    300
3     4     40    400
>>> a = np.array([[1.0, 2], [3, 4]])    # 배열로부터 데이터프레임을 생성
>>> df = DataFrame(a, columns=['dogs', 'cats'], index=['Alice', 'Bob'])
>>> print(df)
        dogs   cats
Alice    1.0    2.0
Bob      3.0    4.0

Note ≡

데이터프레임은 인덱스가 같은 여러 개의 시리즈 객체로 구성된 자료 구조이다.

 

▲ 그림 1-30 데이터프레임의 자료 구조

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.