더북(TheBook)
>>> s1 = Series(np.arange(10.0, 20.0))
>>> s1.describe()    # 시리즈 s1의 요약 정보 출력
count    10.00000
mean     14.50000
std       3.02765
min      10.00000
25%      12.25000
50%      14.50000
75%      16.75000
max      19.00000
dtype: float64

>>> summ = s1.describe()
>>> summ['mean']    # 요약 값 중에서 mean 항목 값을 출력
14.5

>>> s1 = Series(np.arange(1.0, 6), index = ['a', 'a', 'b', 'c', 'd'])
>>> s1.drop('a')    # 시리즈에서 index가 a인 값을 제외
b    3.0
c    4.0
d    5.0
dtype: float64

Note ≡

판다스(pandas)는 파이썬에서 사용하는 데이터 분석 라이브러리로, 판다스를 임포트하면 시리즈와 데이터프레임을 사용할 수 있다. 다만, 시리즈와 데이터프레임을 사용하려면 판다스에 속한 기능임을 표시해주어야 한다. 예를 들어 pandas.DataFrame 같이 판다스 소속임을 표시해야 하는데, 이를 로컬 네임스페이스(local namespace)라 한다. 만약 위 코드처럼 판다스의 다른 기능은 임포트하지 않고 이렇게 시리즈와 데이터프레임 함수만을 임포트하면 굳이 로컬 네임스페이스를 명시하지 않아도, 즉 pandas.을 붙이지 않아도 두 함수를 사용할 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.