>>> s1 = Series(np.arange(10.0, 20.0)) >>> s1.describe() # 시리즈 s1의 요약 정보 출력 count 10.00000 mean 14.50000 std 3.02765 min 10.00000 25% 12.25000 50% 14.50000 75% 16.75000 max 19.00000 dtype: float64 >>> summ = s1.describe() >>> summ['mean'] # 요약 값 중에서 mean 항목 값을 출력 14.5 >>> s1 = Series(np.arange(1.0, 6), index = ['a', 'a', 'b', 'c', 'd']) >>> s1.drop('a') # 시리즈에서 index가 a인 값을 제외 b 3.0 c 4.0 d 5.0 dtype: float64
Note ≡
판다스(pandas)는 파이썬에서 사용하는 데이터 분석 라이브러리로, 판다스를 임포트하면 시리즈와 데이터프레임을 사용할 수 있다. 다만, 시리즈와 데이터프레임을 사용하려면 판다스에 속한 기능임을 표시해주어야 한다. 예를 들어 pandas.DataFrame 같이 판다스 소속임을 표시해야 하는데, 이를 로컬 네임스페이스(local namespace)라 한다. 만약 위 코드처럼 판다스의 다른 기능은 임포트하지 않고 이렇게 시리즈와 데이터프레임 함수만을 임포트하면 굳이 로컬 네임스페이스를 명시하지 않아도, 즉 pandas.을 붙이지 않아도 두 함수를 사용할 수 있다.