4. 넘파이와 판다스
- 넘파이(numpy)
- 데이터 처리를 위한 파이썬 주요 패키지이다.
- 수치 데이터를 처리하는 기능을 확장할 수 있다.
- 배열 자료 구조를 지원하다.
- 다양한 수학, 통계 함수를 지원한다.
- 넘파이의 array
- 배열 함수 안에 리스트를 통해 정의할 수 있다. 예 np.array([1, 2, 3])
- 고차원 배열을 정의할 수 있다.
- 수치 배열의 계산이 리스트와는 다르게 이뤄지는 점에 유의해야 한다.
- 판다스(pandas)
- 파이썬의 기본 자료 구조는 세트, 리스트, 튜플, 딕셔너리가 있고, 넘파이에서 제공하는 배열이 있다.
- 판다스에서는 시리즈, 데이터프레임 등의 자료 구조를 제공한다.
- 넘파이 기능을 확장하며, 다양한 데이터를 처리할 수 있는 기능을 제공한다.
5. 시리즈(series)
- 판다스의 1차원 자료 구조이다.
- 인덱스를 가질 수 있다.
- 1차원 배열의 확장 버전이다.
- 시계열 자료를 처리할 때 유용하다.
- 시리즈끼리 연산할 때 같은 인덱스 값끼리 계산한다.