더북(TheBook)

4. 넘파이와 판다스

  • 넘파이(numpy)
    • 데이터 처리를 위한 파이썬 주요 패키지이다.
    • 수치 데이터를 처리하는 기능을 확장할 수 있다.
    • 배열 자료 구조를 지원하다.
    • 다양한 수학, 통계 함수를 지원한다.
  • 넘파이의 array
    • 배열 함수 안에 리스트를 통해 정의할 수 있다. np.array([1, 2, 3])
    • 고차원 배열을 정의할 수 있다.
    • 수치 배열의 계산이 리스트와는 다르게 이뤄지는 점에 유의해야 한다.
  • 판다스(pandas)
    • 파이썬의 기본 자료 구조는 세트, 리스트, 튜플, 딕셔너리가 있고, 넘파이에서 제공하는 배열이 있다.
    • 판다스에서는 시리즈, 데이터프레임 등의 자료 구조를 제공한다.
    • 넘파이 기능을 확장하며, 다양한 데이터를 처리할 수 있는 기능을 제공한다.

5. 시리즈(series)

  • 판다스의 1차원 자료 구조이다.
  • 인덱스를 가질 수 있다.
  • 1차원 배열의 확장 버전이다.
  • 시계열 자료를 처리할 때 유용하다.
  • 시리즈끼리 연산할 때 같은 인덱스 값끼리 계산한다.

     

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.