더북(TheBook)

LESSON 02
넘파이

넘파이(NumPy)는 Numerical Python의 줄임말로 고성능 수치 계산을 쉽게 하도록 도와주는 라이브러리다. 자연어를 기계가 이해할 수 있는 벡터 형태로 바꾸려면 다차원 계산이 필수인데 파이썬의 리스트와 비슷한 넘파이의 N차원 배열 객체(ndarray)를 통해 다차원 배열을 생성하고 계산할 수 있다. 이 책은 텍스트 분석을 다루지만, 머신러닝이나 딥러닝을 활용해 텍스트 데이터를 분석할 때는 넘파이의 ndarray 형태로 가공해서 사용할 것이다.

또한, 앞에서 배운 판다스가 엑셀처럼 행과 열을 사용해 2차원 계산을 한다면 넘파이는 3차원 이상의 배열 연산이 가능하다. 따라서 판다스는 물론이고 뒤에서 배울 맷플롯립 등에서도 넘파이를 먼저 설치하고 그 위에서 구동하는 예시가 많다.

이외에도 선형대수학, 푸리에 변환, 난수 생성 등 쓰임이 많지만 이 책에서는 ndarray의 개념, 인덱싱, 슬라이싱과 연산 등 치트시트에 있는 내용을 중심으로 10분 만에 넘파이 배열을 생성하는 방법을 알아보려고 한다.

먼저 넘파이를 실행하기 위해 임포트해 보자. 판다스를 pd라는 별칭으로 부른 것처럼 넘파이는 np라는 별칭으로 부른다.

import numpy as np
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.