A.3 데이터 담당, Pandas
Pandas는 미국의 프로그래머이자 사업가인 웨스 맥키니(Wes McKinney)가 개발하고 공개한 파이썬의 데이터 분석 라이브러리다. Pandas는 마치 실무에서 사용되는 엑셀 같은 역할을 한다. 배열이나 행렬을 이용한 데이터를 처리할 때 Pandas만큼 편리하고 강력한 라이브러리는 모든 언어를 통틀어 찾아보기 힘들다.
▲ 그림 A-13 웨스 맥키니(wesmckinney.com/)
웨스 맥키니는 2007년 MIT 수학 학부 과정을 마친 뒤 코네티컷주 그리니치의 AQR 캐피털 매니지먼트에서 계량분석 업무를 수행했다. 그가 Pandas를 개발하게 된 이유는 거추장스러운 데이터 분석 툴에 실망했기 때문인 것으로 알려져 있다.
AQR 동료와 함께 창업한 데이터패드(DataPad)는 2014년 클라우데라(Cloudera)에 인수됐다. 그 후 아파치 소프트웨어 재단(Apache Software Foundation)의 아파치 애로우와 아파치 파켓 프로젝트를 위한 프로젝트 관리 위원회(Project Management Committees for the Apache Arrow and Apache Parquet projects)에 참여하면서 빅데이터 기술에 관여하게 됐다. 현재 웨스 맥키니는 파이썬과 R을 위한 데이터 사이언스 툴을 개발하는 비영리 단체 우르사 랩(Ursa Labs)의 이사다.
Pandas의 백미는 데이터프레임이므로 데이터프레임을 중심으로 빠르게 알아보자.