3 데이터 분석에 필요한 환경 만들기
지금까지 CSV 파일이 무엇인지 간단히 살펴봤습니다. 컴퓨터에서 CSV 파일 데이터를 다루려면 사람의 생각을 컴퓨터가 알아들을 수 있는 언어로 바꿔 줄 명령어가 필요한데, 이때 사용할 수 있는 프로그래밍 언어가 바로 ‘파이썬(Python)’입니다.
데이터 분석에는 파이썬 외에도 R이나 다른 여러 가지 도구를 쓸 수 있지만, 우리는 파이썬을 사용하도록 하겠습니다. 간결함이 매력적인 언어인 파이썬은 다양한 라이브러리를 활용하여 데이터를 분석하고 시각화하는 데 편리합니다. 하지만 필요할 때마다 라이브러리를 받아 쓰는 것이 다소 번거로울 수 있습니다. 이러한 번거로움을 덜어주는 도구가 바로 ‘아나콘다’입니다.
아나콘다를 설치하면 파이썬은 물론, 유용한 여러 가지 라이브러리를 간편하게 불러올 수 있습니다. 무엇보다 아나콘다와 함께 설치되는 ‘주피터 노트북’을 통해 쉽게 코드를 관리하고 결과를 확인할 수 있어, 데이터 분석 도구로 많이 사용됩니다.
그림 1-9 데이터 분석에 사용되는 도구들
TIP
‘라이브러리’ 또는 ‘주피터 노트북’의 개념이 잘 이해되지 않는다고요? 괜찮습니다. 이 장에서는 아나콘다 배포판을 설치하는 것까지만 알아보고, Unit 2부터 실습을 통해 차근차근 익힐 것입니다. 혹시 파이썬 프로그래밍이 처음이라면 부록의 ‘파이썬 병아리반’을 먼저 읽고 오세요.