더북(TheBook)

3 데이터 분석에 필요한 환경 만들기

지금까지 CSV 파일이 무엇인지 간단히 살펴봤습니다. 컴퓨터에서 CSV 파일 데이터를 다루려면 사람의 생각을 컴퓨터가 알아들을 수 있는 언어로 바꿔 줄 명령어가 필요한데, 이때 사용할 수 있는 프로그래밍 언어가 바로 ‘파이썬(Python)’입니다.

데이터 분석에는 파이썬 외에도 R이나 다른 여러 가지 도구를 쓸 수 있지만, 우리는 파이썬을 사용하도록 하겠습니다. 간결함이 매력적인 언어인 파이썬은 다양한 라이브러리를 활용하여 데이터를 분석하고 시각화하는 데 편리합니다. 하지만 필요할 때마다 라이브러리를 받아 쓰는 것이 다소 번거로울 수 있습니다. 이러한 번거로움을 덜어주는 도구가 바로 ‘아나콘다’입니다.

아나콘다를 설치하면 파이썬은 물론, 유용한 여러 가지 라이브러리를 간편하게 불러올 수 있습니다. 무엇보다 아나콘다와 함께 설치되는 ‘주피터 노트북’을 통해 쉽게 코드를 관리하고 결과를 확인할 수 있어, 데이터 분석 도구로 많이 사용됩니다.

그림 1-9 데이터 분석에 사용되는 도구들

 

TIP

‘라이브러리’ 또는 ‘주피터 노트북’의 개념이 잘 이해되지 않는다고요? 괜찮습니다. 이 장에서는 아나콘다 배포판을 설치하는 것까지만 알아보고, Unit 2부터 실습을 통해 차근차근 익힐 것입니다. 혹시 파이썬 프로그래밍이 처음이라면 부록의 ‘파이썬 병아리반’을 먼저 읽고 오세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.