더북(TheBook)

3 판다스를 활용한 데이터 조사

 

데이터를 잘 파악하는 것이 딥러닝을 다루는 기술의 1단계라고 했습니다. 그런데 데이터의 크기가 커지고 정보량이 많아지면 데이터를 불러오고 내용을 파악할 수 있는 효과적인 방법이 필요합니다. 이때 가장 유용한 방법이 데이터를 시각화해서 눈으로 직접 확인해 보는 것입니다. 지금부터 데이터를 불러와 그래프로 표현하는 방법을 알아보겠습니다.

데이터를 다룰 때는 데이터를 다루기 위해 만들어진 라이브러리를 사용하는 것이 좋습니다. 지금까지는 넘파이 라이브러리를 불러와 사용했는데, 넘파이의 기능을 포함하면서도 다양한 포맷의 데이터를 다루게 해 주는 판다스 라이브러리를 사용해서 데이터를 조사해 보겠습니다.

이 실습에는 판다스(pandas)와 시본(seaborn) 라이브러리가 필요합니다. 코랩은 기본으로 제공하지만, 주피터 노트북을 이용해 실습 중이라면 다음 명령으로 두 라이브러리를 설치해야 합니다.

!pip install pandas
!pip install seaborn
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.