더북(TheBook)

이 파일은 2019년 10월부터 12월까지 3개월간의 실제 카드 이용내역입니다. 수많은 텍스트가 행마다 쉼표(,)로 구분되어 있는데, 내용을 보기가 조금 불편하죠.

card.csv 파일을 메모장이 아닌 엑셀로 열어 봅시다. 앞에서와 마찬가지로 파일을 선택한 상태에서 [마우스 오른쪽 버튼 클릭 → 연결 프로그램 → Excel]을 눌러 파일을 엽니다(엑셀 프로그램이 없는 경우 열어 보지 않아도 됩니다).

▲ 그림 9-2 엑셀로 CSV 파일 열기

카드 이용내역이 표 형태로 나옵니다. 조금 더 보기 편하죠? 파일에서 첫 번째 행은 표의 헤더(머리글 행)에 해당하고, 두 번째 행부터 실제 데이터가 되는 카드 이용내역입니다. 각 행은 한 건의 카드 이용내역 정보를 담고 있습니다. 메모장에서 쉼표로 구분한 각 행의 텍스트는 칸으로 구분됩니다. 헤더를 보면 첫 번째 열(A열)이 이용일시, 두 번째 열(B열)이 승인번호, 마지막 열(I열)이 매입상태입니다.

결국 CSV 파일은 행과 열이 있는 표 형식의 데이터를 표현한 것임을 알 수 있습니다. 이런 행과 열이 있는 데이터 타입을 앞 장에서 배운 적이 있죠? 바로 이차원 리스트입니다. 그래서 파이썬 프로그램에서는 CSV 파일을 읽은 후, 이차원 리스트로 데이터 타입을 변경해 데이터 분석을 진행합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.