이 파일은 2019년 10월부터 12월까지 3개월간의 실제 카드 이용내역입니다. 수많은 텍스트가 행마다 쉼표(,)로 구분되어 있는데, 내용을 보기가 조금 불편하죠.
card.csv 파일을 메모장이 아닌 엑셀로 열어 봅시다. 앞에서와 마찬가지로 파일을 선택한 상태에서 [마우스 오른쪽 버튼 클릭 → 연결 프로그램 → Excel]을 눌러 파일을 엽니다(엑셀 프로그램이 없는 경우 열어 보지 않아도 됩니다).
▲ 그림 9-2 엑셀로 CSV 파일 열기
카드 이용내역이 표 형태로 나옵니다. 조금 더 보기 편하죠? 파일에서 첫 번째 행은 표의 헤더(머리글 행)에 해당하고, 두 번째 행부터 실제 데이터가 되는 카드 이용내역입니다. 각 행은 한 건의 카드 이용내역 정보를 담고 있습니다. 메모장에서 쉼표로 구분한 각 행의 텍스트는 칸으로 구분됩니다. 헤더를 보면 첫 번째 열(A열)이 이용일시, 두 번째 열(B열)이 승인번호, 마지막 열(I열)이 매입상태입니다.
결국 CSV 파일은 행과 열이 있는 표 형식의 데이터를 표현한 것임을 알 수 있습니다. 이런 행과 열이 있는 데이터 타입을 앞 장에서 배운 적이 있죠? 바로 이차원 리스트입니다. 그래서 파이썬 프로그램에서는 CSV 파일을 읽은 후, 이차원 리스트로 데이터 타입을 변경해 데이터 분석을 진행합니다.