더북(TheBook)

결과가 출력된다면 데이터 읽기에 성공한 겁니다. 결과를 보니 파일에 약 31만 개의 행이 있네요. 데이터 양이 많으므로 처음 파일을 읽을 때 시간이 좀 걸립니다.

졔졔쌤의 조언

인코딩 에러가 발생한다면 utf8 대신 eur-kr 또는 cp949를 넣거나 인코딩 옵션 자체를 삭제해 보세요. 사용하는 PC 환경에 따라 인코딩 옵션이 다르게 적용됩니다.

두 번째 파일인 dong_code.csv도 읽어 봅시다. 앞서 인구 데이터를 읽을 때 fdata를 사용했으므로 dong_code.csv 파일을 읽을 때는 다른 변수를 사용해야 데이터가 겹치지 않습니다. 이번에는 f2code_data를 사용하겠습니다.

f2 = open('dong_code.csv', encoding = 'utf8')
code_data = csv.reader(f2)
next(code_data)
next(code_data)
code_data = list(code_data)
print(len(code_data))
실행결과
424

dong_code.csv 파일에는 총 424개 행이 있습니다. 행정동 개수가 총 424개라는 의미죠. 그런데 이번에는 next(code_data)가 두 줄입니다. dong_code.csv 파일을 보면 헤더가 두 줄이고, 실제 데이터는 세 번째 행부터 있습니다. 그래서 next(code_data)를 두 번 실행해 한글 헤더와 영문 헤더를 모두 제거합니다.

▲ 그림 11-13 dong_code.csv 파일 헤더

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.