결과가 출력된다면 데이터 읽기에 성공한 겁니다. 결과를 보니 파일에 약 31만 개의 행이 있네요. 데이터 양이 많으므로 처음 파일을 읽을 때 시간이 좀 걸립니다.

    졔졔쌤의 조언

    인코딩 에러가 발생한다면 utf8 대신 eur-kr 또는 cp949를 넣거나 인코딩 옵션 자체를 삭제해 보세요. 사용하는 PC 환경에 따라 인코딩 옵션이 다르게 적용됩니다.

    두 번째 파일인 dong_code.csv도 읽어 봅시다. 앞서 인구 데이터를 읽을 때 fdata를 사용했으므로 dong_code.csv 파일을 읽을 때는 다른 변수를 사용해야 데이터가 겹치지 않습니다. 이번에는 f2code_data를 사용하겠습니다.

    f2 = open('dong_code.csv', encoding = 'utf8')
    code_data = csv.reader(f2)
    next(code_data)
    next(code_data)
    code_data = list(code_data)
    print(len(code_data))
    실행결과
    424

    dong_code.csv 파일에는 총 424개 행이 있습니다. 행정동 개수가 총 424개라는 의미죠. 그런데 이번에는 next(code_data)가 두 줄입니다. dong_code.csv 파일을 보면 헤더가 두 줄이고, 실제 데이터는 세 번째 행부터 있습니다. 그래서 next(code_data)를 두 번 실행해 한글 헤더와 영문 헤더를 모두 제거합니다.

    ▲ 그림 11-13 dong_code.csv 파일 헤더

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.