더북(TheBook)

헤더를 보고 각 항목(열)을 어떻게 변환해야 할지 생각해 봅시다. 먼저 네 번째 열인 총생활인구수부터 마지막 열까지는 모두 소수점이 있는 실수입니다. 따라서 읽어 들인 데이터를 float()를 사용해 실수형으로 변환해야 합니다.

그리고 두 번째와 세 번째 열은 모두 정수입니다. 따라서 int()를 사용해 정수형으로 변환하면 되죠. 그런데 날짜를 의미하는 첫 번째 열인 기준일ID는 읽어 들인 문자열 그대로 두어야 합니다. 기준일ID는 '20191201' 형태입니다. 날짜는 나중에 슬라이싱해서 연도, 월, 일을 분리합니다. 문자열이 슬라이싱하기가 편하므로 기준일ID만 문자열 그대로 두겠습니다(6장에 나온 문자열 슬라이싱을 참고하세요).

정리하면 시간대구분, 행정동코드는 정수형으로, 총생활인구수부터 마지막 열까지는 실수형으로 변환해야 합니다. 데이터 타입을 변환하는 코드는 다음과 같이 작성할 수 있습니다.

for row in data:
    row[1] = int(row[1])       # 시간대구분
    row[2] = int(row[1])       # 행정동코드
    row[3] = float(row[1])     # 총생활인구수
    row[4] = float(row[1])     # 남자0세부터9세생활인구수
    ...
    row[31] = float(row[31])   # 여자70세이상생활인구수
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.