4 pandas로 인구 구조 분석하기
지금까지 pandas 라이브러리 사용법을 살펴보았습니다. 이제 Unit 14에서 파이썬 기본 문법과 numpy 라이브러리를 활용해서 만들었던 데이터 프로젝트를 pandas 라이브러리로 구현해 보겠습니다. 알고리즘은 Unit 14에서 작성했던 것을 그대로 가져왔습니다.
1 | 데이터를 읽어온다.
➊ 전체 데이터를 총 인구수로 나누어 비율로 변환한다.
➋ 총인구수와 연령구간인구수를 삭제한다.
2 | 궁금한 지역의 이름을 입력받는다.
3 | 궁금한 지역의 인구 구조를 저장한다.
4 | 궁금한 지역의 인구 구조와 가장 비슷한 인구 구조를 가진 지역을 찾는다.
➊ 전국의 모든 지역 중 한 곳(B)을 선택한다.
➋ 궁금한 지역 A의 0세 인구 비율에서 B의 0세 인구 비율을 뺀다.
➌ ➋를 100세 이상 인구수에 해당하는 값까지 반복한 후 차이의 제곱을 모두 더한다.
➍ 전국의 모든 지역에 대해 반복하며 그 차이가 가장 작은 지역을 찾는다.
5 | 가장 비슷한 곳의 인구 구조와 궁금한 지역의 인구 구조를 시각화한다.