더북(TheBook)

고등교육기관 위치 검색기 ★★

https://www.data.gov/education에서 미국 고등교육 데이터셋 CSV 파일을 내려받자. 전체 고등교육기관의 평균 경도와 위도에서 가장 가까운 위치에 있는 10개 기관을 추출하는 프로그램을 만들어 보자. 기관 간 거리의 단위는 각도(degree)로 한다. 최대한 numpy를 사용해서 데이터를 저장하고 처리해 보자. CSV 파일의 첫 번째 행은 각 칼럼의 이름이며, 파일에 포함된 일부 데이터는 사용에 적절하지 않을 수 있다.

 

주 간 유사도 계산기 ★★

미국 통계청은 주(state) 간 인구 이동 요약 정보를 제공한다( goo.gl/OlMKxf에서 최신 XLS 파일을 내려받아 엑셀이나 OpenOff ice Calc로 연 후 CSV 파일로 내보내 저장한다). 인구 이동 관점에서 가장 유사한 주 쌍(pairs)을 추출하는 프로그램을 구현해 보자. PX가 도시 X에서 이동한 전체 인구를, N은 해당 주를 제외한 전체 주의 개수를 의미한다. PX/N보다 많은 수의 사람이 도시 X에서 도시 Y로 이동했다면 도시 X와 도시 Y는 유사하다고 판정한다. numpy를 최대한 활용해서 데이터를 처리하고 가공해 보자. 가장 유사한 도시 쌍들은 같은 연안에 위치하는가?

 


* 적분 함수 계산법으로 얇게 썬 것을 다시 쌓아서 서로 합치는 것

* 편미분 다변수 함수의 특정 변수를 제외한 나머지 변수를 상수로 인식해 미분하는 것

* 미분적분의 반대말. 말 그대로 미세하게 쪼개는 것으로 순간변화율

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.