더북(TheBook)

서울의 기온 데이터는 왜 누락되었을까요?

 

 

실행 결과

....
['1950-08-29', '108', '23.1', '16.8', '30.4']
['1950-08-30', '108', '24.6', '18', '32.6']
['1950-08-31', '108', '25.4', '20.1', '32.5']
['1950-09-01', '108', '', '', '']──▶ 기온 데이터가 누락됨!
['1950-09-02', '108', '', '', '']
(생략)
['2017-10-12', '108', '11.4', '8.8', '']
...

이런 경우 데이터가 누락된 시기를 고려해 보면 그 이유를 알 수 있습니다. 1950년대 데이터가 누락된 이유는 6.25 전쟁 당시 데이터가 수집되지 않아서로 추측해 볼 수 있습니다. 그렇다면 2017년 10월 12일의 최고기온 데이터는 왜 누락되었을까요?

이 경우는 앞서 살펴본 상황처럼 모든 데이터가 누락된 것이 아니고, 비교적 최신 자료이므로 값을 입력하는 과정에서 생긴 오류로 추측할 수 있습니다. 이렇게 데이터는 완전무결한 것이 아니라는 점을 꼭 기억하여 데이터를 맹신하지 않기를 바랍니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.