서울의 기온 데이터는 왜 누락되었을까요?
실행 결과
.... ['1950-08-29', '108', '23.1', '16.8', '30.4'] ['1950-08-30', '108', '24.6', '18', '32.6'] ['1950-08-31', '108', '25.4', '20.1', '32.5'] ['1950-09-01', '108', '', '', '']──▶ 기온 데이터가 누락됨! ['1950-09-02', '108', '', '', ''] (생략) ['2017-10-12', '108', '11.4', '8.8', ''] ...
이런 경우 데이터가 누락된 시기를 고려해 보면 그 이유를 알 수 있습니다. 1950년대 데이터가 누락된 이유는 6.25 전쟁 당시 데이터가 수집되지 않아서로 추측해 볼 수 있습니다. 그렇다면 2017년 10월 12일의 최고기온 데이터는 왜 누락되었을까요?
이 경우는 앞서 살펴본 상황처럼 모든 데이터가 누락된 것이 아니고, 비교적 최신 자료이므로 값을 입력하는 과정에서 생긴 오류로 추측할 수 있습니다. 이렇게 데이터는 완전무결한 것이 아니라는 점을 꼭 기억하여 데이터를 맹신하지 않기를 바랍니다.