3.11 예제 코드 정리
이번 프로젝트에서는 많은 내용을 다뤘다. 지금까지 작성한 코드를 간단히 살펴보자. 가장 먼저 데이터 전처리를 수행하는 preprocess 함수를 정의했다. 이 함수는 DataFrame을 입력받아 다음 작업을 실행한다.
• 데이터셋의 결측값을 제거한다.
• 택시 요금 이상치를 제거한다.
• 승객 수 이상치를 최빈값으로 대체한다.
• 위도 경도 이상치를 제거해 뉴욕시 경계 내 데이터만 사용한다.
이 함수는 프로젝트 폴더 아래의 utils.py 파일에서 찾을 수 있다.
다음으로 특징 공학을 수행하는 feature_engineer 함수를 정의했다. 이 함수는 DataFrame을 입력받아 다음 작업을 실행한다.
• 승차 연, 월, 일, 요일, 시각 칼럼을 추가한다.
• 승차 위치와 하차 위치 사이의 유클리드 거리를 계산해 추가한다.
• JFK, 라과디아, 뉴어크 공항과 승차 및 하차 위치 사이의 거리를 계산해 추가한다.
이 함수도 프로젝트 폴더 아래의 utils.py 파일에서 찾을 수 있다.
이와 같이 헬퍼 함수를 정의한 다음 신경망을 구현했다. 신경망을 구현한 코드는 main.py 파일에서 찾을 수 있다.