더북(TheBook)

3.11 예제 코드 정리

이번 프로젝트에서는 많은 내용을 다뤘다. 지금까지 작성한 코드를 간단히 살펴보자. 가장 먼저 데이터 전처리를 수행하는 preprocess 함수를 정의했다. 이 함수는 DataFrame을 입력받아 다음 작업을 실행한다.

데이터셋의 결측값을 제거한다.

택시 요금 이상치를 제거한다.

승객 수 이상치를 최빈값으로 대체한다.

위도 경도 이상치를 제거해 뉴욕시 경계 내 데이터만 사용한다.

 

이 함수는 프로젝트 폴더 아래의 utils.py 파일에서 찾을 수 있다.

다음으로 특징 공학을 수행하는 feature_engineer 함수를 정의했다. 이 함수는 DataFrame을 입력받아 다음 작업을 실행한다.

승차 연, 월, 일, 요일, 시각 칼럼을 추가한다.

승차 위치와 하차 위치 사이의 유클리드 거리를 계산해 추가한다.

JFK, 라과디아, 뉴어크 공항과 승차 및 하차 위치 사이의 거리를 계산해 추가한다.

 

이 함수도 프로젝트 폴더 아래의 utils.py 파일에서 찾을 수 있다.

이와 같이 헬퍼 함수를 정의한 다음 신경망을 구현했다. 신경망을 구현한 코드는 main.py 파일에서 찾을 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.