3.3 뉴욕시 택시 요금 데이터셋
이번 프로젝트에서는 캐글에 공개된 뉴욕시 택시 요금 데이터셋을 사용한다. 원본 데이터는 노란 택시가 2009년부터 2015년까지 5,500만 회 운행한 기록이며 승객이 타고 내린 위치, 승객 수, 승차 시간 등을 포함한다. 이 데이터셋을 통해 빅데이터를 머신 러닝에 적용하고 지리 데이터를 시각화하는 경험을 해보자.
이번 프로젝트에서는 캐글에 공개된 뉴욕시 택시 요금 데이터셋을 사용한다. 원본 데이터는 노란 택시가 2009년부터 2015년까지 5,500만 회 운행한 기록이며 승객이 타고 내린 위치, 승객 수, 승차 시간 등을 포함한다. 이 데이터셋을 통해 빅데이터를 머신 러닝에 적용하고 지리 데이터를 시각화하는 경험을 해보자.