특성 선별하기
우리가 풀려는 문제의 맥락과 관련한 특성을 선별하는 과정을 특성 선별(feature selection)이라고 합니다. 특성 선별은 특성 엔지니어링에서 필수입니다.
데이터 파일을 불러오고 나면 고객 식별자인 User ID는 훈련에 사용하지 않는 정보이므로 삭제합니다.
[in :]
dataset = dataset.drop(columns=['User ID'])
데이터를 일부 출력해서 확인해 봅니다.
[in :]
dataset.head(5)
[out:]
다음은 이 데이터를 전처리할 차례입니다.