더북(TheBook)

  9 역주 LabelEncoder 객체의 classes_ 속성에 각 클래스의 레이블이 저장되어 있습니다.

 

10 역주 한 열이 다른 열에 의존적이거나 열 값이 모두 0인 경우를 열 랭크 부족(column rank deficient)이라고 합니다. 사이킷런이 사용하는 LAPACK 라이브러리는 이런 경우를 허용하므로 랭크 부족을 신경 쓰지 않아도 됩니다.

 

11 역주 drop='first'로 설정하면 인코딩된 특성 중 첫 번째 열을 삭제합니다. drop='if_binary'로 설정하면 두 개의 범주를 가진 특성일 경우에만 인코딩된 첫 번째 열을 삭제합니다.

 

12 역주 이 테이블에는 총 14개의 열이 있습니다. 첫 번째 열이 클래스 레이블이고 그다음 13개의 열이 특성에 해당합니다.

 

13 역주 이 글은 역자의 블로그에 번역되어 있습니다(https://bit.ly/2pUx9AA).

 

14 역주 소-최대 스케일 변환은 데이터셋에 비정상적으로 아주 큰 값이나 아주 작은 값이 들어 있을 때 다른 샘플들을 좁은 구간에 촘촘하게 모으게 만듭니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.