4 역주 비슷하게 특정 행(예를 들어 인덱스가 2인 행)에 NaN이 있는 열을 삭제하려면 df.dropna(axis=1, subset=[2])처럼 씁니다.
5 역주 median은 데이터를 순서대로 나열했을 때 중간에 위치한 값을 의미합니다.
6 역주 순서가 있는 레이블을 다루는 문제를 순서를 가진 분류(ordinal classification) 또는 순서를 가진 회귀(ordinal regression)라고 부릅니다. 예를 들어 영화 평점을 1~5까지 다섯 개의 순서가 있는 레이블로 예측하는 문제입니다. 사이킷런은 아직 이에 대한 기능을 제공하지 않습니다. Mord 파이썬 패키지를 확인해 보세요(https://github.com/fabianp/mord).
7 역주 2장에 나온 리스트 내포와 비슷하게 중괄호 안에 포함된 for 반복문을 딕셔너리 내포라고 합니다. 여기에서는 size_mapping의 키, 값 쌍을 뒤집은 딕셔너리를 만듭니다.
8 역주 enumerate는 반복 가능한 객체(문자열, 리스트, 넘파이 배열 등)를 입력으로 받아 인덱스와 값의 튜플을 차례대로 반환하는 파이썬 내장 함수입니다.