더북(TheBook)

4장

 

  1 역주 판다스에서 데이터프레임의 원소를 종종 셀이라고 부릅니다. isnull 메서드는 셀 값이 None 또는 np.nan(np.NaN)일 경우 True를 반환합니다. 넘파이의 sum 메서드와 마찬가지로 판다스의 sum 메서드는 불리언 값 True를 1로 카운팅합니다. sum 메서드의 axis 매개변수가 기본값 0일 경우 하나의 행으로, 1일 경우 하나의 열로 더해집니다. isnull 메서드의 다른 이름은 isna입니다.

 

  2 역주 3장에서 보았던 load_iris 함수처럼 사이킷런에 내장 데이터셋을 적재하는 함수에 as_frame 매개변수를 True로 지정하면 판다스 데이터프레임으로 반환합니다. 사이킷런 0.24 버전에서는 openml.org에서 데이터를 다운로드받는 fetch_openml 함수의 as_frame 매개변수 기본값이 False에서 'auto'로 바뀝니다. 'auto'일 경우 데이터가 희소하지 않으면 기본적으로 판다스 데이터프레임이 반환됩니다.

 

  3 역주 dropna 메서드의 axis 매개변수 기본값이 0입니다. inplace 매개변수를 기본값 False에서 True로 바꾸면 새로운 데이터프레임을 반환하지 않고 df 변수에 다시 매핑합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.