더북(TheBook)

DataFrame으로 가져오는 데 성공했다면 이제 데이터를 다룰 준비가 됐다. 먼저 가볍게 훑어 보자. 데이터를 본격적으로 사용하기 전에 데이터 유형을 잘 파악하는 게 중요하다.

print(df.info())

▲ 그림 1-9 붓꽃 데이터셋 정보

데이터셋에는 로우가 150개, 숫자 칼럼이 네 개(sepal_length, sepal_width, petal_length, petal_width) 있다. 마지막 칼럼은 숫자가 아닌 범주형 변수로, 꽃의 클래스(즉, 꽃의 품종) 정보를 나타낸다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.