더북(TheBook)

코드를 실행하면 다음 그림 1-13의 차트를 출력한다.

▲ 그림 1-13 붓꽃 데이터셋의 꽃받침 너비와 길이로 그린 점차트

점차트에서 몇 가지 재미있는 점을 찾을 수 있다. 우선 붓꽃 품종에 따라 sepal_widthsepal_length의 관계가 다르다. 부채붓꽃(setosa)sepal_widthsepal_length가 상당한 선형 관계를 가지는 반면, 버시칼라(versicolor)와 버지니카(virginica)sepal_length가 부채붓꽃보다 대체로 훨씬 더 크다. 따라서 sepal_widthsepal_length는 붓꽃 품종을 구별하는 머신 러닝 모델에 반드시 포함할 중요한 특징임을 알 수 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.