더북(TheBook)

sns.pairplot으로 멋진 그래프 묶음을 그릴 수 있습니다. 붓꽃 종류별로 다른 색으로 칠한 히스토그램이 좌상단부터 우하단까지 대각선을 따라 그려집니다. 대각선 밖에 있는 그래프는 특성 페어의 산포도입니다. 각 페어의 산포도는 대각선을 기준으로 위와 아래에 총 두 개씩 그려집니다. 이들은 축만 바뀌어 있을 뿐 완전히 동일한 그래프입니다. 예를 들어 우하단 가장자리 근처에 있는 타깃에 대한 꽃잎 너비 산포도와 그 대각선 맞은편에 위치한 꽃잎 너비에 대한 타깃 산포도를 봅시다. 가로축과 세로축을 뒤바꾸면 상하로 향하는 데이터가 좌우로 방향을 바꿉니다.

그래프들을 살펴보면 파란색 집단(0번째 타깃)이 다른 집단에 비해 도드라집니다. 이것은 어떤 종류의 붓꽃일까요?

 

In [4]:

print('targets: {}'.format(iris.target_names), iris.target_names[0], sep="\n")
targets: ['setosa' 'versicolor' 'virginica']
setosa

 

아, 세토사는 다른 두 붓꽃에서 분리시키기가 수월해 보이는군요. 버시컬러와 버지니카는 조금 더 서로 엉켜 있습니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.