참고로 붓꽃 데이터셋은 다음 특성들로 구성되어 있습니다.
▼ 표 8-3 붓꽃 데이터셋
구분 |
설명 |
caseno |
일련번호(1~150의 숫자) |
Sepal Length |
꽃받침 길이 정보 |
Sepal Width |
꽃받침 너비 정보 |
Petal Length |
꽃잎 길이 정보 |
Petal Width |
꽃잎 너비 정보 |
Species |
꽃의 종류(setosa, versicolor, virginica) |
데이터프레임(DataFrame)에 데이터셋을 저장하고 정답(target)에 ‘label’이라는 이름을 붙입니다.
코드 8-2 데이터프레임에 데이터셋 저장
df = pd.DataFrame(iris.data, columns=iris.feature_names) ------ 붓꽃 데이터셋을 df(dataframe)에 저장
df = df.astype(float) ------ 데이터 형식을 float으로 변환
df['label'] = iris.target ------ 붓꽃 데이터셋의 정답에 ‘label’이라는 이름을 붙임
df['label'] = df.label.replace(dict(enumerate(iris.target_names))) ------ ①