더북(TheBook)

참고로 붓꽃 데이터셋은 다음 특성들로 구성되어 있습니다.

▼ 표 8-3 붓꽃 데이터셋

구분

설명

caseno

일련번호(1~150의 숫자)

Sepal Length

꽃받침 길이 정보

Sepal Width

꽃받침 너비 정보

Petal Length

꽃잎 길이 정보

Petal Width

꽃잎 너비 정보

Species

꽃의 종류(setosa, versicolor, virginica)

데이터프레임(DataFrame)에 데이터셋을 저장하고 정답(target)에 ‘label’이라는 이름을 붙입니다.

코드 8-2 데이터프레임에 데이터셋 저장

df = pd.DataFrame(iris.data, columns=iris.feature_names) ------ 붓꽃 데이터셋을 df(dataframe)에 저장
df = df.astype(float) ------ 데이터 형식을 float으로 변환
df['label'] = iris.target ------ 붓꽃 데이터셋의 정답에 ‘label’이라는 이름을 붙임
df['label'] = df.label.replace(dict(enumerate(iris.target_names))) ------ ①
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.