더북(TheBook)

1 데이터의 확인과 검증셋

 

먼저 데이터를 불러와 대략적인 구조를 살펴보겠습니다.

import pandas as pd

# 깃허브에 준비된 데이터를 가져옵니다.
!git clone https://github.com/taehojo/data.git

# 와인 데이터를 불러옵니다.
df = pd.read_csv('./data/wine.csv', header=None)

# 데이터를 미리 보겠습니다.
df

실행 결과

 

0

1

2

3

4

5

6

7

8

9

10

11

12

0

7.4

0.70

0.00

1.9

0.076

11.0

34.0

0.99780

3.51

0.56

9.4

5

1

1

7.8

0.88

0.00

2.6

0.098

25.0

67.0

0.99680

3.20

0.68

9.8

5

1

2

7.8

0.76

0.04

2.3

0.092

15.0

54.0

0.99700

3.26

0.65

9.8

5

1

3

11.2

0.28

0.56

1.9

0.075

17.0

60.0

0.99800

3.16

0.58

9.8

6

1

4

7.4

0.70

0.00

1.9

0.076

11.0

34.0

0.99780

3.51

0.56

9.4

5

1

...

...

...

...

...

...

...

...

...

...

...

...

...

...

6492

6.2

0.21

0.29

1.6

0.039

24.0

92.0

0.99114

3.27

0.50

11.2

6

0

6493

6.6

0.32

0.36

8.0

0.047

57.0

168.0

0.99490

3.15

0.46

9.6

5

0

6494

6.5

0.24

0.19

1.2

0.041

30.0

111.0

0.99254

2.99

0.46

9.4

6

0

6495

5.5

0.29

0.30

1.1

0.022

20.0

110.0

0.98869

3.34

0.38

12.8

7

0

6496

6.0

0.21

0.38

0.8

0.020

22.0

98.0

0.98941

3.26

0.32

11.8

6

0

6497 rows × 13 columns
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.