1 데이터의 확인과 검증셋

     

    먼저 데이터를 불러와 대략적인 구조를 살펴보겠습니다.

    import pandas as pd
    
    # 깃허브에 준비된 데이터를 가져옵니다.
    !git clone https://github.com/taehojo/data.git
    
    # 와인 데이터를 불러옵니다.
    df = pd.read_csv('./data/wine.csv', header=None)
    
    # 데이터를 미리 보겠습니다.
    df

    실행 결과

     

    0

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    0

    7.4

    0.70

    0.00

    1.9

    0.076

    11.0

    34.0

    0.99780

    3.51

    0.56

    9.4

    5

    1

    1

    7.8

    0.88

    0.00

    2.6

    0.098

    25.0

    67.0

    0.99680

    3.20

    0.68

    9.8

    5

    1

    2

    7.8

    0.76

    0.04

    2.3

    0.092

    15.0

    54.0

    0.99700

    3.26

    0.65

    9.8

    5

    1

    3

    11.2

    0.28

    0.56

    1.9

    0.075

    17.0

    60.0

    0.99800

    3.16

    0.58

    9.8

    6

    1

    4

    7.4

    0.70

    0.00

    1.9

    0.076

    11.0

    34.0

    0.99780

    3.51

    0.56

    9.4

    5

    1

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    ...

    6492

    6.2

    0.21

    0.29

    1.6

    0.039

    24.0

    92.0

    0.99114

    3.27

    0.50

    11.2

    6

    0

    6493

    6.6

    0.32

    0.36

    8.0

    0.047

    57.0

    168.0

    0.99490

    3.15

    0.46

    9.6

    5

    0

    6494

    6.5

    0.24

    0.19

    1.2

    0.041

    30.0

    111.0

    0.99254

    2.99

    0.46

    9.4

    6

    0

    6495

    5.5

    0.29

    0.30

    1.1

    0.022

    20.0

    110.0

    0.98869

    3.34

    0.38

    12.8

    7

    0

    6496

    6.0

    0.21

    0.38

    0.8

    0.020

    22.0

    98.0

    0.98941

    3.26

    0.32

    11.8

    6

    0

    6497 rows × 13 columns
    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.