1 데이터의 확인과 검증셋
먼저 데이터를 불러와 대략적인 구조를 살펴보겠습니다.
import pandas as pd # 깃허브에 준비된 데이터를 가져옵니다. !git clone https://github.com/taehojo/data.git # 와인 데이터를 불러옵니다. = pd.read_csv('./data/wine.csv', = ) # 데이터를 미리 보겠습니다. df
실행 결과
|
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
0 |
7.4 |
0.70 |
0.00 |
1.9 |
0.076 |
11.0 |
34.0 |
0.99780 |
3.51 |
0.56 |
9.4 |
5 |
1 |
1 |
7.8 |
0.88 |
0.00 |
2.6 |
0.098 |
25.0 |
67.0 |
0.99680 |
3.20 |
0.68 |
9.8 |
5 |
1 |
2 |
7.8 |
0.76 |
0.04 |
2.3 |
0.092 |
15.0 |
54.0 |
0.99700 |
3.26 |
0.65 |
9.8 |
5 |
1 |
3 |
11.2 |
0.28 |
0.56 |
1.9 |
0.075 |
17.0 |
60.0 |
0.99800 |
3.16 |
0.58 |
9.8 |
6 |
1 |
4 |
7.4 |
0.70 |
0.00 |
1.9 |
0.076 |
11.0 |
34.0 |
0.99780 |
3.51 |
0.56 |
9.4 |
5 |
1 |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
... |
6492 |
6.2 |
0.21 |
0.29 |
1.6 |
0.039 |
24.0 |
92.0 |
0.99114 |
3.27 |
0.50 |
11.2 |
6 |
0 |
6493 |
6.6 |
0.32 |
0.36 |
8.0 |
0.047 |
57.0 |
168.0 |
0.99490 |
3.15 |
0.46 |
9.6 |
5 |
0 |
6494 |
6.5 |
0.24 |
0.19 |
1.2 |
0.041 |
30.0 |
111.0 |
0.99254 |
2.99 |
0.46 |
9.4 |
6 |
0 |
6495 |
5.5 |
0.29 |
0.30 |
1.1 |
0.022 |
20.0 |
110.0 |
0.98869 |
3.34 |
0.38 |
12.8 |
7 |
0 |
6496 |
6.0 |
0.21 |
0.38 |
0.8 |
0.020 |
22.0 |
98.0 |
0.98941 |
3.26 |
0.32 |
11.8 |
6 |
0 |
6497 rows × 13 columns