더북(TheBook)

 

1데이터의 확인과 실행

 

먼저 df_pre라는 공간에 데이터를 불러옵니다. 그런 다음 sample() 함수를 사용하여 원본 데이터의 몇 %를 사용할지를 지정합니다.

 

df_pre = pd.read_csv(’../dataset/wine.csv’, header=None)

df = df_pre.sample(frac=1)

 

sample() 함수는 원본 데이터에서 정해진 비율만큼 랜덤으로 뽑아오는 함수입니다. frac = 1이라고 지정하면 원본 데이터의 100%를 불러오라는 의미입니다. frac = 0.5로 지정하면 50%만 랜덤으로 불러옵니다. 원본 데이터를 모두 랜덤으로 불러왔으므로 그중 처음 5줄을 출력해 보겠습니다.

 

print(df.head(5))

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.