더북(TheBook)

내려받은 예제 파일의 data 폴더에서 상품에 대한 연 지출 데이터(sales data.csv) 파일을 불러옵니다.10

코드 3-30 상품에 대한 연 지출 데이터(sales data.csv) 호출

data = pd.read_csv('../chap03/data/sales data.csv')
data.head()

코드를 실행하면 다음 그림과 같이 다양한 제품에 대한 연 지출을 확인할 수 있습니다.

▲ 그림 3-32 K-평균 군집화 예제 데이터

불러온 데이터셋은 도매 유통업체의 고객 데이터로 신선한 제품, 유제품, 식료품 등에 대한 연간 지출 정보가 포함되어 있습니다.

Channel: 고객 채널(호텔/레스토랑/카페) 또는 소매 채널(명목형 데이터)

Region: 고객 지역(명목형 데이터)

Fresh: 신선한 제품에 대한 연간 지출(연속형 데이터)

Milk: 유제품에 대한 연간 지출(연속형 데이터)

Grocery: 식료품에 대한 연간 지출(연속형 데이터)

Frozen: 냉동 제품에 대한 연간 지출(연속형 데이터)

Detergents_Paper: 세제 및 종이 제품에 대한 연간 지출(연속형 데이터)

Delicassen: 조제 식품에 대한 연간 지출(연속형 데이터)

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.