더북(TheBook)

K-평균 군집화 예제로 자세히 알아보겠습니다. 앞서 살펴보았듯이 K-평균 군집화 알고리즘의 성능은 K 값에 따라 달라집니다. 따라서 이번 예제는 적절한 K 값을 찾는 것을 목표로 진행해 보겠습니다.

▲ 그림 3-31 K-평균 군집화 예제

먼저 필요한 라이브러리를 호출합니다.

코드 3-29 라이브러리 호출

import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

내려받은 예제 파일의 data 폴더에서 상품에 대한 연 지출 데이터(sales data.csv) 파일을 불러옵니다.9

코드 3-30 상품에 대한 연 지출 데이터(sales data.csv) 호출

data = pd.read_csv('../chap3/data/sales data.csv')
data.head()

 

 


  9 캐글에서 제공하는 UCI 도매 고객 데이터셋입니다(https://www.kaggle.com/binovi/wholesale-customers-data-set).

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.