K-평균 군집화 예제로 자세히 알아보겠습니다. 앞서 살펴보았듯이 K-평균 군집화 알고리즘의 성능은 K 값에 따라 달라집니다. 따라서 이번 예제는 적절한 K 값을 찾는 것을 목표로 진행해 보겠습니다.
▲ 그림 3-31 K-평균 군집화 예제
먼저 필요한 라이브러리를 호출합니다.
코드 3-29 라이브러리 호출
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
내려받은 예제 파일의 data 폴더에서 상품에 대한 연 지출 데이터(sales data.csv) 파일을 불러옵니다.9
코드 3-30 상품에 대한 연 지출 데이터(sales data.csv) 호출
data = pd.read_csv('../chap3/data/sales data.csv')
data.head()
9 캐글에서 제공하는 UCI 도매 고객 데이터셋입니다(https://www.kaggle.com/binovi/wholesale-customers-data-set).