K-평균 군집화 예제로 자세히 알아보겠습니다. 앞서 살펴보았듯이 K-평균 군집화 알고리즘의 성능은 K 값에 따라 달라집니다. 따라서 이번 예제는 적절한 K 값을 찾는 것을 목표로 진행해 보겠습니다.

    ▲ 그림 3-31 K-평균 군집화 예제

    먼저 필요한 라이브러리를 호출합니다.

    코드 3-29 라이브러리 호출

    import pandas as pd
    from sklearn.preprocessing import MinMaxScaler
    from sklearn.cluster import KMeans
    import matplotlib.pyplot as plt

    내려받은 예제 파일의 data 폴더에서 상품에 대한 연 지출 데이터(sales data.csv) 파일을 불러옵니다.9

    코드 3-30 상품에 대한 연 지출 데이터(sales data.csv) 호출

    data = pd.read_csv('../chap3/data/sales data.csv')
    data.head()

     

     


      9 캐글에서 제공하는 UCI 도매 고객 데이터셋입니다(https://www.kaggle.com/binovi/wholesale-customers-data-set).

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.