먼저 pandas 라이브러리를 사용하여 UCI 머신 러닝 저장소에서 붓꽃 데이터셋을 DataFrame 객체로 직접 로드(load)하겠습니다. 데이터가 제대로 로드되었는지 확인하기 위해 tail 메서드로 마지막 다섯 줄을 출력해 봅니다.

    >>> import os
    >>> import pandas as pd
    >>> s = 'https://archive.ics.uci.edu/ml/'\
    ...     'machine-learning-databases/iris/iris.data'
    >>> print('URL:', s)
    URL: https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data
    >>> df = pd.read_csv(s,
    ...                  header=None,
    ...                  encoding='utf-8')
    >>> df.tail()

    앞의 코드를 실행하면 그림 2-5와 같이 붓꽃 데이터셋의 마지막 다섯 줄을 확인할 수 있습니다.

    ▲ 그림 2-5 붓꽃 데이터셋의 마지막 다섯 줄

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.