더북(TheBook)

mlbench 패키지1에 있는 Ozone 데이터를 사용해 산점도를 그려보자. Ozone은 1976년 로스앤젤레스 지역의 오존 오염 데이터를 저장하고 있으며, V8과 V9 컬럼은 각각 캘리포니아 Sandburg와 El Monte에서 측정한 온도다. 다음은 X 축을 V8, Y 축을 V9로 하는 산점도를 그린 예다.

> install.packages("mlbench")
> library(mlbench)
> data(Ozone)
> plot(Ozone$V8, Ozone$V9)

위 코드에서 data( ) 문은 mlbench 패키지 로딩 후 Ozone 데이터 셋을 읽어들이기 위해 사용한 명령이다. mlbench 패키지뿐만 아니라 통상적으로 많은 통계 또는 기계 학습 패키지에서 이러한 데이터 셋을 데모 목적으로 포함하고 있으며, 각 데이터는 data( ) 문을 통해 읽어들일 수 있다.

mlbench에 포함된 전체 데이터는 library(help=“mlbench”) 명령으로 살펴볼 수 있다. 또는 mlbench의 참조 매뉴얼reference manual을 찾아서 읽어봐도 되는데, 보통 ‘R mlbench’ 정도의 키워드를 구글에서 찾으면 손쉽게 찾아볼 수 있다.

그림 6-1에 위 프로그램의 실행 결과를 보였다. 그림에서 볼 수 있듯이 plot은 (x, y) 순서로 입력을 받으며, x와 y가 숫자형 데이터인 경우 산점도를 그려준다.

그림 6-1 Sandburg(V8)와 El Monte(V9) 지역의 온도
그림 6-1 Sandburg(V8)와 El Monte(V9) 지역의 온도

1 UCI repository를 포함한 다양한 기계 학습 벤치마킹을 위한 데이터가 있는 패키지다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.