명령줄을 사용한 방법
명령줄을 사용한 방법은 워크벤치와 매우 유사하지만 cron 작업을 실행할 수 있다는 점에서 조금 더 유연하다. 이는 더 많은 데이터를 비교하여 규칙적이고 일상화된 분석을 실행할 수 있다는 의미다.
CSV 파일을 ARFF로 변환하기
웨카는 .arff 포맷으로 개체의 종류를 알아내고 데이터 처리를 준비한다. GUI에서는 .csv 파일을 직접 불러왔지만, 파일을 변환하는 도구를 사용하는 것이 좋다.
명령줄에서 CSVLoader를 사용하여 .csv 파일을 .arff 파일로 변환할 수 있다. 예를 들어 앞서 kmeansdata.csv 파일을 만들었다. 터미널 명령줄에서 다음을 실행하여 .arff 파일로 변환한다.
java -cp weka.jar weka.core.converters.CSVLoader kmeansdata.csv > kmeansdata.arff
Note 윈도에서는 자바 명령에서 -cp weka.jar를 생략할 수 있다.
실행하면 데이터베이스 드라이버를 사용할 수 없다는 경고 메시지가 명령줄에 출력될 수 있으나 걱정할 필요는 없다. 중요한 것은 .arff 파일에 적합한 정의를 하는 것이다.
다음 정의를 보고 재빨리 확인해보자.
@relation >kmeansdata @attribute x numeric @attribute y numeric @data