더북(TheBook)

필요한 모든 설정을 지정한 후 마지막으로 start() 메서드를 호출해 스트리밍 계산을 시작할 수 있다. 다음 코드는 ch06input 폴더에 새로 생성된 파일에서 첫 20줄을 매 5초마다 콘솔에 출력한다. 스파크 셸에 코드를 입력해 보자.

scala> import org.apache.spark.sql.streaming.ProcessingTime
scala> val streamHandle = structStream.
    writeStream.
    format("console").
    trigger(ProcessingTime.create("5 seconds")).
    start()

 

그런 다음 별도의 리눅스 콘솔을 열고 6.1절 예제와 마찬가지로 splitAndSend.sh 스크립트를 실행하자(스크립트를 실행하기 전에 입력 폴더의 내용을 삭제해야 한다).

$ rm -f /home/spark/ch06input/*
$ cd first-edition/ch06
$ ./splitAndSend.sh /home/spark/ch06input local

 

이제 스파크 셸에 파일 내용이 출력될 것이다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.