더북(TheBook)

spark-sql의 -e 인수를 사용해 스파크 SQL 셸을 들어가지 않고도 SQL 쿼리를 실행할 수 있다. 이때는 쿼리 표현식 마지막에 세미콜론을 붙이지 않아도 된다.

$ spark-sql -e "select substring(title, 0, 70) from posts where postTypeId= 1 order by creationDate desc limit 3"

 

spark-sql-f 인수는 파일에 저장된 SQL 명령을 실행한다. 또 -i 인수로 초기화 SQL 파일을 지정할 수 있다. 이 초기화 SQL 파일에는 다른 SQL 명령을 실행하기 전에 우선적으로 실행할 명령들을 입력한다. 책의 깃허브 저장소에서 제공하는 다양한 데이터 파일을 사용해 스파크 SQL을 실습하면서 스파크 SQL API를 마스터해 보자.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.