더북(TheBook)

5장
스파크 SQL로 멋진 쿼리를 실행하자

 

 

 

5.1 DataFrame 다루기

5.2 DataFrame을 넘어 Dataset으로

5.3 SQL 명령

5.4 DataFrame을 저장하고 불러오기

5.5 카탈리스트 최적화 엔진

5.6 텅스텐 프로젝트의 스파크 성능 향상

5.7 요약

 

 

이 장에서 살펴볼 주제

• DataFrame을 생성하는 방법

• DataFrame API 사용법

• Dataset 소개

• SQL 쿼리 사용법

• 외부 데이터를 로드 및 저장하는 방법

• 카탈리스트 최적화 엔진

• 텅스텐 프로젝트의 스파크 성능 향상

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.