더북(TheBook)

5.4.1 기본 데이터 소스

 

DataFrame의 데이터를 저장하고 불러오는 방법을 설명하기 전에 먼저 스파크가 기본으로 지원하는 데이터 포맷들을 간단하게 살펴보자. 각각 장단점이 있으므로 어떤 포맷을 어떤 상황에 사용하는 것이 좋을지 알아 둘 필요가 있다. 스파크가 기본으로 지원하는 데이터 포맷에는 JSON, ORC, Parquet가 있다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.