4.2.1 스파크의 데이터 Partitioner
RDD의 데이터 파티셔닝은 RDD의 각 요소에 파티션 번호를 할당하는 Partitioner 객체가 수행한다. 스파크는 Partitioner의 구현체(implementation)로 HashPartitioner와 RangePartitioner를 제공한다. 또 사용자 정의 Partitioner를 Pair RDD에 사용할 수 있다.
RDD의 데이터 파티셔닝은 RDD의 각 요소에 파티션 번호를 할당하는 Partitioner 객체가 수행한다. 스파크는 Partitioner의 구현체(implementation)로 HashPartitioner와 RangePartitioner를 제공한다. 또 사용자 정의 Partitioner를 Pair RDD에 사용할 수 있다.