예를 들어 다음과 같이 작성자, 관련 태그, 포스트의 유형별로 포스트 개수를 집계할 수 있다(태그 조합은 각각 고유한 문자열로 간주한다).
scala> postsDfNew.groupBy('ownerUserId, 'tags, 'postTypeId).count.orderBy('ownerUserId desc).show(10) +-----------+--------------------+----------+-----+ |ownerUserId| tags|postTypeId|count| +-----------+--------------------+----------+-----+ | 862| | 2| 1| | 855| <resources>| 1| 1| | 846|<translation><eng...| 1| 1| | 845|<word-meaning><tr...| 1| 1| | 842| <verbs><resources>| 1| 1| | 835| <grammar><verbs>| 1| 1| | 833| | 2| 1| | 833| <meaning>| 1| 1| | 833|<meaning><article...| 1| 1| | 814| | 2| 1| +-----------+--------------------+----------+-----+