더북(TheBook)

예를 들어 다음과 같이 작성자, 관련 태그, 포스트의 유형별로 포스트 개수를 집계할 수 있다(태그 조합은 각각 고유한 문자열로 간주한다).

scala> postsDfNew.groupBy('ownerUserId, 'tags,
    'postTypeId).count.orderBy('ownerUserId desc).show(10)
+-----------+--------------------+----------+-----+
|ownerUserId|                tags|postTypeId|count|
+-----------+--------------------+----------+-----+
|        862|                    |         2|    1|
|        855|         <resources>|         1|    1|
|        846|<translation><eng...|         1|    1|
|        845|<word-meaning><tr...|         1|    1|
|        842|  <verbs><resources>|         1|    1|
|        835|    <grammar><verbs>|         1|    1|
|        833|                    |         2|    1|
|        833|           <meaning>|         1|    1|
|        833|<meaning><article...|         1|    1|
|        814|                    |         2|    1|
+-----------+--------------------+----------+-----+
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.