더북(TheBook)

두 번째 방법으로, fill 함수를 사용해 null 또는 NaN 값을 double 상수 또는 문자열 상수로 채울 수 있다. fill 함수의 인수를 하나만 지정하면 이 인수 값을 모든 칼럼의 결측 값을 대체할 상수로 사용한다. 특정 칼럼을 지정하려면 두 번째 인수에 칼럼 이름의 목록을 전달해야 한다. 또는 칼럼 이름과 대체 값을 매핑한 Map 객체를 전달할 수도 있다. 예를 들어 다음과 같이 viewCount 칼럼의 null 값을 0으로 채울 수 있다.

postsDf.na.fill(Map("viewCount" -> 0))

 

세 번째 방법으로, replace 함수를 사용해 특정 칼럼의 특정 값을 다른 값으로 치환할 수 있다. 예를 들어 데이터 추출 중 오류가 발생해 포스트 ID가 1177번인 데이터를 3000번으로 정정해야 한다고 가정해 보자. 다음과 같이 replace 함수로 해결할 수 있다.

val postsDfCorrected = postsDf.na.
    replace(Array("id", "acceptedAnswerId"), Map(1177 ->3000))
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.