더북(TheBook)

전처리

데이터 분석을 위해서 필요하다면 데이터 ‘전처리’ 작업을 해야 하는데, 전처리는 분석을 위해 데이터가 없을 때 외부 조인을 한다거나 직업 정보가 없을 때 ‘정보 없음’으로 출력한다거나 수치 값을 소수점 둘째 자리로 맞춘다거나 하는 식으로 데이터를 정규화하거나 표준화하는 작업입니다. 이렇게 해야 데이터를 분석할 때 틀린 값이나 오류 값이 나타나지 않습니다. 전처리를 하지 않으면 누락되거나 틀린 값이 나올 수 있습니다. SQL은 전처리 작업에도 매우 유용합니다. 전처리 작업을 통해 데이터는 표준 형태로 변환됩니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.