더북(TheBook)

컨텍스트 정보를 보강해서 데이터 품질을 검사하면 데이터 품질을 미묘한 부분까지 좀 더 견고하게 검증할 수 있지만, 세상에 공짜는 없는 법입니다. 이 접근 방식의 가장 큰 단점은 검사할 조건을 정의하고 구현하기 위해 비즈니스 팀과 엔지니어링 팀 모두가 상당량의 수작업을 해야 한다는 것입니다. 따라서 개발자는 한정된 자원을 어디에 투자할지에 대한 우선순위를 신중히 정해야 합니다. 필드의 특히 중요한 하위 집합이나 오류가 발생하기 쉬운 파이프라인 단계에 검사를 추가하는 것만으로도 데이터 품질에 총체적으로 접근하는 데 많은 도움이 될 것입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.