더북(TheBook)

10

데이터 파이프라인을 보여주는 비즈니스 대시보드

 

발리아파 (락) 락쉬마난(Valliappa (Lak) Lakshmanan)

이해관계자들에게 데이터를 보여주세요. 데이터에 문제가 있다면 그 사람들이 알려줄 것입니다.

 

데이터 파이프라인을 구축해서 데이터를 수집할 때 올바르게 처리하고 있는지 확신하지 못하는 경우는 얼마나 되나요? 잘라버린 이상 값anomalies은 정말로 장비가 오작동했기 때문에 생겼을까요? 타임스탬프는 실제로 협정 세계시Coordinated Universal Time, UTC 값인가요? 고객이 주문을 수락한 경우에만 특정 필드 값이 채워지나요?

꼼꼼한 사람이라면 파이프라인을 구축하는 시점에 이해관계자에게 앞의 예시처럼 주의할 사항을 확인할 겁니다. 그러나 확인해야 하는지조차 몰랐던 사항이 있다면 어떨까요? 달마다 질문에 대한 답이 달라진다면 또 어떨까요?

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.