¦ 데이터 출처 추적 ¦
여러분은 모든 데이터가 어디서 오는지 알고 있나요? 유감스럽게도 많은 사람이 데이터의 출처를 모르고 있습니다. 데이터의 출처를 추적하면 법률 및 개인 정보 보호 관련 문제를 더 잘 이해할 수 있을 뿐만 아니라 데이터 품질과 데이터가 우리에게 전달되기 전에 거치는 처리 과정을 알아내는 데도 좋습니다. 모두에게 좋은 것이죠!
¦ 민감한 필드 삭제 혹은 암호화 ¦
데이터에 포함될 가능성이 있는 민감한 필드를 인식했다면 데이터 보호 메커니즘을 적용해야 합니다. 집계 분석을 할 때 사용자 이름이 필요한가요? 아니라고요? 그러면 삭제하세요(혹은 처음부터 수집하지 마세요). 챗봇 훈련에 이메일 주소가 필요한가요? 아니라고요? 그렇다면 모델에 그 데이터를 넘기지 마세요. 데이터 엔지니어라면 지식과 도구를 사용해서 민감한 데이터를 보호할 수 있습니다.
많은 사람이 스스로와 사랑하는 사람의 사생활을 보호하기 위해 다양한 조치를 취합니다. 합의하에 데이터를 수집하고 데이터에 대한 기본적인 개인 정보 보호 조치를 구현해서 고객과 제품 사용자를 우대해주세요.