더북(TheBook)

¦ 적은 양의 대표 데이터를 사용하라 ¦

대표 데이터의 크기는 테스트를 몇 분만에 실행할 수 있을 만큼 적어야 합니다. 실제 (프로덕션) 시스템에서 가져온 데이터(단, 익명으로 처리된 것이어야 함)라면 가장 좋습니다.

 

 

¦ 이진 형식보다 텍스트 형식 데이터를 선호하라 ¦

데이터 파일을 비교할 수 있어야 테스트에 실패했을 때 일어나는 일을 빠르게 파악할 수 있습니다. 입력 및 예상 출력을 확인해서 버전 관리 시스템에 두면 시간이 지나면서 변경되는 내용을 추적할 수 있습니다. 파이프라인에서 이진binary 형식만 받아들이거나 생성한다면 파이프라인 자체에 텍스트 지원을 추가하거나 테스트에서 필요한 내용만 텍스트로 변환하는 것을 고려하는 게 좋습니다.

 

 

¦ 로컬에서 테스트를 실행할 수 있는지 확인하라 ¦

로컬에서 테스트를 실행하면 테스트 오류를 최대한 쉽게 디버깅할 수 있습니다. 독립적인 로컬 환경을 제공하기 위해 아파치 스파크Apache Spark의 로컬 모드 또는 아파치 HBase의 미니클러스터minicluster처럼 사용 중인 시스템의 인-프로세스 버전을 사용합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.