더북(TheBook)

그는 팩트 테이블의 유형을 다음 세 가지로 분류한다.

1. 트랜잭션 팩트 테이블 : 단일 시점에 측정된 데이터를 담은 테이블

2. 주기적 스냅샷 팩트 테이블 : 재무 보고 기간처럼 미리 정의된 시간 동안 또는 그 마지막 시점의 데이터를 요약한 테이블

3. 누적 스냅샷 팩트 테이블 : 주문 처리, 클레임 처리, 서비스 콜 처리, 대학 입학 등 시작과 끝 시점이 잘 정의된 예측 가능한 프로세스 데이터를 담은 테이블

킴벌이 소개한 또 다른 핵심 개념은 느리게 변경되는 디멘젼 테이블이다. 그가 한 설명에 따르면 팩트 테이블에 저장되는 대부분의 기본적인 측정 데이터는 타임스탬프와 날짜 디멘젼 테이블에 연결되는 외래키를 포함하는데, 단순한 활동 기준(Activity-based) 타임스탬프보다 시간이 더 많은 영향을 미친다. 고객, 제품, 서비스, 기간, 위치, 임직원 등 기본 엔터티를 비롯해 팩트 테이블과 연결되는 다른 디멘젼 테이블도 모두 시간 경과의 영향을 받는다. 때때로 개정된 설명은 데이터에 있는 오류를 바로잡는 역할만 하지만, 고객이나 제품 같은 특정 디멘젼 항목과 관련된 설명을 개정한 시점에 일어나는 실제 변경을 나타내기도 한다. 이런 변경은 팩트 테이블의 측정 데이터보다는 훨씬 드물게 발생하기 때문에 느리게 변경되는 디멘젼(Slowly Changing Dimension, SCD)이라고 한다. 효율적이고 효과적인 데이터 웨어하우스를 설계하려면 이 개념을 반드시 이해해야 한다.

 

 

 

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.