예컨대 고객 10명의 이름, 성별, 나이, 거주지, 직업, 요금, 데이터 사용량, 휴대폰기기 선호도를 알고 싶다고 하자. 이때 알고 싶은 값 8개를 10명에게 얻으면 값은 모두 80개가 될 것이다. 값 80개 중에서 수치형(numerical) 값도 있을 것이고, 그렇지 않은 값도 있을 것이다. 이 80개의 값을 효과적으로 나타내는 방법은 무엇일까?
우선, 같은 기준으로 측정한 값을 한 줄로 표현하면 자료를 이해하기가 훨씬 수월할 것이다. 또한, 같은 사람에게 측정한 값 역시 같은 줄에 표현하는 것이 더 효과적이다. 이제 이러한 점을 고려하여 같은 사람에게 측정한 값은 한 행에, 같은 기준으로 측정한 값을 한 열로 하여 값 80개를 표현해보자(물론, 같은 사람에게 측정한 값을 한 열에 표현하고 싶은 경우도 있지만, 그렇게 일반적이지는 않다). 아마도 정리된 결과는 다음과 같은 형태일 것이다.
▼ 표 1-3 이동 통신사 고객 데이터를 행과 열로 표현한 결과
이름 |
성별 |
나이 |
거주지 |
직업 |
요금 |
데이터 사용량 |
휴대폰 선호도 |
AAA |
F |
20 |
서울 |
회사원 |
55,000 |
3GB |
LG |
BBB |
F |
19 |
인천 |
자영업 |
45,000 |
9GB |
삼성 |
CCC |
M |
25 |
김포 |
회사원 |
35,000 |
1GB |
샤오미 |
DDD |
F |
42 |
대전 |
회사원 |
75,000 |
4GB |
LG |
EEE |
F |
27 |
서울 |
자영업 |
65,000 |
2GB |
소니 |
FFF |
M |
20 |
서울 |
회사원 |
55,000 |
3GB |
LG |
GGG |
M |
43 |
서울 |
자영업 |
45,000 |
9GB |
삼성 |
HHH |
M |
25 |
대전 |
회사원 |
95,000 |
11GB |
샤오미 |
III |
F |
42 |
김포 |
회사원 |
45,000 |
3GB |
LG |
JJJ |
F |
27 |
인천 |
자영업 |
45,000 |
4GB |
소니 |