더북(TheBook)

예컨대 고객 10명의 이름, 성별, 나이, 거주지, 직업, 요금, 데이터 사용량, 휴대폰기기 선호도를 알고 싶다고 하자. 이때 알고 싶은 값 8개를 10명에게 얻으면 값은 모두 80개가 될 것이다. 값 80개 중에서 수치형(numerical) 값도 있을 것이고, 그렇지 않은 값도 있을 것이다. 이 80개의 값을 효과적으로 나타내는 방법은 무엇일까?

우선, 같은 기준으로 측정한 값을 한 줄로 표현하면 자료를 이해하기가 훨씬 수월할 것이다. 또한, 같은 사람에게 측정한 값 역시 같은 줄에 표현하는 것이 더 효과적이다. 이제 이러한 점을 고려하여 같은 사람에게 측정한 값은 한 행에, 같은 기준으로 측정한 값을 한 열로 하여 값 80개를 표현해보자(물론, 같은 사람에게 측정한 값을 한 열에 표현하고 싶은 경우도 있지만, 그렇게 일반적이지는 않다). 아마도 정리된 결과는 다음과 같은 형태일 것이다.

▼ 표 1-3 이동 통신사 고객 데이터를 행과 열로 표현한 결과

이름

성별

나이

거주지

직업

요금

데이터 사용량

휴대폰 선호도

AAA

F

20

서울

회사원

55,000

3GB

LG

BBB

F

19

인천

자영업

45,000

9GB

삼성

CCC

M

25

김포

회사원

35,000

1GB

샤오미

DDD

F

42

대전

회사원

75,000

4GB

LG

EEE

F

27

서울

자영업

65,000

2GB

소니

FFF

M

20

서울

회사원

55,000

3GB

LG

GGG

M

43

서울

자영업

45,000

9GB

삼성

HHH

M

25

대전

회사원

95,000

11GB

샤오미

III

F

42

김포

회사원

45,000

3GB

LG

JJJ

F

27

인천

자영업

45,000

4GB

소니

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.