행렬: 2차원 배열
행렬은 복수 차원을 가지는 데이터 레코드가 여러 개 있을 때, 이 데이터를 합쳐 표기한 것입니다. 예를 들어 앞의 HR 테이블에서 이직에 성공한 사람들(‘이직 유무’가 ‘1’인 사람들이 총 6명)의 ‘업무 만족도’, ‘전년도 평가’, ‘평균 급여’, ‘연봉’ 데이터를 추출했기 때문에 이렇게 4차원 데이터가 여섯 개 있는 것입니다. 즉, 4 × 6 = 24개의 실수 숫자가 있는 것입니다. 이 숫자 집합을 행렬로 나타내면 그림 10-2와 같습니다. 행렬은 다음과 같이 보통 X 등 알파벳 대문자로 표시합니다.
그림 10-2 | 행렬 표현
행렬의 원소 하나하나는 x23처럼 숫자 쌍 두 개를 아래 첨자(subscript)로 붙여서 표기합니다. 첫 번째 숫자는 행을, 두 번째 숫자는 열을 의미합니다. 예를 들어 x23은 두 번째 행(위에서 아래로 두 번째) 세 번째 열(왼쪽에서 오른쪽으로 세 번째)의 숫자를 가리킵니다.
앞서 살펴본 벡터는 열 개수가 1인 행렬이라고 볼 수 있으므로 열 벡터(column vector)라고도 합니다. 주의할 점은 데이터를 행렬로 묶어서 표시할 때는 ‘한 사람’에 대한 데이터 레코드, 즉 벡터 하나를 열이 아닌 행으로 표시한다는 것입니다.