벡터: 방향이 있고 순서가 있고 차원의 공간에 존재하는 점
벡터는 숫자 여러 개가 특정한 순서대로 모여 있는 것을 의미합니다. 사실 대부분의 데이터 레코드는 숫자 여러 개로 구성된 경우가 많습니다. 예를 들어 한 사람의 ‘이직 유무’를 알아내려고 ‘업무 만족도’ x1뿐만 아니라 ‘전년도 평가’ x2, ‘평균 급여’ x3, ‘연봉’ x4라는 네 항목을 측정할 수도 있습니다. 이렇게 측정된 숫자 네 개는 한 사람에게서 나온 데이터이므로 따로따로 다루기보다는 묶음(tuple) 하나로 묶는 것이 좋습니다. 이때 숫자 순서가 바뀌면 어떤 숫자가 ‘업무 만족도’고 어떤 숫자가 ‘평균 급여’인지 알 수 없으므로 순서를 유지하는 것이 중요합니다. 이러한 데이터 묶음을 선형대수에서는 벡터라고 합니다.
이때 벡터는 다음과 같이 세로줄(열(column))은 하나고, 가로줄(행(row))은 여러 개인 형태로 위에서 아래로 써서 표기해야 합니다.
또 벡터 하나를 이루는 데이터 개수가 n개이면 이 벡터를 n-차원 벡터(n-dimensional vector)라고 하며, 다음과 같이 표기합니다.
실제로 앞서 예로 든 ‘이직 유무’를 알아내고자 ‘업무 만족도’, ‘전년도 평가’, ‘평균 급여’, ‘연봉’이라는 네 항목을 측정했으므로 4차원 벡터라고 하며, 다음과 같이 표기합니다.
x ∈ R4