2.1 선형대수의 필요성
선형대수를 간단하게 설명하면 주어진 데이터를 어떤 공간, 예를 들어 2차원의 공간으로 표현한 것이라 할 수 있다. 이러한 선형대수는 현재 다양한 분야에서 활발하게 적용되며 특히 데이터를 다루는 머신 러닝에서는 필수 불가결한 역할을 한다. 간단한 예를 들어보자. 관객 100명으로부터 영화 100편의 선호도를 조사한다고 하자. 가장 일반적인 방법은 관객 100명이 각 행이 되고, 영화 100편이 각 열이 되는 표를 만든 후 선호도를 숫자로 기입하는 것이다.
▼ 표 2-1 관객별 영화 선호도
|
토이스토리 |
배트맨 |
곰돌이 푸 |
어벤져스 |
… |
관객1 |
5 |
1 |
|
1 |
|
관객2 |
4 |
|
|
1 |
|
관객3 |
4 |
|
|
|
|
관객4 |
|
5 |
4 |
4 |
|
… |
|
|
5 |
|
|
이때 만들어진 데이터는 ‘관객’이라는 하나의 차원과 ‘영화’라는 또 하나의 차원으로 설명할 수 있다. 결국 위의 데이터는 총 두 차원의 조합으로 이해되며, 또는 각각의 차원으로도 이해할 수 있다. 여기서 ‘이해’란 각 차원에 속하는 수치를 알고 있는 것으로 해석할 수 있다. 이렇게 2차원으로 표현된 데이터를 이해하는 다양한 개념과 방법을 제공하는 것이 바로 선형대수의 역할이다.
여기서 어떤 현상을 하나 혹은 그 이상의 차원으로 표현하는 방법을 좀 더 살펴보자. 우리가 어떤 현상을 ‘이해’한다는 것은 해당 현상의 여러 속성을 값으로 파악하는 것이다. 그중에는 수치로 표현되는 정량적인 속성도 있고, 그렇지 않은 정성적인 속성도 있다. 이때 수치로 표현되는 정량적인 속성을 객관적이고 과학적으로 이해하려면 수학적 표현과 접근이 필요한데, 선형대수는 바로 그 기반을 마련해준다.