1.2 선형대수, 미분과 적분, 확률, 통계의 필요성
앞에서 데이터 과학을 위한 컴퓨팅 도구인 파이썬을 설치하는 방법에 대해 살펴보았다. 이제는 데이터 과학을 위한 주요 기반인 수학, 그중에서도 선형대수, 미분과 적분, 확률, 통계의 필요성에 대해 살펴보자. 사실 데이터를 다루는 데이터 과학에서는 값이 정량화되어 기록되기 때문에 이러한 정량화된 ‘값’을 잘 다루는 것이 상당히 중요하다. 그에 따라 수학적 접근과 이해의 중요성이 부각되고 있다.
우리에게 어렵게만 느껴지는 수학은 고대 그리스에서 기원된 것으로 알려졌다. 고대 바빌로니아와 이집트에서도 계산(computation)은 있었지만, ‘증명’ 과정이 없었다. 반면, 피타고라스부터 ‘증명’을 사용하기 시작하면서 이때부터 수학이 시작된 것으로 볼 수 있다. 다시 말해서, 피타고라스는 정의(definition), 정리(theorem), 증명(proof)을 사용하여 세계가 숫자로 만들어졌음을 주장하였다. 수학에서의 증명은 사고를 체계적으로 정당화하고 다른 사람도 동의할 수 있게 하는 중요한 역할을 한다. 피타고라스 이후 그리스 수학자들은 추론, 논리, 명제를 중심으로 내용을 전개하였다. 이를 바탕으로 플라톤, 에우클리이데스, 아르키메데스 등의 유명한 수학자들이 활약하게 되었다. 그리고 이들이 사용했던 방식은 이후에 근대 수학의 기초가 되었다.
▲ 그림 1-20 정의, 정리, 증명을 사용한 수학자 피타고라스