전통적인 프로그래밍에서는 어떤 결과를 내기 위해서 프로그램을 만들어야 했습니다. 그런 다음 그 프로그램에 어떤 값을 주면, 정해진 프로그램에 따라 그 결괏값이 나옵니다. 예를 들어 2를 곱하는 프로그램이 있습니다. 이 프로그램은 특정한 숫자(데이터)인 10을 넣으면, 20이라는 결괏값(프로그램의 실행 결과)을 출력합니다. 이처럼 전통적인 프로그래밍에서는 데이터를 넣으면 그 데이터를 어떠한 식으로 처리하는지 프로그래머가 프로그램을 작성했습니다.
하지만 머신러닝의 경우 데이터로 인해 나타나는 결과를 사용하여 학습하기 때문에 스스로 프로그램을 만들 수 있습니다. 전통적인 방식에서 프로그램을 사람이 만들었다면, 머신러닝에서는 그 프로그램을 기계가 스스로 만들 수 있습니다. 특정한 데이터와 함께 그 데이터로 인해 나타나는 결과를 같이 넣어주면 기계가 그 관계를 찾아냅니다. 기계가 스스로 관계를 찾아내므로 예전처럼 사람이 직접 프로그래밍할 필요가 없어졌습니다. 이와 같이 기계가 스스로 프로그램을 만드는 것, 이것을 가리켜 ‘기계가 학습한다’고 보는 것이지요. 그리고 그 학습 재료가 바로 데이터이므로 오늘날 데이터의 중요성 또한 상당히 강조되고 있습니다. 그래서 데이터를 다른 말로 ‘인공지능 시대의 석유’라고도 하지요.