더북(TheBook)

1.1 컴퓨터 비전 개요

 

 

새로운 이론과 학문을 접할 때 가장 먼저 용어에 대한 정의를 명확하게 하는 것이 좋습니다. 컴퓨터 비전(computer vision)은 컴퓨터를 이용하여 정지 영상 또는 동영상으로부터 의미 있는 정보를 추출하는 방법을 연구하는 학문입니다. 즉, 사람이 눈으로 사물을 보고 인지하는 작업을 컴퓨터가 동등하게 수행할 수 있게끔 연구하는 학문이라고 할 수 있습니다. 사람의 눈이 하는 작업을 카메라가 대신하고, 사람의 뇌가 하는 작업을 수학적 알고리즘을 통해 컴퓨터가 유사하게 수행할 수 있도록 만드는 작업이 컴퓨터 비전입니다.

사람이 사물을 보고 무엇인지 인지하는 것은 매우 직관적이고 쉬운 작업이지만, 컴퓨터가 사물을 인식할 수 있도록 만드는 일은 결코 쉽지 않습니다. 전통적인 컴퓨터 비전 문제 해결 방법에서는 영상으로부터 유용한 정보를 추출하고, 이를 조합하여 결과를 유추합니다. 예를 들어 그림 1-1(a)와 같은 사과 사진을 컴퓨터에 입력으로 주고, 이 사진의 객체를 사과라고 인식하는 문제에 대해 생각해 보겠습니다. 흰 배경을 제외한 가운데 영역에 빨간색 성분이 많이 있고 둥근 윤곽을 가지고 있으면 사과라고 인식하게끔 프로그램을 만들면 빨간 사과를 인식할 수 있을 것입니다. 그러나 그림 1-1(b) 사진처럼 초록색 사과도 함께 인식해야 한다면 사과의 색상 정보에 초록색도 추가해야 합니다. 만약 그림 1-1(c) 영상처럼 빨간색 토마토가 입력으로 들어오면 상황은 좀 더 복잡해집니다. 빨간색 색상 정보와 둥근 윤곽선 정보만으로는 사과와 토마토가 구분이 되지 않으므로 꼭지의 모양까지 고려해야 합니다. 그림 1-1(d) 영상처럼 배경이 단순하지 않고, 여러 과일이 겹쳐 있는 경우에는 인식이 더욱 어려워집니다.

▲ 그림 1-1 컴퓨터 비전과 영상 인식

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.