3 인공 신경망의 재료, 여러 특징을 가진 데이터
인공 신경망을 포함해서 머신러닝 방식의 인공지능을 만들기 위해서는 데이터가 필요합니다. 그리고 그 데이터에는 여러 특징이 담겨 있어야 하지요. 여기에서 말하는 여러 특징을 가진 데이터는 데이터의 수를 의미하지 않습니다. 물론 데이터의 수가 많아야 좋은 성능의 인공 신경망 모델을 만들 수 있습니다. 하지만 여기서 말하는 여러 특징의 데이터란 각각의 데이터에 하나의 정보가 아닌 여러 정보가 있어야 한다는 의미입니다.
예를 들어 살펴볼까요? 우리가 남자와 여자를 구분하는 상황 1을 생각해 봅시다. 이때 남자와 여자를 단번에 구분할 수 있는 방법은 무엇일까요? 물론 여러 방법이 있지만, 키를 이용해서 구분해 볼 수 있습니다.
그림 4-5 | 한 가지 정보로 예측하는 모습
어떤 사람이 남자는 대체로 키가 크고, 여자는 대체로 키가 작다고 생각합니다(물론 이렇게 단정할 수는 없겠지만요). 이 정보만으로 정확하게 구분할 수 있을까요? 남자보다 키가 큰 여자도 있고, 남자아이와 성인 여자는 키라는 정보만 가지고 정확하게 구별할 수 없습니다.
이처럼 한정된 정보만으로 판단한다면 정확하게 판단하기 어렵습니다. 키, 몸무게, 머리카락 길이, 얼굴 길이, 눈, 코, 입의 형태, 몸의 모습 등 정보가 많을수록 더 정확하게 판단할 수 있습니다. 그리고 이는 인공지능에서도 동일하게 나타납니다. 성능이 더욱 뛰어난 인공지능을 만들려면 인공지능이 잘 판단할 수 있도록 여러 정보를 입력할 필요가 있는 것이지요. 이처럼 머신러닝 기법으로 인공지능을 만들 때에는 다양한 특성이 포함된 데이터가 필요합니다.