4 인공지능에서는 왜 벡터를 사용하는가?
인공지능에서 벡터 의미
인공지능에서 벡터는 숫자의 집합 및 배열이라고 이해하면 쉽습니다. 인공지능에서는 특성 벡터(feature vector)라는 명칭을 사용합니다.
앞서 예로 든 HR 테이블에서 행 다섯 개만 가져올게요.
이직 유무 |
평균 급여 |
업무 시간 |
직군 |
연봉 |
0 |
96 |
3 |
support |
low |
1 |
97 |
3 |
sales |
low |
1 |
98 |
4 |
marketing |
medium |
1 |
99 |
2 |
IT |
low |
0 |
112 |
6 |
accounting |
high |
표 10-4 | HR 테이블
표 10-4에서 직군과 연봉을 숫자로 변환해야 합니다. 이해하기 쉽도록 직군 특성에서 ‘support’를 ‘1’로, ‘sales’를 ‘2’로, ‘marketing’을 ‘3’으로, ‘IT’를 ‘4’로, ‘accounting’을 ‘5’로 표현할 수 있습니다. 연봉의 ‘low’를 ‘1’로, ‘medium’을 ‘2’로, ‘high’를 ‘3’으로 표현하면 표 10-5와 같습니다.
이직 유무 |
평균 급여 |
업무 시간 |
직군 |
연봉 |
0 |
96 |
3 |
1 |
1 |
1 |
97 |
3 |
2 |
1 |
1 |
98 |
4 |
3 |
2 |
1 |
99 |
2 |
4 |
1 |
0 |
112 |
6 |
5 |
3 |
표 10-5 | 데이터의 숫자 표현 결과
따라서 첫 번째 행은 벡터 [0, 96, 3, 1, 1]처럼 표현할 수 있습니다(물론 다른 특성과 평균 급여의 데이터 범위가 다르기 때문에 전처리는 필요합니다).