더북(TheBook)

4 인공지능에서는 왜 벡터를 사용하는가?

 

인공지능에서 벡터 의미

인공지능에서 벡터는 숫자의 집합 및 배열이라고 이해하면 쉽습니다. 인공지능에서는 특성 벡터(feature vector)라는 명칭을 사용합니다.

 

앞서 예로 든 HR 테이블에서 행 다섯 개만 가져올게요.

 

이직 유무

평균 급여

업무 시간

직군

연봉

0

96

3

support

low

1

97

3

sales

low

1

98

4

marketing

medium

1

99

2

IT

low

0

112

6

accounting

high

표 10-4 | HR 테이블

 

표 10-4에서 직군과 연봉을 숫자로 변환해야 합니다. 이해하기 쉽도록 직군 특성에서 ‘support’를 ‘1’로, ‘sales’를 ‘2’로, ‘marketing’을 ‘3’으로, ‘IT’를 ‘4’로, ‘accounting’을 ‘5’로 표현할 수 있습니다. 연봉의 ‘low’를 ‘1’로, ‘medium’을 ‘2’로, ‘high’를 ‘3’으로 표현하면 표 10-5와 같습니다.

 

이직 유무

평균 급여

업무 시간

직군

연봉

0

96

3

1

1

1

97

3

2

1

1

98

4

3

2

1

99

2

4

1

0

112

6

5

3

표 10-5 | 데이터의 숫자 표현 결과

 

따라서 첫 번째 행은 벡터 [0, 96, 3, 1, 1]처럼 표현할 수 있습니다(물론 다른 특성과 평균 급여의 데이터 범위가 다르기 때문에 전처리는 필요합니다).

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.