4 인공지능에서는 왜 벡터를 사용하는가?

     

    인공지능에서 벡터 의미

    인공지능에서 벡터는 숫자의 집합 및 배열이라고 이해하면 쉽습니다. 인공지능에서는 특성 벡터(feature vector)라는 명칭을 사용합니다.

     

    앞서 예로 든 HR 테이블에서 행 다섯 개만 가져올게요.

     

    이직 유무

    평균 급여

    업무 시간

    직군

    연봉

    0

    96

    3

    support

    low

    1

    97

    3

    sales

    low

    1

    98

    4

    marketing

    medium

    1

    99

    2

    IT

    low

    0

    112

    6

    accounting

    high

    표 10-4 | HR 테이블

     

    표 10-4에서 직군과 연봉을 숫자로 변환해야 합니다. 이해하기 쉽도록 직군 특성에서 ‘support’를 ‘1’로, ‘sales’를 ‘2’로, ‘marketing’을 ‘3’으로, ‘IT’를 ‘4’로, ‘accounting’을 ‘5’로 표현할 수 있습니다. 연봉의 ‘low’를 ‘1’로, ‘medium’을 ‘2’로, ‘high’를 ‘3’으로 표현하면 표 10-5와 같습니다.

     

    이직 유무

    평균 급여

    업무 시간

    직군

    연봉

    0

    96

    3

    1

    1

    1

    97

    3

    2

    1

    1

    98

    4

    3

    2

    1

    99

    2

    4

    1

    0

    112

    6

    5

    3

    표 10-5 | 데이터의 숫자 표현 결과

     

    따라서 첫 번째 행은 벡터 [0, 96, 3, 1, 1]처럼 표현할 수 있습니다(물론 다른 특성과 평균 급여의 데이터 범위가 다르기 때문에 전처리는 필요합니다).

    신간 소식 구독하기
    뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.