4.2.4 딥러닝을 사용할 때 이점
그럼 딥러닝을 사용할 때 이점에는 어떤 것이 있을까요?
특성 추출
컴퓨터가 입력받은 데이터를 분석하여 일정한 패턴이나 규칙을 찾아내려면 사람이 인지하는 데이터를 컴퓨터가 인지할 수 있는 데이터로 변환해 주어야 합니다. 이때 데이터별로 어떤 특징을 가지고 있는지 찾아내고, 그것을 토대로 데이터를 벡터로 변환하는 작업을 특성 추출(feature extraction)이라고 합니다.
딥러닝이 활성화되기 이전에 많이 사용되었던 머신 러닝 알고리즘인 SVM, 나이브 베이즈(Naïve Bayes), 로지스틱 회귀의 특성 추출은 매우 복잡하며 수집된 데이터에 대한 전문 지식(예를 들어 제조, 의료 등 수집된 데이터의 도메인 분야에 대한 지식)이 필요했습니다. 하지만 딥러닝에서는 이러한 특성 추출 과정을 알고리즘에 통합시켰습니다. 데이터 특성을 잘 잡아내고자 은닉층을 깊게 쌓는 방식으로 파라미터를 늘린 모델 구조 덕분입니다.
빅데이터의 효율적 활용
딥러닝을 사용할 때의 이점으로 특성 추출이 있다고 했습니다. 즉, 딥러닝에서는 특성 추출을 알고리즘에 통합시켰다고 했는데, 이것이 가능한 이유는 빅데이터 때문입니다. 딥러닝 학습을 이용한 특성 추출은 데이터 사례가 많을수록 성능이 향상되기 때문입니다.
다른 말로 표현하면 확보된 데이터가 적다면 딥러닝의 성능 향상을 기대하기 힘들기 때문에 머신 러닝을 고려해 보아야 합니다.