이처럼 지도학습과 자율학습은 데이터를 받고 학습을 하는 수동적인 알고리즘인데, 강화학습은 좀 다르다. 강화학습은 환경이 주어졌을 때 능동적으로 특정한 행위를 하고 이에 따라 점수를 받거나 페널티를 받으면서 머신(기계)이 학습하는 방법이다.
마치 게임에서 몹(mob)을 잡으면 레벨이 오르고 좋은 장비를 얻는 것, 또는 강아지에게 어떤 행동을 유도해 원하는 행동을 하면 간식을 주면서 훈련시키는 것과 비슷하다.
또 다른 머신 러닝 알고리즘으로는 사람의 뇌 속 뉴런을 모방한 방식이 있다. 이를 신경망 학습이라고 한다. 1940년대부터 그 연구가 시작됐지만, 초창기에는 데이터와 컴퓨팅 성능이 미미한 탓에 좋은 성과를 얻을 수 없었다. 그러나 오늘날에는 데이터가 많고 컴퓨터의 연산 능력도 좋아져서 신경망 학습은 인공지능 알고리즘 중에서 두각을 나타내고 있다.
한 번쯤 들어봤을 용어인 딥러닝은 좀 더 발전된 신경망 학습의 일종이다. 기존의 지도학습에서는 데이터와 정답을 제공하고 데이터 특성을 제공하는 등 사람의 개입이 필요했지만, 딥러닝은 학습할 때 인간의 신경망(뉴런) 같은 계층을 만들어 특징을 추출하고 분류한다. 계층은 각종 활성화 함수를 사용해 입력 신호를 가공하고 출력값을 도출한다.
딥러닝에는 다음과 같은 알고리즘을 많이 사용한다. 합성곱신경망(CNN) 알고리즘은 인간의 시신경 구조를 모방해 추출과 분류의 기능이 특화돼 있으므로 자연어 분류, 안면 인식 등에 유용하다. 순환신경망(RNN)은 반복적이고 순차적인 데이터 학습에 특화돼 음성 인식이나 번역 등에 사용된다. 최근에는 GAN(Generative Adversarial Network)이 주목받고 있다.