더북(TheBook)

■ 강화 학습 사례 살펴보기

강화 학습을 위해서는 달성하려는 목표가 필요합니다. 그리고 그 목표를 이루는 상이 필요합니다. 이 두 조건이 있으면 강화 학습 방식의 인공지능은 스스로 자신에게 상을 주며 목표를 이룹니다.

혹시 <아타리(Atari)>라는 벽돌 깨기 게임을 아나요? 먼저 다음 링크의 영상을 참고해 보세요.

https://youtu.be/V1eYniJ0Rnk?si=UtLWxCtj4dxrwFa5

이 강화 학습 방식은 예전부터 연구된 기술이지만 딥러닝과 만나면서 그 잠재력이 폭발했습니다. 강화 학습과 딥러닝의 극적인 만남을 이룬 기업이 바로 알파고를 만든 딥마인드(DeepMind)입니다.

딥마인드에서는 알파고를 만들기 전에 자신들이 제작한 딥러닝 기반 강화 학습 방식이 잘되는지 확인하려고 <벽돌 깨기> 게임을 인공지능에 학습시켰습니다.

<벽돌 깨기> 게임의 방법은 간단합니다. 좌우로 움직일 수 있는 바(bar)를 사용하여 공을 튀겨 위쪽에 있는 벽돌을 모두 깨는 것입니다. 벽돌을 모두 깨면 승리하고, 공을 모두 떨어트리면 지는 규칙입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.