모두의 인공지능 with 파이썬(개정 2판): 2.3 강화 학습

간단한 게임에서 강화 학습의 가능성을 확인한 딥마인드는 이제 바둑으로 눈을 돌립니다. 그 결과가 바로 알파고입니다. 알파고는 바둑을 학습한 인공지능입니다.

딥마인드는 알파고에 프로 바둑 기사의 기보를 바탕으로 바둑 두는 방법을 알려 주었습니다. 그다음에는 알파고끼리 서로 대결을 벌였습니다. 대결이 진행될수록 알파고는 어떻게 하면 이길 수 있는지 스스로 학습을 진행했습니다.

이제 강화 학습은 게임과 바둑을 넘어 다양한 분야로 적용되고 있습니다. 자율 주행 자동차, 인공지능 로봇 등으로 확대되고 있는 강화 학습은 앞으로 우리 사회를 크게 바꿀 중요한 학습 방식입니다.

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.