더북(TheBook)

장애물을 두 발로 점프하여 건너뛰며 옆으로 한 바퀴 돌아서 착지하고, 심지어 뒤로 한 바퀴 돌아서 장애물을 내려오는 모습이 정말 인상적입니다. 이 로봇의 특징은 사람과 같이 두 팔로 균형을 잡는다는 것인데요. 심지어 두 팔로 균형을 잡는 방법은 누가 알려 준 것이 아니라 스스로 학습을 한 결과라고 합니다.

연구원들은 아틀라스에게 점프와 달리기를 학습시킬 때 한 가지 규칙을 주었습니다. 그 규칙은 바로 “넘어지지 말라!”입니다. 로봇은 장애물을 극복할 때 이 규칙을 꼭 지켜야 합니다. 만약 그 규칙을 지켜서 도착점까지 간다면 보상 점수를 줍니다. 그렇지 않고 중간에 넘어진다면 보상은 없습니다. 이 규칙에 따라 로봇은 계속적인 시행착오를 거쳐 도착점까지 무사히 가는 방법을 학습하였다고 합니다.

자율 주행 자동차에서도 강화 학습 방법을 사용합니다. 자율 주행 관련 인공지능 소프트웨어 스타트업인 웨이브(Wayve.ai)는 어린 아이가 자전거 타는 방법을 터득하듯이 자동차 스스로 운전하는 방법을 학습하는 기술을 개발하였습니다.

자동차의 탑승자는 길에서 자동차가 벗어나거나 방향이 틀어지는 상황만 교정해 주었습니다. 그렇게 수 차례 교정이 반복되자 학습을 시작한 지 15~20분 만에 인공지능 자동차는 스스로 차선을 따라 운전하기 시작하였습니다. 직진뿐만 아니라 커브길도 문제없이 지나갈 수 있었습니다.

TIP

자율 주행 자동차에 대해서는 Unit 7에서 더 자세히 설명합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.