포스테키안

2019 겨울호 / Creative Postechian

2020-01-28 110

Creative Postechian / 강화학습을 활용한 동물수준의 공간지능 구현

안녕하세요? 저는 ‘강화학습을 활용한 동물 수준의 공간지능 구현’이라는 주제로 연구를 진행하고 있는 창의IT융합공학과 13학번 주동욱입니다. 저는 이번 ‘내 연구를 소개합니다’에서 제 연구 주제에 대해서 발표했습니다. ‘내연소’는 연구자들이 PPT 없이 소도구만을 활용하여 3분 동안 자신의 연구를 일반인들에게 설명하는 페임랩 형식의 대회입니다. 대회에서는 저와 전공이 다르거나 관련 지식이 없는 분들에게 최대한 쉽게 설명하기 위하여, 제가 스스로 시뮬레이션 속 인공지능이 되어서 강화학습을 진행해 가는 과정을 직접 보여드리는 형태로 발표를 하였습니다. 이를 통해 청중들의 이해에 도움을 주었던 것 같습니다.

발표 주제는?

최근, 인공지능의 급성장과 함께 연구자들은 인공지능이 동물의 지능과 비교했을 때 어느 정도의 수준에 도달하였는지 궁금해 하기 시작했습니다. 이를 알아보기 위해 동물 지능을 평가하는 실험을 그대로 묘사한 시뮬레이션에서 인공지능을 학습하고 평가하는 연구를 진행하고 있습니다. 저도 이와 같은 호기심을 가지고 강화학습을 활용한 동물 수준의 공간지능 구현이라는 주제로 연구를 진행하고 있습니다.

발표 내용은?

강화학습은 시행착오를 통하여 자신의 행동 방식을 최적화하는 학습 방법입니다. 제가 하는 연구 속 인공지능은 3차원 시뮬레이션 공간에서 음식을 상징하는 초록색 구체를 찾아가는 것을 목표로 학습을 진행합니다. 이리저리 움직이며 주변을 탐색하면서, 인공지능은 강화학습을 통하여 긍정적 보상을 받을 수 있는 확률을 높이는 쪽으로 학습합니다. 인공지능의 공간지능은 단순히 주어진 목표로 다가가는 것만을 의미하지 않습니다. 목표인 물체가 보이지 않을 때는 주변을 효율적으로 탐색하여 주어진 시간 안에 목표를 발견하고 다가가야 합니다. 이러한 과정에서 위험한 지역과 먹어서는 안 되는 붉은색 구체는 피해 가야 합니다. 조금 더 복잡한 시뮬레이션에서는 인공지능의 기억력을 시험하기 위하여 주기적으로 불을 꺼서 시각적 입력을 차단하기도 합니다. 저는 인공지능을 3개의 부분으로 나누어서 연구를 진행합니다. 첫 번째는 시각적 모델로 주어진 입력을 바탕으로 공간의 정보를 압축하는 역할을 합니다. 두 번째는 시간적 모델로, 주어진 입력들 사이의 시간적인 관계를 파악하는 역할을 합니다. 그리고 마지막은 제어 모델로, 앞의 시각적 모델과 시간적 모델의 정보를 바탕으로 효율적인 작업을 수행할 수 있는 행동을 취하도록 학습합니다.

내연소 발표 영상 https://youtu.be/wkC4bBTG3ds

무엇을 알았나?
현재의 인공지능은 아직 동물의 수준까지는 도달하지 못하였습니다. 그리고 저는 강화학습을 통하여 이를 해결하려는 연구를 진행하고 있습니다. 매년 놀라우리만큼 성과가 발생하고 있는 분야라 머지않은 미래에 우리의 주변에서 능수능란하게 작업을 수행해내는 인공지능을 만나게 될 수도 있을 것 같습니다.


창의IT융합공학과 13학번  주동욱