연구

RESEARCH

연구성과

성영철 교수 연구실 김정혜 · 이소정 학생, 거대언어모델 에이전트 최고 성능 달성

성영철 교수님 연구실 900
<(왼쪽부터) 김정혜 박사과정, 이소정 석사과정, 성영철 교수>

2022년 말 OpenAI의 ChatGPT의 출현과 더불어 생성형 거대언어모델 (Large Language Models-LLM)은 인공지능의 핵심 연구 분야 중에 하나이다. 

 

현재 거대언어모델은 단지 프롬프트로 주어진 언어를 이해하고 그에 맞은 해답을 제시하는 것을 넘어 환경과 상호작용하면서 Multi-Round 행동, 관측 및 추론 과정을 거치며 주어진 태스크를 수행하는 LLM 에이전트(Agent)로 발전하고 있다. 이러한 Agentic AI는 앞으로 인간의 간섭없이 인공지능 스스로 환경과 상호작용하면서 주어진 태스크를 실행해야 하는 수많은 현실적인 문제에 있어 핵심적인 발전방향이다. 

 

예를 들어, 가사도우미 로봇에게 인간이 “된장찌개 끓이기”라는 태스크를 수행시켰을 때 로봇 스스로 필요한 재료를 모두 찾고 그것을 손질하고, 냄비에 넣고 가스레인지 위에 올려서, 불을 켜서 끓이고, 요리가 완성되면 불을 꺼야하는 것이다. 이 하나하나의 과정을 인간이 일일이 지시할 수 없고, 로봇 스스로 환경과 상호작용하면서 행동하고, 그 결과를 관측하고, 이를 바탕으로 추론하고 다음 행동을 해야 하는 것이다. 

 

이를 위한 대표적 LLM Agent 모델이 2023년 Google Brain과 프린스턴대에서 발표한 ReAct 이다. ReAct 는 미래 plan을 고려하면서 각 단계에서의 행동을 결정하는 모델이다. 하지만, ReAct는 때로는 실제 상황과 동떨어진 인지(Hallucination)를 하고 잘못된 행동을 하는 경우가 많은 한계점을 가진다.

 

성영철 교수 연구실 김정혜 (박사과정), 이소정 (석사과정) 학생은 서울대 정교민 교수 연구실과 공동연구로 이러한 ReAct Agent의 단점을 극복하는 ReflAct라는 새로운 LLM Agent 모델을 제안하였다.  

 

새롭게 제안된 ReflAct는 매 순간 최종 목표와 현재 상황을 동시에 고려하면서 최적의 행동을 결정하는 구조로서, Hallucination 가능성을 현저히 줄이고, 뿐만 아니라 Agent 스스로 자신의 잘못된 판단까지 인지할 수 있게 되었다. 그리하여, ReflAct가 최신 추론 언어모델과 결합되었을 때 가사도우미 환경인 ALFWorld Benchmark에서 93.3% 라는 놀라운 태스크 성공률을 달성하였다. 이 결과는 가사도우미 뿐만 아니라 과학 탐사, 전투 현장 등 다양한 환경에서 활용될 Agent AI의 발전을 한층 촉진시킬 것이다. 이 결과는 자연어처리 최대학회 중 하나인 EMNLP 2025의 Main Conference에서 오는 11월 발표될 예정이다. 

 

관련논문 링크: https://arxiv.org/pdf/2505.15182