콘텐츠로 이동

EmbodiedBrain: 실제 환경에 강한 AI를 위한 로보틱스 '사고력' 한계 넓히다

원제목: EmbodiedBrain: Expanding Performance Boundaries of Task Planning for Embodied Intelligence

핵심 요약

  • 실제 세계에서 작동하는 AI(Embodied AI)의 핵심인 '작업 계획' 성능을 획기적으로 개선하는 새로운 모델 'EmbodiedBrain'이 개발되었음.
  • 기존 AI 모델의 한계를 극복하기 위해 AI 에이전트 맞춤형 데이터 구조와 강화 학습 기법, 효율적인 보상 시스템을 통합했음.
  • 이 연구는 인간처럼 실제 환경에서 복잡한 작업을 수행할 수 있는 차세대 범용 AI 개발의 초석을 마련할 것으로 기대됨.

상세 내용

인공 일반 지능(AGI)의 실현은 물리적 환경에서 견고한 공간 인식, 효과적인 작업 계획, 적응적인 실행이 가능한 Embodied AI 에이전트의 구현을 필요로 합니다. 그러나 현재 Embodied 작업에 사용되는 대규모 언어 모델(LLM) 및 멀티모달 LLM(MLLM)은 모델 설계와 에이전트 요구사항 간의 상당한 격차, 실시간 지연과 성능 간의 피할 수 없는 상충 관계, 비정통적인 오프라인 평가 지표 사용 등 주요 한계점에 직면해 있습니다. 이러한 과제를 해결하기 위해 7B 및 32B 매개변수 크기로 제공되는 새로운 비전-언어 기초 모델인 EmbodiedBrain을 제안합니다. 우리 프레임워크는 에이전트 맞춤형 데이터 구조를 특징으로 하며, 이전 단계를 '안내 선행 학습(Guided Precursors)'으로 통합하여 장기적인 작업 성공을 증진시키는 Step-Augmented Group Relative Policy Optimization(Step-GRPO)을 통합한 대규모 지도 학습 미세 조정(SFT)을 활용하는 강력한 훈련 방법론을 사용합니다. 또한, 훈련 효율성을 개선하기 위해 인프라 수준에서 가속화된 생성형 보상 모델(GRM)을 포함한 포괄적인 보상 시스템을 통합합니다. 철저한 검증을 위해 일반, 계획, 엔드-투-엔드 시뮬레이션 벤치마크를 포괄하는 3부문 평가 시스템을 구축했으며, 새롭고 도전적인 시뮬레이션 환경의 제안 및 오픈 소싱이 강조되었습니다. 실험 결과는 EmbodiedBrain이 모든 지표에서 우수한 성능을 달성하여 Embodied 기초 모델의 새로운 최첨단 기술을 확립했음을 보여줍니다. 차세대 범용 Embodied 에이전트의 길을 열기 위해 모든 데이터, 모델 가중치 및 평가 방법을 오픈 소싱했습니다. 이는 해당 URL에서 확인할 수 있습니다. EmbodiedBrain은 특히 로보틱스와 같이 실제 환경에서 AI의 의사 결정 및 실행 능력을 향상시키는 데 중점을 둡니다. 이 모델은 복잡한 명령을 이해하고, 일련의 단계를 계획하며, 물리적 세계에서 이를 실행하는 능력을 향상시킵니다. 이는 기존 AI가 주로 텍스트 기반 또는 가상 환경에서의 성능에 집중했던 것과는 다른 접근 방식입니다.


편집자 노트

이 연구는 'Embodied AI', 즉 물리적인 세계에서 실제로 작동하는 AI에 대한 현재의 큰 난제를 해결하기 위한 중요한 진전을 보여줍니다. 핵심은 AI가 단순히 정보를 처리하는 것을 넘어, 실제 환경에서 '무언가를 할 수 있는 능력'을 갖추도록 만드는 것입니다. 이를 위해 EmbodiedBrain은 AI가 마치 사람처럼 주어진 목표를 달성하기 위해 여러 단계를 계획하고 실행하는 능력을 강화하는 데 초점을 맞추었습니다. 특히, AI가 단순히 이전 단계를 학습하는 것을 넘어, 이를 '교훈' 삼아 미래의 행동을 더 잘 계획하도록 하는 '안내 선행 학습' 방식은 매우 흥미로운 지점입니다. 이는 마치 우리가 어떤 일을 처음 해볼 때, 과거의 비슷한 경험을 떠올려 더 능숙하게 대처하는 것과 유사합니다. 또한, AI 훈련 과정에서 발생하는 지연 문제를 줄이고 성능을 높이기 위한 '생성형 보상 모델(GRM)'의 인프라 수준 가속화 및 'Step-GRPO'와 같은 새로운 훈련 기법의 도입은 실용적인 측면에서 큰 의미를 갖습니다. 이를 통해 AI는 더 빠르고 정확하게 학습하며, 결과적으로 더 복잡하고 장기적인 임무를 성공적으로 수행할 수 있게 됩니다. 이 연구는 궁극적으로 인간과 상호작용하거나 복잡한 작업을 수행할 수 있는 더욱 지능적이고 유능한 로봇이나 AI 에이전트의 등장을 예고합니다.



원문 링크