콘텐츠로 이동

AI 비디오 기술, 휴머노이드 로봇 훈련 속도 획기적으로 향상

원제목: AI video tech fast-tracks humanoid robot training - AOL.com

핵심 요약

  • AI 기반 비디오 생성 기술로 로봇 훈련 데이터 생성 비용과 시간을 대폭 절감함.
  • 새로운 기술 Vidar는 기존 방식보다 훨씬 적은 데이터로 로봇 훈련 가능하게 함.
  • 가정, 병원, 사무실 등 일상 환경에서 로봇 활용 가능성이 높아짐.

상세 내용

중국의 ShengShu Technology는 휴머노이드 로봇 훈련의 혁신적인 기술인 Vidar를 개발했습니다. Vidar는 'Video Diffusion for Action Reasoning'의 약자로, 실제 비디오 데이터와 AI가 생성한 합성 비디오를 결합하여 로봇 훈련을 위한 가상 환경을 구축합니다. 이 기술은 기존의 방대한 실제 데이터 수집 방식에 비해 비용과 시간을 획기적으로 줄여줍니다. Vidar는 실제 데이터와 합성 데이터를 혼합하여 학습하는 ShengShu의 Vidu 비디오 모델과, 이 지식을 로봇의 동작 명령으로 변환하는 AnyPos 시스템으로 구성됩니다. 이러한 모듈식 설계 덕분에 다양한 로봇에 대한 훈련 속도가 향상되고 배포가 용이해졌습니다.

기존 방식은 로봇이 실제 환경과 상호작용하며 학습해야 했지만, Vidar는 복잡하고 실제와 같은 시나리오를 가상으로 시뮬레이션할 수 있습니다. 놀랍게도 Vidar는 기존 주요 모델 대비 1/80에서 1/1200 수준인 약 20분 분량의 훈련 데이터만 필요로 합니다. 이러한 효율성은 전례 없는 수준으로 로봇 훈련 규모를 확장할 수 있게 합니다.

Vidar는 단순한 연구 도구를 넘어 실제 로봇이 새로운 작업과 환경에 빠르게 적응하도록 설계되었습니다. 노인 돌봄, 가정 지원, 의료 및 스마트 제조와 같은 분야에서 실질적인 응용이 가능해질 전망입니다. 시뮬레이션과 현실의 격차를 해소함으로써, Vidar는 휴머노이드 로봇을 미래의 개념이 아닌 실용적인 도우미로 자리매김하고 있습니다.

소비자 입장에서 Vidar는 가정이나 직장에서 로봇 도우미를 현실로 만들어 줄 기술입니다. 수십 년을 기다릴 필요 없이, 확장 가능한 훈련 방식을 통해 일상 환경에서 로봇 배치 속도를 높일 수 있습니다. 즉, 예상보다 빠른 시일 내에 로봇이 집안일을 돕거나, 노인 돌봄을 지원하거나, 의료 환경에서 도움을 줄 수 있게 될 것입니다.

Vidar는 실용적인 휴머노이드 로봇 개발 경쟁에서 중요한 이정표입니다. 제한된 실제 데이터와 생성 비디오를 결합함으로써, ShengShu는 물리적 AI를 더욱 스마트하고 빠르게 훈련하는 방법을 만들었습니다. 이 접근 방식은 로봇 공학 발전을 오랫동안 저해해 온 비용, 효율성 및 확장성 문제를 동시에 해결합니다.


편집자 노트

이번 ShengShu Technology의 Vidar 개발은 로봇 공학 분야의 중요한 진전입니다. 특히, 훈련 데이터 생성에 드는 막대한 비용과 시간을 획기적으로 줄임으로써, 휴머노이드 로봇의 상용화를 앞당길 가능성을 제시합니다. 이는 단순히 로봇 개발 속도를 높이는 것을 넘어, 우리 일상생활에 로봇이 실질적인 도움을 줄 수 있는 미래를 앞당기는 것을 의미합니다.

Vidar의 핵심은 실제 데이터와 AI 생성 데이터의 효율적인 결합입니다. 이를 통해 로봇은 실제 환경에서 경험하기 어려운 다양한 상황을 가상으로 학습하고, 실제 상황에 대한 적응력을 높일 수 있습니다. 이는 로봇의 학습 능력을 크게 향상시켜 가정, 병원, 사무실 등 다양한 환경에서 로봇 활용 가능성을 높여줍니다. 궁극적으로 Vidar와 같은 기술의 발전은 로봇이 인간과 공존하며 삶의 질을 향상시키는 데 크게 기여할 것으로 기대됩니다.



원문 링크