콘텐츠로 이동

AI 스타트업, 로봇 학습을 위해 일반인에게 집안일 촬영 비용 지급: 휴머노이드 로봇 시대의 새로운 데이터 수집 전략

원제목: AI Startups Pay People to Film Themselves Doing Chores for Robotics - Business Insider

핵심 요약

  • 로봇은 언어 모델과 달리 실제 세계의 물리적 상호작용 데이터를 필요로 하며, 이는 인터넷에서 쉽게 얻을 수 없는 직접적인 현실 데이터임을 강조함.
  • 인코더, 마이크로1, 스케일 AI 등 AI 훈련 스타트업들이 휴머노이드 로봇 학습을 위해 일반인에게 설거지, 빨래 등 일상적인 집안일 영상을 촬영하도록 요청하고 시간당 25~150달러의 비용을 지급하고 있음.
  • 제프 베조스가 지원하는 피지컬 인텔리전스 같은 휴머노이드 로봇 회사들의 수요가 급증하고 있지만, 로봇을 위한 양질의 훈련 데이터셋이 여전히 부족하여 데이터 수집이 핵심 과제로 남아있음을 지적함.

상세 내용

최근 AI 분야에서 가장 뜨거운 관심을 받는 로봇 공학 부문은 인공지능 언어 모델(LLM)과는 다른 종류의 방대한 훈련 데이터를 필요로 하고 있습니다. LLM이 인터넷상의 텍스트와 이미지 데이터를 활용하여 학습하는 것과 달리, 로봇은 물리적 세계에서 움직이고 상호작용하는 법을 배우기 위해 실제 세계의 데이터를 필요로 합니다. 이는 로봇이 최종적으로 공장 라인에서 일하거나 주방 바닥을 닦는 것과 같은 물리적 작업을 수행하도록 훈련되기 위함입니다. 이러한 데이터는 인터넷에 미리 준비되어 있지 않기 때문에 '맨땅에서부터' 생성해야 하는 어려운 과정이 수반됩니다.

이러한 로봇 훈련 데이터의 부족 문제를 해결하기 위해 엔코드(Encord), 마이크로1(Micro1), 스케일 AI(Scale AI)와 같은 AI 훈련 스타트업들이 새로운 전략을 도입하고 있습니다. 이들 스타트업은 일반인들에게 자신의 집에서 설거지, 빨래 개기, 커피 내리기 등 일상적인 집안일을 하는 모습을 직접 촬영하여 제공하도록 요청하고, 그 대가로 비용을 지급하고 있습니다. 특히 마이크로1의 CEO 알리 안사리는 시간당 25달러에서 50달러까지, 더 기술적인 작업의 경우 엔코드의 공동 창업자 울릭 한센은 시간당 최대 150달러까지 지급한다고 밝혔습니다.

로봇 공학 분야는 비노드 코슬라와 같은 유명 투자자들이 '챗GPT 순간'을 예견하며 막대한 투자를 이어가고 있으며, 올해에만 벤처 캐피탈 투자가 121억 달러에 달할 정도로 급성장하고 있습니다. 스케일 AI는 샌프란시스코 본사에 전담 연구소를 설립하여 현재까지 10만 시간 이상의 훈련 영상을 제작했다고 밝혔으며, 엔코드 또한 작년에 비해 이러한 유형의 데이터 볼륨이 4배 증가했다고 전했습니다.

이러한 데이터의 수요는 아마존 창업자 제프 베조스의 지원을 받는 휴머노이드 로봇 기업 피지컬 인텔리전스(Physical Intelligence)와 로봇개로 유명한 보스턴 다이내믹스(Boston Dynamics)와 같은 회사들로부터 나오고 있습니다. 이들 기업은 사람처럼 움직이고 생각하는 로봇을 만들기 위해 방대한 양의 고품질 실제 행동 데이터를 필요로 합니다. 엔코드와 스케일 AI 모두 피지컬 인텔리전스를 고객으로 언급하며, 이 시장의 잠재력을 시사합니다.

그러나 아직 초기 단계이며, 적합한 훈련 데이터를 찾는 것은 여전히 큰 도전입니다. 한 로봇 스타트업은 크레이그리스트에 광고를 내고 사람들에게 아이폰으로 저녁 식사 준비와 같은 집안일을 촬영하도록 요청하며 시간당 10~20달러를 지급하기도 했습니다. 익명을 요청한 이 스타트업의 창업자는 현재 존재하는 가장 큰 데이터셋도 약 5,000시간 정도에 불과하여 로봇 학습에는 턱없이 부족하다고 언급하며, 양질의 훈련 데이터 확보가 로봇 공학 발전의 주요 걸림돌임을 강조했습니다.


편집자 노트

오늘 소개된 기사는 인공지능 로봇, 특히 휴머노이드 로봇 개발의 핵심적인 난관과 이를 극복하기 위한 새로운 시도를 명확히 보여줍니다. 일반인들에게는 인공지능이라고 하면 거대한 데이터센터에서 인터넷 정보를 학습하는 것을 떠올리기 쉽지만, 로봇 AI는 물리적 세계에서 직접 행동하고 인지하는 방법을 배워야 합니다. 예를 들어, 설거지를 하려면 그릇의 모양을 인식하고, 적절한 힘으로 잡고, 물과 세제를 이용해 닦는 일련의 복잡한 물리적 상호작용이 필요하며, 이는 인터넷상의 텍스트나 이미지로는 가르칠 수 없는 영역입니다. 따라서 로봇이 우리 일상에 들어오기 위해서는 이런 실제 인간의 행동 데이터를 직접 수집해야 하는 상황에 놓여 있습니다.

이러한 뉴스 속 현상은 우리 평범한 사람들에게 두 가지 중요한 의미를 가집니다. 첫째, 로봇이 우리 생활에 더 깊숙이 들어오는 미래가 결코 먼 이야기가 아니라는 점입니다. 지금 우리가 직접 촬영하고 있는 이 집안일 영상들이 미래의 로봇이 빨래를 개고, 요리를 하고, 집을 청소하는 능력을 결정하게 될 것입니다. 둘째, 기술 발전의 과정에서 새로운 형태의 경제 활동이 창출될 수 있다는 가능성입니다. 단순히 집안일을 하는 일상적인 행동이 로봇 학습을 위한 고액의 데이터로 전환되면서, 일반인들이 직접 기술 발전에 기여하고 수익을 얻을 수 있는 독특한 기회가 생기고 있는 것입니다.

결론적으로 이 기사는 휴머노이드 로봇의 상용화를 가속화할 수 있는 중요한 단계를 조명하고 있습니다. 현재는 인간의 노동력을 통해 수동으로 데이터를 수집하지만, 이 과정을 통해 로봇은 점차 스스로 학습하고 복잡한 작업을 수행하는 능력을 갖추게 될 것입니다. 이는 단순히 기술적인 발전을 넘어, 미래에는 우리 집에서 로봇이 요리하고 청소하는 모습을 더 자주 보게 될 것이며, 이 과정에서 생기는 다양한 사회적, 경제적 변화에 대한 깊은 논의가 필요하다는 점을 시사합니다.



원문 링크