인간처럼 행동하는 AI 로봇 훈련 경쟁의 이면: 현실 세계에서의 움직임 학습¶
원제목: Inside the race to train AI robots how to act human in the real world - Arizona Daily Star
핵심 요약
- AI 로봇이 실제 세계에서 인간처럼 움직이고 행동하기 위한 물리적 데이터 학습이 중요해지고 있음.
- 인도와 같은 곳에서 인간의 일상 행동을 정밀하게 기록하고 라벨링하는 데이터 훈련 작업이 활발히 진행되고 있음.
- 로봇 기술과 AI의 결합으로 인간형 로봇 시장이 급성장할 것으로 예상되며, 이는 우리의 일상과 노동 시장에 큰 영향을 미칠 것임.
상세 내용¶
온라인 세상에서 거의 모든 것을 습득한 인공지능(AI)은 이제 실제 세계에서 인간처럼 움직이는 방법을 배우는 데 도움을 필요로 하고 있습니다. 이에 따라 전 세계적으로 AI 로봇에게 인간의 물리적인 움직임을 가르치는 '트레이너'들이 늘어나고 있습니다. 인도 남부의 한 산업 도시에 거주하는 28세의 나빈 쿠마르 씨는 바로 이러한 훈련을 제공하는 스타트업에서 일하는 사람 중 한 명입니다. 그의 일상은 수백 번씩 손수건을 최대한 정확하게 접는 것입니다.
쿠마르 씨는 호텔 직원이 아니라, AI 훈련에 필요한 물리적 데이터를 생성하는 회사에서 근무합니다. 그는 이마에 GoPro 카메라를 부착하고, 사람이 물건을 접는 정확한 시점의 영상을 포착하기 위해 정해진 순서대로 손 움직임을 따라 합니다. 이날 그는 오른쪽 바구니에서 수건을 집어 오른손으로만, 양손으로 수건을 펴서, 세 번 깔끔하게 접은 후 책상 왼쪽 모서리에 두어야 했습니다. 만약 1분 이상 걸리거나 단계를 하나라도 놓치면 처음부터 다시 시작해야 합니다.
그가 일하는 Objectways라는 데이터 라벨링 회사는 고객사인 미국 회사에 200개의 손수건 접기 영상을 보냈습니다. 이 회사는 2,000명 이상의 직원을 보유하고 있으며, 이 중 절반은 자율 주행 자동차 및 로봇 공학의 센서 데이터를 라벨링하고, 나머지는 생성형 AI 관련 업무를 수행합니다. 대부분 엔지니어이며, 숙련된 사람들은 돌아가면서 이 물리적인 노동을 담당합니다. 쿠마르 씨는 "접는 방식이나 물건을 놓는 과정에서 사소한 실수가 발생하여 약 150~200개의 영상을 삭제해야 할 때도 있다"고 말합니다. 이러한 세심하게 안무된 움직임은 팔을 뻗거나, 손가락으로 잡거나, 천이 미끄러지는 등 옷을 접을 때 인간이 하는 모든 미묘한 동작을 포착하기 위함입니다.
포착된 영상은 쿠마르 씨와 그의 팀이 주석을 답니다. 그들은 영상의 여러 부분 주위에 상자를 그리고, 수건을 태그하며, 팔이 왼쪽 또는 오른쪽으로 움직였는지 여부를 라벨링하고 각 제스처를 분류합니다. 카루르 지역의 쿠마르 씨와 동료들은 차세대 AI 기반 로봇의 예상치 못한 튜터가 되고 있습니다. Encord의 공동 창립자인 울릭 스틱 한센은 "기업들이 물리적 세계에 적합한 기반 모델을 구축하고 있으며, 로봇 공학 분야에서 엄청난 재부흥이 일어나고 있다"고 설명합니다. Encord는 Jeff Bezos가 투자한 Physical Intelligence 및 Dyna Robotics와 같은 로봇 공학 회사들과 협력하고 있습니다.
Tesla, Boston Dynamics, Nvidia 등은 미국에서 차세대 로봇 개발 경쟁을 선도하고 있습니다. Tesla는 이미 Optimus 로봇을 다양한 회사 행사에 사용하고 있으며, Google은 자체 AI 로봇 모델을 보유하고 있습니다. OpenAI 역시 로봇 공학 분야의 야심을 키우고 있습니다. Nvidia는 인간형 로봇 시장이 향후 10년 안에 380억 달러 규모에 달할 것으로 예상합니다. 또한, 대량 생산이 가능한 다목적 인간형 로봇을 현실로 만들기 위해 하드웨어, 소프트웨어, 데이터를 제공하려는 수많은 덜 알려진 회사들도 존재합니다. ChatGPT와 같은 챗봇을 구동하는 대규모 언어 모델은 온라인의 모든 것을 흡수하여 언어, 이미지, 음악, 코딩 등의 기술을 습득했습니다. 이들은 인터넷 전체를 사용하여 사물이 어떻게 연결되는지 파악하고 질문에 답하거나 사실적인 비디오를 만드는 등 우리의 행동을 모방합니다. 하지만 천을 접는 데 필요한 힘의 양과 같이 물리적 세계가 어떻게 작동하는지에 대한 데이터는 얻고 AI가 사용할 수 있는 형태로 번역하기가 훨씬 더 어렵습니다. 로봇 공학이 발전하고 물리적 세계에서 움직이는 방법을 아는 AI와 결합함에 따라, 더 많은 로봇이 직장과 가정에 들어올 수 있습니다. 많은 사람들이 이를 일자리 감소와 실업으로 이어질 것을 두려워하지만, 낙관론자들은 발전된 로봇이 인간을 지루한 작업에서 해방시키고 노동 비용을 절감하며 궁극적으로 사람들이 휴식을 취하거나 다른 일에 집중할 시간을 더 많이 제공할 것이라고 생각합니다.
편집자 노트¶
이번 기사는 AI가 온라인상의 지식 습득을 넘어, 이제 물리적 세계에서의 인간의 행동을 학습하는 단계로 진입했음을 보여줍니다. 특히, 인도에서 일상적인 작업(손수건 접기 등)을 수행하는 모습을 영상으로 기록하고 이를 AI 학습 데이터로 가공하는 과정을 상세히 묘사한 점이 인상 깊습니다. 이는 단순히 알고리즘 개발에 그치지 않고, 인간의 실제 경험과 움직임을 데이터화하는 '인간 데이터 라벨링'이라는 새로운 분야의 중요성을 부각합니다.
우리가 흔히 생각하는 AI 훈련이 컴퓨터 화면 앞에서 이루어진다고 생각하기 쉽지만, 실제로는 로봇이 인간처럼 자연스럽게 행동하기 위해서는 인간의 섬세한 움직임, 힘 조절, 사물과의 상호작용 등을 학습해야 합니다. 이를 위해 쿠마르 씨와 같은 사람들은 매우 구체적이고 반복적인 작업을 수행하며, AI가 이해할 수 있는 형태의 데이터를 만들어냅니다. 이러한 과정은 AI가 가정에서 가사 노동을 돕거나, 공장에서 위험한 작업을 대신하거나, 혹은 인간과의 협업을 통해 새로운 가치를 창출하는 미래를 현실로 만드는 밑거름이 됩니다. 물론 이 과정에서 일자리 변화에 대한 우려도 존재하지만, 장기적으로는 인간이 더욱 창의적이고 가치 있는 일에 집중할 수 있도록 돕는 긍정적인 측면도 기대해 볼 수 있습니다.