콘텐츠로 이동

AI 로봇, 인간처럼 실생활에서 움직이기 위한 훈련 경쟁 심화

원제목: Inside the race to train AI robots how to act human in the real world - Union Leader

핵심 요약

  • AI가 온라인 활동을 마스터한 후, 이제는 실제 세계에서의 물리적 움직임을 학습하는 데 주력하고 있음.
  • 인간의 정밀한 행동 데이터를 수집하여 AI 로봇 훈련에 활용하는 새로운 직업군이 부상하고 있음.
  • 휴머노이드 로봇 시장의 성장 전망과 함께, 로봇의 발전이 노동 시장 및 일상생활에 미칠 영향이 주목받고 있음.

상세 내용

인공지능(AI)이 온라인상 거의 모든 분야에서 능숙함을 보여준 가운데, 이제는 인간이 물리적인 실제 세계에서 어떻게 움직이는지를 배우는 데 집중하고 있습니다. 전 세계적으로 AI 로봇이 컴퓨터를 넘어 우리의 가정, 사무실, 공장으로 진출하도록 돕는 훈련가들이 늘어나고 있으며, 이들은 AI에게 인간의 움직임을 가르치는 역할을 수행하고 있습니다.

인도 남부의 한 산업 도시에서 28세의 나빈 쿠마르는 매일 책상에 앉아 수백 번의 손수건 접기 작업을 정밀하게 반복하며 하루를 시작합니다. 그는 호텔 직원이 아니라 AI 훈련에 필요한 물리적 데이터를 생성하는 스타트업에서 일하는 사람입니다. 그는 이마에 고프로 카메라를 장착하고, 사람이 손수건을 접는 정확한 시점의 영상을 포착하기 위해 계획된 일련의 손동작을 따라 합니다. 그의 임무는 바구니에서 수건을 집어 오른손으로만 잡고, 양손으로 수건을 펴고, 세 번 정확하게 접은 다음, 접은 수건을 책상 왼쪽 구석에 놓는 것입니다. 만약 1분 이상 걸리거나 단계를 하나라도 놓치면 처음부터 다시 시작해야 합니다.

쿠마르가 일하는 Objectways라는 데이터 라벨링 회사는 이러한 손수건 접기 영상 200개를 미국에 있는 고객사에 보냈습니다. 이 회사는 2,000명 이상의 직원을 보유하고 있으며, 절반은 자율주행차 및 로봇 공학 센서 데이터를 라벨링하고, 나머지는 생성 AI 작업을 수행합니다. 대부분의 직원들은 엔지니어이며 손수건 접기 경험이 많지 않아, 물리적인 작업을 돌아가며 수행합니다. 쿠마르는 6년간 Objectways에서 일했으며, "가끔은 손수건을 접거나 물건을 놓는 방식에 사소한 오류가 있어서 150~200개의 영상을 삭제해야 할 때도 있다"고 말했습니다. 이렇게 세심하게 계획된 움직임들은 팔 뻗기, 손가락 쥐기, 천이 미끄러지는 것과 같은 인간의 복잡한 동작의 모든 뉘앙스를 포착하여 옷 접기 등의 동작을 학습시키는 데 사용됩니다.

쿠마르와 그의 팀은 촬영된 영상을 주석 처리하는 작업도 수행합니다. 이들은 영상의 다른 부분에 상자를 그리고, 손수건을 태그하며, 팔이 좌우로 움직였는지 여부를 라벨링하고 각 제스처를 분류합니다. 벵갈루루에서 남쪽으로 약 500km 떨어진 카루르라는 도시에 있는 쿠마르와 그의 동료들은 차세대 AI 기반 로봇을 위한 예상치 못한 튜터들입니다. 샌프란시스코에 본사를 둔 데이터 관리 플랫폼인 Encord의 공동 창립자 울릭 스틱 핸슨은 "기업들이 물리적 세계에 적합한 기반 모델을 구축하고 있다"며 "로봇 공학 분야에 엄청난 부활이 일어나고 있다"고 말했습니다. Encord는 제프 베이조스가 지원하는 Physical Intelligence와 Dyna Robotics와 같은 로봇 공학 회사들과 협력하고 있습니다.

미국에서는 테슬라, 보스턴 다이내믹스, 엔비디아가 차세대 로봇 개발 경쟁을 주도하는 선두 주자 중 하나입니다. 테슬라는 이미 옵티머스 로봇을 다양한 회사 행사에 활용하고 있으며, 구글 역시 자체 AI 로봇 모델을 보유하고 있습니다. OpenAI도 로봇 공학 분야의 야심을 키우고 있습니다. 엔비디아는 휴머노이드 로봇 시장이 향후 10년간 380억 달러 규모에 달할 것으로 전망하고 있습니다. 또한, 대량 생산되는 다목적 휴머노이드 로봇을 현실로 만들기 위해 하드웨어, 소프트웨어, 데이터를 제공하는 수많은 덜 알려진 회사들도 존재합니다. 챗GPT와 같은 챗봇을 구동하는 대규모 언어 모델은 인터넷상의 모든 것을 흡수하여 언어, 이미지, 음악, 코딩 등 다양한 기술을 마스터했습니다. 이들은 인터넷 전체를 활용하여 사물이 어떻게 연결되는지 파악하고 질문에 답하거나 사진처럼 사실적인 비디오를 만드는 등 인간의 행동을 모방합니다. 그러나 손수건을 접는 데 필요한 힘과 같이 물리적 세계가 어떻게 작동하는지에 대한 데이터는 얻기 어렵고 AI가 사용할 수 있는 형태로 변환하는 것도 쉽지 않습니다. 로봇 공학이 발전하고 물리적 세계에서 움직이는 방법을 아는 AI와 결합됨에 따라, 로봇은 직장과 가정에 더 많이 보급될 수 있습니다. 많은 사람들이 이는 일자리 감소와 실업으로 이어질 수 있다고 우려하지만, 낙관론자들은 발전된 로봇이 인간을 지루한 업무에서 해방시키고, 노동 비용을 절감하며, 결국 사람들이 휴식을 취하거나 더 흥미롭고 중요한 업무에 집중할 수 있는 시간을 더 많이 제공할 것이라고 생각합니다.


편집자 노트

이번 기사는 AI 기술이 온라인 영역을 넘어 물리적 세계로 확장을 시도하는 중요한 전환점을 보여줍니다. 그동안 AI가 텍스트, 이미지 등 디지털 정보 처리 능력을 고도화했다면, 이제는 실제 세계의 복잡하고 미묘한 움직임을 이해하고 수행하는 데 집중하고 있다는 점이 흥미롭습니다. 특히, 인간의 정밀한 동작 데이터를 수집하기 위해 전문 인력이 투입되고 있다는 점은 AI 훈련의 새로운 차원을 보여주며, 이는 곧 '데이터 라벨러'라는 직업의 확장 가능성을 시사합니다.

이는 단순한 기술 발전을 넘어 우리 사회 전반에 걸쳐 파급 효과를 가져올 수 있습니다. 휴머노이드 로봇이 더욱 정교해지고 실생활에 도입된다면, 육체적으로 힘들거나 반복적인 업무에서 인간을 해방시켜 줄 수도 있습니다. 물론 일자리 감소에 대한 우려도 존재하지만, 장기적으로는 인간이 보다 창의적이고 고부가가치 업무에 집중할 수 있는 환경을 조성할 가능성도 있습니다. 로봇이 단순 노동을 대체하고 인간의 삶의 질을 향상시키는 미래를 기대해 볼 수 있습니다.



원문 링크