“방금도 학습했어”…스스로 진화하는 AI, AGI 향한 오픈AI의 새로운 도전¶
원제목: “방금 대화도 바로 학습, 이쯤되면 좀 무서운데”…스스로 진화하는 AI 가동 - 매일경제
핵심 요약
- 오픈AI가 기존의 사전 훈련 방식에서 벗어나 실시간 정보 학습으로 AI 모델을 상시 개선하는 체제를 도입했음.
- 이는 사용자의 피드백과 실시간 연산을 통해 AI가 마치 인간처럼 스스로 진화하는 범용 인공지능(AGI) 구현을 향한 핵심 단계로 평가됨.
- AI의 끊임없는 자기 개선은 성능 향상의 기대와 함께, 통제력 상실 및 안전성 문제에 대한 우려도 동시에 제기하고 있음.
상세 내용¶
오픈AI가 인공지능(AI) 모델 훈련 방식에 혁신적인 변화를 시도하며, ‘상시 학습형’ 모델 운영을 본격화했습니다. 기존에는 특정 시점에 대규모 데이터를 학습시킨 후 배포하는 ‘사전 훈련’ 방식이 주를 이뤘다면, 이제는 AI가 사용자 피드백과 실시간 연산 결과를 바탕으로 끊임없이 스스로를 개선해 나가는 동적 시스템으로 진화하고 있습니다. 이러한 변화는 마치 인간이 새로운 정보를 접하며 배우고 성장하는 과정과 유사하며, AI가 더욱 지능적이고 현실 적응적인 능력을 갖추게 될 가능성을 시사합니다.
오픈AI의 스타게이트 총괄인 피터 호셀레는 최근 행사에서 “훈련과 추론을 더 이상 구분할 필요가 없어졌다”며, AI 모델이 지속적으로 실행되고 샘플링과 훈련을 반복하며 실시간으로 똑똑해지는 새로운 패러다임에 진입했음을 강조했습니다. 이는 AI 응답 단계에서도 추가적인 연산을 수행하여 성능을 개선하는 ‘테스트 타임 컴퓨트’ 개념을 적극적으로 활용하는 것입니다. 모델은 단순히 질문에 답하는 것을 넘어, 추론 과정에서 더 많은 계산 자원을 투입하여 스스로를 더욱 정교하게 다듬습니다.
더 인포메이션에 따르면, 오픈AI는 이미 1년 전부터 ‘테스트 타임 컴퓨트’를 연습해왔으며, 여기에 인간의 피드백을 AI 학습에 반영하는 ‘강화학습’ 기술까지 결합하고 있습니다. 사용자들이 챗GPT의 답변에 ‘좋아요’ 또는 ‘싫어요’를 표시하는 행위 자체가 모델의 실시간 학습 데이터로 활용되며, 이는 강화학습과 추론의 경계를 허물고 AI가 실제 환경 속에서 더욱 효과적으로 진화하도록 만드는 요인이 됩니다.
이러한 ‘상시 학습’ 개념의 도입은 오픈AI 최고경영자(CEO) 샘 올트먼이 지속적으로 강조해온 ‘범용 인공지능(AGI)’ 구현을 향한 중요한 발걸음입니다. 올트먼 CEO는 GPT-5가 아직 완전한 AGI로 보기 어려운 이유 중 하나로 배포 후에도 새로운 정보를 받아들이고 학습하는 ‘지속적 학습’ 능력이 부족하다는 점을 꼽으며, 진정한 AGI에는 이 능력이 필수적이라고 밝힌 바 있습니다. 따라서 오픈AI의 이번 상시 학습 구조는 AGI의 핵심 조건이 실험적으로 구현되기 시작한 단계로 볼 수 있으며, AI가 인간의 피드백을 통해 점점 더 현실에 적응하는 판단을 수행하는 방향으로 변화하고 있음을 보여줍니다.
하지만 이러한 끊임없는 자기 개선 구조는 몇 가지 과제를 안고 있습니다. 응답 단계에서의 추가 연산 증가는 칩 사용량의 대폭 증가를 초래할 수 있으며, AI가 스스로 학습을 반복하는 과정에서 인간이 설정한 초기 목표나 방향에서 벗어나거나 자체적인 판단 체계를 형성할 위험성이 존재합니다. 이로 인해 AI의 안전성과 통제력 유지에 대한 우려가 제기되고 있습니다. 그럼에도 불구하고 오픈AI가 이러한 시도를 감행하는 것은 AI 모델의 근본적인 지능과 능력을 강화하려는 의지로 풀이됩니다. 오픈AI 공동창업자 안드레이 카르파티는 현재 AI 에이전트가 아직 충분히 지능적이지 않으며, 완전한 형태로 작동하기까지 약 10년이 더 걸릴 것으로 예상하며, 인지 능력, 멀티모달 인식, 지속적 학습 등 핵심 요소의 미흡함을 지적한 바 있습니다. 최근 GPT-5가 해결되지 않은 수학 난제를 풀었다고 알려졌으나, 사실은 이미 해결된 문제에 대한 기존 풀이법을 찾아낸 것에 불과했다는 일화는 현재 AI가 가진 한계를 단적으로 보여주는 사례입니다.
편집자 노트¶
이번 오픈AI의 ‘상시 학습형’ AI 모델 도입 소식은 AI 기술 발전의 새로운 이정표를 제시하고 있다고 볼 수 있습니다. 우리가 흔히 접하는 챗봇이나 AI 서비스들은 특정 시점에 학습된 정보를 바탕으로 답변하는 ‘정적인’ 존재에 가까웠습니다. 하지만 이번 오픈AI의 시도는 AI가 마치 살아있는 유기체처럼, 사용자와의 상호작용 및 현실 세계의 변화를 실시간으로 학습하며 스스로 발전해나가는 ‘동적인’ 지능으로 나아가고 있음을 보여줍니다. 이는 단순한 성능 향상을 넘어, AI가 보다 복잡하고 예측 불가능한 환경에서도 스스로 판단하고 적응하는 능력을 갖추게 될 것이라는 기대를 갖게 합니다.
이러한 변화는 궁극적으로 ‘범용 인공지능(AGI)’이라는, 인간과 동등하거나 그 이상의 지능을 가진 AI를 향한 오픈AI의 야심찬 계획의 핵심 동력입니다. AGI는 특정 업무에 국한되지 않고 인간처럼 다양한 분야에서 학습하고 문제를 해결할 수 있는 AI를 의미하는데, 현재의 AI들이 겪고 있는 ‘지속적 학습’의 부재는 AGI 구현에 있어 가장 큰 장벽 중 하나로 여겨져 왔습니다. 오픈AI의 이번 시도는 이러한 장벽을 허물고 AGI의 실현 가능성을 한 걸음 더 높였다고 평가할 수 있습니다. 우리가 앞으로 접하게 될 AI는 마치 오랜 경험을 쌓은 전문가처럼, 시간이 지날수록 더욱 깊이 있는 통찰력과 뛰어난 문제 해결 능력을 보여줄 가능성이 높습니다.
물론 이러한 진화는 긍정적인 측면만큼이나 신중하게 접근해야 할 과제도 동시에 안고 있습니다. AI가 스스로 끊임없이 학습하고 발전하는 과정에서 인간의 통제를 벗어나거나, 예상치 못한 방향으로 진화할 위험성에 대한 우려도 간과할 수 없습니다. AI의 윤리적인 사용, 안전성 확보, 그리고 사회적 영향에 대한 깊이 있는 논의와 제도적 장치 마련이 더욱 중요해지는 시점입니다. 결국 AI의 ‘스스로 진화’는 인류에게 엄청난 혜택을 가져다줄 잠재력을 지니고 있지만, 그 과정에서 발생할 수 있는 위험을 어떻게 관리하느냐에 따라 그 미래가 결정될 것입니다.