구글, '반중력' 플랫폼 공개와 함께 차세대 AI '제미나이 3' 출시¶
원제목: Google releases Gemini 3: Launches 'Antigravity' Platform - The Stack
핵심 요약
- 구글이 100만 토큰 컨텍스트 창을 갖춘 차세대 대규모 언어 모델 '제미나이 3'를 출시했음을 알림.
- 새로운 AI 개발 플랫폼 '구글 안티그래비티'를 공개하며 AI 에이전트 시대의 소프트웨어 개발 중심지 역할을 목표함을 강조함.
- 제미나이 3가 여러 AI 성능 벤치마크에서 우수한 성적을 거두었으나, 일부 안전성 및 추론 능력에서는 기존 모델과 큰 차이가 없거나 낮은 점수를 기록하기도 했음을 지적함.
상세 내용¶
구글이 오랫동안 기다려온 차세대 대규모 언어 모델인 '제미나이 3'를 공식적으로 출시했습니다. 제미나이 3는 100만 토큰에 달하는 방대한 컨텍스트 창을 지원하는 트랜스포머 기반의 멀티모달 모델로, 구글의 자체 TPU 하드웨어에서 훈련되었습니다. 이번 출시와 함께 제미나이 3는 즉시 구글 검색에 통합되어, 사용자 쿼리에 기반한 몰입형 시각적 레이아웃, 대화형 도구 및 시뮬레이션과 같은 새로운 생성적 UI 경험을 제공할 예정입니다. 이는 구글 검색에 AI 모델이 직접 통합되는 최초의 사례입니다.
구글에 따르면, 제미나이 3는 ARC-AGI-2와 같은 까다로운 추론 벤치마크에서 45.1%라는 전례 없는 점수를 기록하며 새로운 과제를 해결하는 능력을 입증했습니다. 또한 WebDev Arena 리더보드에서는 1487 Elo 점수로 GPT-5와 Claude Opus 4.1을 제치고 최고 순위에 올랐으며, 터미널에서의 컴퓨터 작동 능력을 테스트하는 Terminal-Bench 2.0에서는 54.2%의 점수를 획득했습니다. 코딩 에이전트 벤치마크인 SWE-bench에서는 '제미나이 2.5 Pro'를 크게 능가하는 성능을 보였습니다. 추가적으로, '제미나이 3 딥 씽크(Deep Think)'라는 파트너 모델도 현재 안전성 테스트 중이며, 수 주 내에 출시될 예정입니다.
한편, 구글은 AI 에이전트 시대의 소프트웨어 개발을 위한 '허브'를 지향하는 새로운 플랫폼 '구글 안티그래비티(Google Antigravity)'도 함께 공개했습니다. 이 플랫폼은 개발자들이 AI 에이전트 환경에서 효율적으로 작업할 수 있도록 지원할 것으로 기대됩니다. 제미나이 3는 일반 사용자용 '제미나이 앱', 'AI 모드 인 서치'의 유료 구독자, 개발자용 '제미나이 API' 및 'AI 스튜디오', '제미나이 CLI', 그리고 기업용 '버텍스 AI' 서비스 플랫폼 및 '제미나이 엔터프라이즈' 등 다양한 방식으로 제공될 예정입니다.
하지만 이번 발표에는 과장된 기대감을 진정시키기 위한 신중한 분석도 함께 제시되었습니다. 구글 자체의 '제미나이 3 프론티어 안전 프레임워크 보고서'에 따르면, 생물학 및 화학 분야에서는 전반적으로 높은 과학적 정확도를 보였으나, 웹에서 이미 이용 가능한 정보 대비 '새로운 내용'은 상대적으로 낮은 수준을 나타냈습니다. 또한, AI 안전성 벤치마크인 'CCL(Critical Capability Level)'의 '도구적 추론 레벨 1' 항목에서는 제미나이 2.5 Pro의 점수를 일관되게 개선하지 못했으며, 오히려 여러 경우에서 더 낮은 점수를 기록했다고 명시하고 있습니다.
보안 측면에서 구글은 프롬프트 주입 공격을 완화하기 위해 여러 단계의 방어 전략을 적용하고 있다고 밝혔습니다. 여기에는 프롬프트 주입 콘텐츠 분류기, 강화학습을 통한 보안, 마크다운 위생 처리 및 의심스러운 URL 삭제, 사용자 확인, 최종 사용자 보안 완화 알림 등의 조치가 포함됩니다. 이러한 조치들은 2025년 6월 블로그 게시물에 상세히 설명된 내용을 기반으로 합니다. 구글의 이번 제미나이 3 출시와 안티그래비티 플랫폼 공개는 AI 기술의 발전을 보여주지만, 동시에 현실적인 성능과 안전성에 대한 철저한 검증의 필요성도 제기하고 있습니다.
편집자 노트¶
구글의 '제미나이 3' 출시와 '안티그래비티' 플랫폼 공개는 AI 기술 경쟁이 한층 치열해지고 있음을 보여주는 중요한 소식입니다. 특히 100만 토큰이라는 방대한 컨텍스트 창과 다양한 벤치마크에서의 우수한 성과는 제미나이 3가 기존 모델들을 뛰어넘는 성능을 보여줄 잠재력을 시사합니다. 이는 우리가 앞으로 AI와 상호작용하는 방식, 예를 들어 복잡한 문서 요약이나 긴 대화 기억 등에 큰 변화를 가져올 수 있습니다. 검색 엔진에 직접 통합되는 것은 사용자들이 AI의 강력한 기능을 일상적으로 경험하게 만드는 중요한 단계입니다.
그러나 이번 발표에서 주목할 점은 구글 스스로 밝힌 제미나이 3의 한계입니다. 과학적 정확성은 높지만 '새로운 정보'가 부족하고, '도구적 추론' 능력에서 이전 모델보다 뒤처지는 부분이 있다는 점은 AI 기술 발전의 복잡성을 보여줍니다. 이는 단순히 모델의 크기나 학습 데이터 양을 늘리는 것을 넘어, 실제 문제 해결 능력과 안전성, 그리고 독창적인 사고 능력까지 발전시켜야 하는 AI 연구의 과제를 드러냅니다. '안티그래비티' 플랫폼은 이러한 AI 개발 및 에이전트 시대에 대비하려는 구글의 전략적 움직임을 보여주며, 앞으로 AI 개발 생태계에 어떤 영향을 미칠지 주목됩니다.