美 기업 '최고 오픈 가중치 LLM', 알고 보니 딥시크 모델 미세 조정 버전 'Cogito-v2.1'¶
원제목: The "best open-weight LLM from a US company" is a finetuned Deepseek model
핵심 요약
- 딥시크 모델 기반으로 미세 조정한 Cogito-v2.1이 미국 기업의 최고 오픈 가중치 LLM으로 등장함.
- Cogito-v2.1은 뛰어난 효율성과 짧은 추론 과정으로 벤치마크에서 우수한 성능을 보임.
- 프롬프트 이해, 프로그래밍, 창의성 등 다양한 영역에서 개선된 성능을 제공하며 무료 체험 및 모델 가중치 공개를 지원함.
상세 내용¶
미국 스타트업 딥 코지토(Deep Cogito)가 자사의 최신 대규모 언어 모델(LLM)인 Cogito-v2.1-671B를 공개했습니다. 이 모델은 "미국 기업이 만든 최고의 오픈 가중치 LLM"을 표방하고 있으며, 실제로는 중국의 딥시크(Deepseek) 모델을 기반으로 미세 조정한 버전입니다. Cogito-v2.1은 2024년 11월에 출시된 딥시크의 오픈 소스 모델(아마도 Deepseek R1-Lite)을 재학습시켜 탄생했습니다. 딥 코지토 측은 내부 재학습을 통해 이 모델이 기존의 폐쇄형 및 오픈형 LLM과 경쟁할 수 있는 수준에 도달했으며, GPT-OSS-120B와 같은 다른 미국 기업의 오픈 모델보다 뛰어나다고 주장합니다.
Cogito-v2.1의 가장 큰 강점으로 꼽히는 것은 효율성입니다. 표준 벤치마크 테스트에서 유사한 성능을 가진 다른 시스템들에 비해 훨씬 적은 수의 토큰을 사용한다고 합니다. 이는 API 사용 비용을 절감할 수 있다는 점에서 사용자들에게 매력적인 부분입니다. 또한, 딥 코지토 팀은 모델 학습 시 사고 과정(thought steps)을 모니터링하는 과정을 적용하여, 더 짧은 추론 경로로 결론에 도달할 수 있도록 만들었다고 설명합니다. 이러한 과정을 통해 프롬프트 이해 능력, 프로그래밍 관련 작업, 장문의 질의응답, 창의적인 콘텐츠 생성 등 다양한 영역에서 성능이 향상되었다는 것이 딥 코지토의 발표 내용입니다.
사용자들은 chat.deepcogito.com 웹사이트를 통해 Cogito-v2.1 모델을 무료로 체험해 볼 수 있습니다. 딥 코지토는 이 플랫폼에서 사용자의 채팅 기록을 저장하지 않는다고 강조하며 개인정보 보호를 중시하고 있습니다. 이는 사용자들이 더욱 편안하게 모델을 테스트하고 그 성능을 평가할 수 있도록 하는 중요한 부분입니다. 또한, 모델의 가중치(weights)는 허깅페이스(Hugging Face)에서 공개될 예정이며, 더 작은 규모의 모델 버전들도 추가로 출시될 계획입니다. 이는 개발자들이나 연구자들이 모델을 직접 활용하거나 추가 연구를 진행할 수 있는 기회를 제공할 것으로 기대됩니다.
이번 Cogito-v2.1의 출시는 오픈 소스 LLM 생태계에서 흥미로운 지점을 보여줍니다. 미국 기업이 "자체 개발"한 최고 성능의 LLM이라고 소개했지만, 실제로는 기존에 공개된 다른 우수한 오픈 소스 모델을 기반으로 혁신을 이루어냈다는 점입니다. 이는 LLM 개발 경쟁이 단순히 처음부터 모든 것을 만드는 것에서 나아가, 기존의 뛰어난 기술을 어떻게 더 효율적으로 발전시키고 응용하는지로 확장되고 있음을 시사합니다. 딥 코지토의 접근 방식은 새로운 LLM을 개발하기 위한 잠재적인 경제성과 속도 면에서 중요한 시사점을 제공할 수 있습니다.
결론적으로, 딥 코지토의 Cogito-v2.1은 딥시크 모델이라는 강력한 기반 위에 효율성과 특정 작업 성능을 최적화하여 탄생한 LLM입니다. 비록 기반 모델이 외부에 있지만, 딥 코지토의 미세 조정 기술과 효율성 개선 노력은 사용자들에게 더 저렴하고 성능 좋은 LLM 옵션을 제공할 가능성을 보여줍니다. 무료 체험 기회와 모델 가중치 공개는 이 모델이 LLM 커뮤니티 내에서 얼마나 널리 채택되고 활용될지에 대한 기대를 높이고 있습니다. 앞으로 딥 코지토가 어떤 새로운 발전을 보여줄지 주목할 필요가 있습니다.
편집자 노트¶
이번 뉴스는 최근 LLM 분야에서 벌어지고 있는 치열한 경쟁 속에서 하나의 흥미로운 사례를 보여줍니다. 흔히 "오픈 소스"라고 하면 처음부터 모든 것을 직접 만드는 것으로 생각하기 쉽지만, 딥 코지토의 Cogito-v2.1 사례는 이미 공개된 우수한 오픈 소스 모델을 기반으로 미세 조정(fine-tuning)이라는 과정을 통해 성능을 크게 향상시키고 특정 목적에 최적화하는 것이 얼마나 효과적인지를 잘 보여줍니다. 즉, 기존의 좋은 것을 더욱 날카롭게 다듬는 것만으로도 충분히 경쟁력 있는 결과물을 만들어낼 수 있다는 점입니다.
이것이 일반 사용자들에게 왜 중요하냐 하면, 앞으로 우리가 접하게 될 AI 서비스의 비용과 성능에 직접적인 영향을 미치기 때문입니다. Cogito-v2.1처럼 효율성이 높은 모델은 동일한 성능을 내더라도 더 적은 컴퓨팅 자원을 사용하므로, 이를 기반으로 하는 서비스의 운영 비용이 낮아질 수 있습니다. 이는 곧 AI 기반 서비스의 가격 인하 또는 더 높은 품질의 서비스 제공으로 이어질 수 있다는 의미입니다. 또한, 오픈 가중치 모델은 개발자들이 직접 접근하고 수정하며 활용할 수 있다는 점에서, 더 다양하고 혁신적인 AI 애플리케이션의 등장을 촉진할 수 있습니다. 결국 이러한 기술 발전은 우리 생활 속에서 더 편리하고 똑똑해진 AI를 경험하게 해주는 밑거름이 될 것입니다.