구글 제미니, AI 영상 제작 시 '여러 참고 이미지'로 디테일 제어 가능해져¶

원제목: Google Gemini now lets users guide AI video with multiple reference images per input

핵심 요약

구글 제미니 앱 업데이트로 AI 영상 제작 시 여러 개의 참고 이미지를 한 번에 입력할 수 있게 되었음.
이는 사용자가 생성될 영상의 시각적 스타일과 분위기를 더욱 정교하게 조절할 수 있도록 지원함.
이번 업데이트는 이전 테스트 플랫폼이었던 '플로우'의 기능을 일부 통합하여 영상 생성의 품질과 사용자 경험을 향상시킴.

상세 내용¶

구글이 AI 영상 생성 모델인 제미니 앱에 새로운 기능을 추가하여 사용자 경험을 한층 끌어올렸습니다. 이번 업데이트의 핵심은 사용자가 단일 영상 프롬프트에 여러 개의 참고 이미지를 동시에 업로드할 수 있다는 점입니다. 이는 기존의 텍스트 기반 프롬프트만으로는 구현하기 어려웠던 복잡하고 세밀한 시각적 요구사항을 충족시키는 데 크게 기여할 것으로 기대됩니다. 제미니는 이렇게 입력된 이미지들과 텍스트 설명을 종합하여 영상과 오디오를 생성하게 됩니다. 이를 통해 사용자는 최종적으로 만들어질 영상의 외형과 사운드에 대해 훨씬 더 직접적이고 강력한 통제력을 갖게 되는 것입니다. 이 기능은 이미 구글의 확장된 AI 영상 플랫폼인 '플로우'에서 테스트되었으며, 플로우는 기존 영상 클립을 연장하거나 여러 장면을 이어 붙이는 기능 또한 지원합니다. 더불어, 플로우는 제미니 앱보다 약간 더 높은 영상 할당량을 제공하는 것으로 알려져 있습니다. 이번 업데이트에 적용된 Veo 3.1 모델은 이미 지난 10월 중순부터 제공되기 시작했으며, 구글에 따르면 Veo 3.0 대비 더욱 사실적인 텍스처 표현, 향상된 입력 충실도, 그리고 개선된 오디오 품질을 자랑합니다. 결과적으로, 이러한 기술 발전은 AI가 생성하는 콘텐츠의 예술적, 상업적 활용 가능성을 크게 넓힐 것으로 전망됩니다. 특히 개인적인 콘텐츠 제작이나 기업의 마케팅 영상 제작 등 다양한 분야에서 더욱 맞춤화되고 고품질의 결과물을 얻을 수 있게 될 것입니다. 이번 업데이트는 AI 영상 생성 기술이 단순한 자동화를 넘어 창의적 도구로서의 역할을 강화하는 중요한 전환점이 될 수 있음을 시사합니다. 사용자의 의도를 AI가 더욱 정확하게 파악하고 시각화하는 데 필요한 기반을 마련한 것이라고 평가할 수 있습니다.

편집자 노트¶

구글 제미니의 이번 업데이트는 AI 영상 생성 분야에서 사용자의 창의적 통제권을 대폭 강화했다는 점에서 매우 주목할 만합니다. 이전까지는 텍스트 설명에 의존하여 AI가 영상을 만들어냈다면, 이제는 여러 장의 사진을 '레퍼런스'로 제공함으로써 사용자가 원하는 영상의 분위기, 스타일, 심지어 특정 사물의 질감까지도 더욱 명확하게 지시할 수 있게 된 것입니다. 이는 마치 디자이너가 클라이언트에게 다양한 디자인 샘플을 보여주며 원하는 방향을 구체화하는 것과 유사하다고 볼 수 있습니다. AI가 단순히 '바닷가에서 뛰노는 강아지'를 그리는 것을 넘어, '따뜻한 햇살 아래, 부드러운 모래 질감의 해변에서, 푸른색 목줄을 한 골든 리트리버가 행복하게 뛰노는' 모습의 영상 스타일을 여러 사진을 통해 제시하며 훨씬 높은 수준의 결과물을 요구할 수 있게 된 셈입니다. 이는 AI 영상 생성 기술이 단순한 자동화 도구에서 벗어나, 개인의 아이디어를 더욱 정밀하고 예술적으로 구현할 수 있는 강력한 창작 파트너로 진화하고 있음을 보여줍니다. 앞으로 우리는 이러한 기술을 통해 개인적인 추억을 더욱 생생하게 영상으로 만들거나, 소규모 사업자들이 비용 부담 없이 전문가 수준의 홍보 영상을 제작하는 등 다양한 분야에서 AI의 도움을 받게 될 것입니다. 물론, 아직은 AI가 인간의 복잡한 감정이나 미묘한 뉘앙스를 완벽하게 이해하고 표현하는 데는 한계가 있겠지만, 이번 업데이트는 그 간극을 좁히는 중요한 발걸음이라고 할 수 있습니다.

원문 링크