谷歌Gemini Omni发布：多模态AI视频工具，让视频生成更真实

admin AI新闻 2026-06-02 27

在2026年5月20日, 谷歌于I/O开发者大会上, 正式推出了全新的多模态AI视频工具Gemini Omni。这款工具与之前的文本转视频产品（像Veo）不一样, 它是真正能够处理多种输入的系统, 用户不仅能用文字, 还能凭借图片以及现有的视频来生成新视频。不过, 图像和文本的生成功能要等后续版本才会上线。

谷歌Gemini Omni发布：多模态AI视频工具，让视频生成更真实-第1张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

Gemini Omni是基于Gemini模型架构构建而成的, 谷歌将其视为朝着“能够对真实世界进行建模与模拟的AI”迈进的关键一步, 它仿若一个“世界模型”, 拥有高级推理能力, 所生成的视频内容极为酷似现实世界, 并且其物理规律模拟能力颇为强大, 致使视频显得更为真实。

Gemini Omni在功能领域, 其具备的编辑本领颇为出色,用户制成视频而后开运真人app下载苹果版,开运真人app下载, 能够再度导回到工具之中,仅凭借一条文字提示便能够实施精细修正开云app在线入口,开云真人官方下载, 又或者增添额外的媒体素材, 甚至还能够上传自身拍摄的视频, 单独对里面的元素予以更改或者替换, 然而这般深度替换功能也致使人们担忧安全相关问题, 故而谷歌为其内置了防护机制, Omni所生成的全部内容都会自动携带谷歌的SynthID水印, 如此一来用户便能够知晓内容是否是经过AI处理或者篡改过的。体验Gemini Omni, 用户有着好几种方式,它是全然全新改版的Gemini应用里的核心功能开云真人app在线登录, 对于用户而言, 能点击将内置模板添加到相册, 还能够创建和自身外貌、声音相似的自定义数字形象添加到视频里, 自5月20日起, 部分付费订阅用户已然可以在Google Flow和YouTube Shorts上体验Omni功能了, 再过几周, Omni又会借助API向开发者以及企业客户开放, 以供支持定制化集成应用。如同多数Gemini模型那般, Omni划分成Flash与Pro这两个版本, Flash版本已然率先上线, 谷歌当下正致力于研发性能更为强劲的Omni Pro版本, 预计后续将会推向市场。Gemini Omni Flash如今已针对拥有Google AI Plus/Pro/Ultra订阅的用户, 在Gemini应用以及Google Flow之中予以推出。

标签： GeminiOmni AI视频工具多模态AI 视频生成真实模拟

本文地址： http://aoersenchina.com/post/998.html