Gemini 3.5 Flash Omni 发布

谷歌在 I/O 2026 上发布了什么

截至 2026 年 5 月 20 日，Google I/O 2026 的尘埃尚未完全落定，但已发布的公告已让多模态工具向前迈出了意义重大的一步。Gemini 3.5 Flash 现已成为 Gemini 应用和 Search AI 模式的默认模型。其速度比前代提升约四倍，同时在编码辅助和代理行为方面更加精准，且推理成本更低。在同一活动中，谷歌推出了 Gemini Omni，这是一款多模态世界模型，能够将文本、静态图像、视频片段和音频的任意组合转化为连贯的视频输出。早期演示中，该模型将简短文本提示、参考照片和几秒环境音效拼接成异常稳定的动态画面。Gemini Omni Flash 已立即面向 Google AI Plus、Pro 和 Ultra 订阅者通过主应用、Google Flow 和 YouTube Shorts 推出，更广泛的 API 访问预计将在未来几周内开放。

日常工作流中的更快迭代与更强控制

对创作者而言，速度与一致性比规格参数更重要。Gemini 3.5 Flash 的性能提升将缩短提示到可用输出的时间，这在跨多轮迭代优化序列时尤为关键。代理功能升级还让模型能够规划简单的多步骤任务，例如先生成故事板，再将选定帧扩展为短片。Gemini Omni 的混合输入方式在图生视频流程中尤为实用。创作者可以输入现有静态图、风格参考视频以及描述相机运动的简短语音备注，模型会同时尊重这三项信号输出结果。这种可控性以往需要大量后期制作才能实现。

图像、视频与多模态创作者的实用优势

更好的提示遵循度和角色一致性是创作者在早期测试中最常提到的两项改进。当运动在多镜头中始终锚定同一主体时，剪辑时间会明显缩短。混合媒体提示也让小型创意实验成为可能：将产品渲染图放入生活场景，或在生成画面上叠加对话，而无需从头重建整个镜头。坦白说，在亲自进行几轮混合输入测试后，我发现结果比预期更实用，尽管在复杂相机运动上仍远非完美。此类多模态进步已开始塑造下一代视频工具，包括围绕 Gemini Omni 处理露骨内容的持续讨论，我在此处进行了更详细的探讨：Gemini Omni NSFW：为什么谷歌的 AI 视频模型会屏蔽露骨内容。

创作者现在最关心的问题

我今天如何访问 Gemini 3.5 Flash 和 Gemini Omni？

Gemini 3.5 Flash 已作为 Gemini 应用和 Search AI 模式的默认模型上线。Gemini Omni Flash 立即面向 Google AI Plus、Pro 和 Ultra 订阅者在应用内、Google Flow 和 YouTube Shorts 中开放使用。

哪些提示技巧最适合新的多模态功能？

将清晰的主体描述与参考图像或短片结合使用，并在可能时加入简短音频提示来控制时机或语气。模型对相机运动和光照连续性的明确指令响应良好。

Gemini 3.5 Flash 与早期 Gemini 版本有何不同？

3.5 Flash 版本重点提升了速度、代理规划能力和降低成本。与上一代相比，编码辅助和多步骤任务处理能力均有显著改进。

API 和企业级访问何时推出？

更广泛的 API 访问预计将在未来几周内开放，但谷歌尚未公布确切的企业级 rollout 日期。

Gemini 3.5 Flash Omni 发布：谷歌为创作者推出的多模态 AI 更新

目录

谷歌在 I/O 2026 上发布了什么

日常工作流中的更快迭代与更强控制

图像、视频与多模态创作者的实用优势

创作者现在最关心的问题

我今天如何访问 Gemini 3.5 Flash 和 Gemini Omni？

哪些提示技巧最适合新的多模态功能？

Gemini 3.5 Flash 与早期 Gemini 版本有何不同？

API 和企业级访问何时推出？

创建你自己的AI色情视频

关于作者

您的AI视频已准备好创建

创作您的第一个AI色情视频

检查您的收件箱