Google 在 I/O 2026 发布 Gemini Omni 和 Gemini 3.5 系列模型。Omni 支持多模态输入(图像、音频、视频、文字)直接生成高质量视频,并可通过对话进行视频编辑,底层结合 Gemini 的推理能力。Gemini 3.5 Flash 首发,主打 Agent 和编程场景,擅长复杂长周期任务。
Google I/O 2026 压轴发布:Gemini Omni 能根据任意输入(图片、音频、视频、文字)直接生成视频,还能对话式剪辑;Gemini 3.5 Flash 主打 Agent 和编程。做 AI 短剧和视觉的可以蹲 demo 看生成质量,搞工作流集成的直接看 API 文档。