← 全部日报AIGC 信息日报Daily Digest
2026-05-20 · 周三
19 条 · 4 板块
Daily Digest

2026-05-20

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

Google 发布 Flow Agent 产品,将 Gemini 模型智能与项目理解能力结合,帮助用户从创意到落地。官方推文列出 5 种使用方式,但未公开具体功能细节、API 接入方式或定价。该产品面向项目级 AI 协作场景,适用于创意开发、内容生产等流程。

Google 把 Gemini 模型能力打包成项目级 Agent,从创意到落地一条线。做 AI 短剧和技术整合的可以蹲后续看它怎么理解项目上下文、能不能接创作工作流。

Google DeepMind 在 Google I/O 上宣布向所有 Gemini App 用户和 Google 搜索 AI Mode 推送 3.5 Flash 模型。开发者可通过 Antigravity 平台和 Google AI Studio 的 Gemini API 直接调用。3.5 Flash 是 Google 轻量级推理模型,主打低延迟和高吞吐,适用于 Agent 工作流、实时对话、编程辅助等场景。

Google 把 3.5 Flash 铺到 Gemini App 和搜索 AI Mode,开发者还能在 Antigravity 和 AI Studio 里直接调 API。做 AI 编程和 Agent 工作流的可以接 API 测一周,看推理速度和成本控制有没有质变。

Google DeepMind 发布 Gemini 3.5 Flash,性能对标一线模型但价格更低。核心能力:跨大规模代码库的规划与推理、并行部署子 Agent 执行长周期任务,在编程和 Agent 场景上超越前代 3.1 Pro。已开放 API 调用。

Google 把 Gemini 3.5 Flash 的推理和 Agent 能力拉到新高度,价格还比竞品低一截。做 AI 编程和自动化工作流的可以直接接 API 测一周,看长任务并行处理稳不稳。

Google DeepMind 发布 Gemini Omni Flash,为 Omni 系列首款模型,已上线 Gemini App、Flow by Google 及 YouTube Shorts,支持多模态理解与生成。未来数周内将通过 API 开放。

Google 首个 Omni 系列模型上线,多模态理解+生成一步到位,做 AI 短剧和工具链整合的可以蹲 API 开放后实测效果。

Google 在 I/O 大会发布 Gemini 3.5 Flash 模型,定位为 Agent 和编程场景提供前沿性能,擅长处理复杂长周期任务,已通过 Gemini API 在 Google AI Studio 开放调用。

Google I/O 首发 Gemini 3.5 Flash,主打 Agent 和编程场景的长任务推理,做 AI 工作流编排和工具链集成的可以直接接 API 测一周。

工具与能力更新

Tools

Google 旗下 AI 创作工具 Pomelli 发布三项新功能:Pomelli Agent 可帮助用户从零构建核心品牌身份(Logo、配色、字体等);Websites 功能支持几键生成网站;Brand Books 用于统一品牌视觉规范。面向品牌内容创作和商业增长场景,降低品牌视觉搭建门槛。

Google 的 Pomelli 一口气加了品牌 Agent、一键建站和品牌书三个功能,做 IP 和视觉的可以直接用 Agent 搭品牌基础,省掉前期反复对齐的时间。

ComfyUI 官方宣布 Claude 成为其合作伙伴节点,支持将 Claude 直接拖入任意工作流,实现弱 prompt 改写、图像智能描述与批评、向下游节点输出结构化文本,底层由包括 Opus 4.7 在内的前沿模型驱动。

ComfyUI 官方把 Claude 塞进节点生态,做 AI 视觉和整合工作流的可以直接拖节点用,不用再切窗口写 prompt 了。

Leonardo 官方宣布上线 3D 生成功能,基于 Rodin V2 模型,支持从文本或图像直接生成 3D 角色资产,已集成至现有工作流中,用户可在线使用。

Leonardo 正式上线 3D 生成功能,底层用 Rodin V2 模型,做角色 IP 和短剧资产的美术师可以直接上手生成 3D 角色,省掉建模环节。

Google DeepMind 在 Google I/O 上宣布 Flow by Google 接入 Gemini Omni 模型,新增批量编辑(batch editing)和角色一致性(improved character consistency)能力,旨在支持更电影化的叙事创作。具体参数和定价未在推文中公开,需查看官方博客链接。

Google Flow 接入了 Gemini Omni 模型,主打批量剪辑和角色一致性提升,做 AI 短剧和视觉开发的可以直接上手测出片稳定性。

GoogleAI 宣布 Gemini Omni 支持自然语言视频编辑(Conversational editing),用户通过描述即可更改视频中的角色、场景和风格,类似 Nano Banana 但面向视频场景。该功能已集成至 Gemini Omni 产品中,具体技术细节和可用性需查看链接原文。

Google 把自然语言视频编辑塞进 Gemini Omni,改角色、换场景、调风格一句话搞定,做后期和编导的可以直接上手试,省掉拖轨道的时间。

方法与经验

Methods

HeyGen 官方发布 Avatar V 自定义动作教程,讲解如何通过 prompt 控制虚拟角色的眼神接触、说话节奏、停顿、姿态、手势及能量变化,从而塑造更自然的表演。教程面向创作者工作流,未公开具体参数或模型细节。

HeyGen 官方出的 Avatar 动作控制教程,讲怎么用 prompt 调眼神、节奏、停顿、姿态和手势。做虚拟角色对话和 AI 短剧的可以直接套用这套 prompt 思路来控表演细节。

用户 @liu8in 演示了用 OpenAI Codex 一次性生成视频,配合 HeyGen 插件和 HyperFrames 完成从代码到成片的流程,提示词在回复中。该推文为个人实测分享,未公开完整工作流细节或具体参数。

一条实测演示:OpenAI Codex 写代码 + HeyGen 插件 + HyperFrames 一条龙出视频,做 AI 短剧和视觉的可以看看这个工作流能省多少步。

HeyGen 官方发布教程,展示如何将 Avatar Shots 制作的电影感开场,通过 Avatar V 扩展为长视频内容。核心技巧是在 AI Studio 中创建场景间的“自然门户”转场,使多段素材拼接成连续单镜头效果。推文附有完整 prompt 供复现。

HeyGen 官方演示如何用 Avatar V 做长视频场景转场,做 AI 虚拟人内容的可以看看这个“自然门户”拼接思路,跑一遍 prompt 就知道效果稳不稳。

Krea 官方发布 Krea 2 深度教程,涵盖风格参考(style references)、情绪板(moodboards)以及针对 Krea 2 的提示词编写方法,面向希望系统掌握该工具视觉风格控制能力的创作者。

Krea 官方出的 2.0 深度教程,讲风格参考、情绪板、提示词写法,视觉师和编导可以直接当工作流模板用。

Lovart 发布三步产品广告制作流程:上传任意产品照片(手机拍摄即可)→ 用 GPT-Image 2.0 生成 Storyboard → 导入 Seedance 2.0 生成电影级视频。完整 prompt 附在链接中。对做电商广告、短剧物料的美术和制片来说,这套流程降低了产品视频的生成门槛,从单图到成片无需切换工具链。

从手机随手拍到 Seedance 2.0 成片,三步走流程适合做电商广告和短剧物料的美术和制片直接套用,prompt 在链接里。

作品 / 案例

Works

B 站 UP 主「多梦综合征」用 AI 工具制作的三国主题迪曲 MV,将诸葛孔明形象融入快节奏电子舞曲,画面风格混搭古风与赛博元素,节奏卡点密集,属于 B 站 AI 创作大赛三国主题赛参赛作品。

AI 生成的迪曲 MV,把诸葛村夫做成蹦迪主角,视觉师和编导可以拉片看风格混搭和节奏卡点怎么玩。

Bin Liu 用 OpenAI Codex 配合 HeyGen 插件和 HyperFrames,一句 prompt 直接生成完整视频,展示了 AI 编程工具(vibe-coding)替代传统剪辑软件(CapCut)的潜力。视频成品已发布,prompt 在推文回复中。

用 OpenAI Codex 一句话生成 HeyGen 插件 + HyperFrames 视频,做 AI 短剧和编导的可以点开看 prompt 和成品效果,感受 vibe-coding 对剪辑工作流的冲击。

AI 创作者 Gizem Akdag 发布一组名为《Postcards from Italy》的 AI 生成影像作品,内容为意大利主题的视觉风格探索,未公开具体工具链或工作流细节。

AI 视觉师和编导可以点开看看,当风格参考或拉片素材用。

HeyGen 官方大赛 Grand Prize 获奖作品 Pitchframe,基于 HeyGen v3 + HyperFrames 深度集成,构建了从 AI 生成到自动 lint 检查再到修复的完整 agentic 工作流,具备生产级执行能力。该方案展示了 AI 短剧/广告批量制作中自动化质量控制的可行路径。

HeyGen 大赛头奖作品,把生成-检查-修复做成自动化工作流,做 AI 短剧和批量制片的可以直接当模板跑一遍。