2026-05-20 · 周三

19 条 · 4 板块

Daily Digest

2026-05-20

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

01 @FlowbyGoogle Google Flow @FlowbyGoogle · 2小…

Google 发布 Flow Agent 产品，将 Gemini 模型智能与项目理解能力结合，帮助用户从创意到落地。官方推文列出 5 种使用方式，但未公开具体功能细节、API 接入方式或定价。该产品面向项目级 AI 协作场景，适用于创意开发、内容生产等流程。

Google 把 Gemini 模型能力打包成项目级 Agent，从创意到落地一条线。做 AI 短剧和技术整合的可以蹲后续看它怎么理解项目上下文、能不能接创作工作流。

02 @GoogleDeepMind We’re rolling out 3

Google DeepMind 在 Google I/O 上宣布向所有 Gemini App 用户和 Google 搜索 AI Mode 推送 3.5 Flash 模型。开发者可通过 Antigravity 平台和 Google AI Studio 的 Gemini API 直接调用。3.5 Flash 是 Google 轻量级推理模型，主打低延迟和高吞吐，适用于 Agent 工作流、实时对话、编程辅助等场景。

Google 把 3.5 Flash 铺到 Gemini App 和搜索 AI Mode，开发者还能在 Antigravity 和 AI Studio 里直接调 API。做 AI 编程和 Agent 工作流的可以接 API 测一周，看推理速度和成本控制有没有质变。

03 @GoogleDeepMind Gemini 3 · Introducing Gemini 3 · RT @koraykv: Today at Goo…

Google DeepMind 发布 Gemini 3.5 Flash，性能对标一线模型但价格更低。核心能力：跨大规模代码库的规划与推理、并行部署子 Agent 执行长周期任务，在编程和 Agent 场景上超越前代 3.1 Pro。已开放 API 调用。

Google 把 Gemini 3.5 Flash 的推理和 Agent 能力拉到新高度，价格还比竞品低一截。做 AI 编程和自动化工作流的可以直接接 API 测一周，看长任务并行处理稳不稳。

04 @GoogleDeepMind You can try Gemini Omni Flash …

Google DeepMind 发布 Gemini Omni Flash，为 Omni 系列首款模型，已上线 Gemini App、Flow by Google 及 YouTube Shorts，支持多模态理解与生成。未来数周内将通过 API 开放。

Google 首个 Omni 系列模型上线，多模态理解+生成一步到位，做 AI 短剧和工具链整合的可以蹲 API 开放后实测效果。

05 @GoogleAIStudio it wouldn’t be a Google I/O wi…

Google 在 I/O 大会发布 Gemini 3.5 Flash 模型，定位为 Agent 和编程场景提供前沿性能，擅长处理复杂长周期任务，已通过 Gemini API 在 Google AI Studio 开放调用。

Google I/O 首发 Gemini 3.5 Flash，主打 Agent 和编程场景的长任务推理，做 AI 工作流编排和工具链集成的可以直接接 API 测一周。

工具与能力更新

Tools

06 @PomelliByGoogle Pomelli By Google @PomelliByGo…

Google 旗下 AI 创作工具 Pomelli 发布三项新功能：Pomelli Agent 可帮助用户从零构建核心品牌身份（Logo、配色、字体等）；Websites 功能支持几键生成网站；Brand Books 用于统一品牌视觉规范。面向品牌内容创作和商业增长场景，降低品牌视觉搭建门槛。

Google 的 Pomelli 一口气加了品牌 Agent、一键建站和品牌书三个功能，做 IP 和视觉的可以直接用 Agent 搭品牌基础，省掉前期反复对齐的时间。

07 @comfyui Anthropic Claude is now a part…

ComfyUI 官方宣布 Claude 成为其合作伙伴节点，支持将 Claude 直接拖入任意工作流，实现弱 prompt 改写、图像智能描述与批评、向下游节点输出结构化文本，底层由包括 Opus 4.7 在内的前沿模型驱动。

ComfyUI 官方把 Claude 塞进节点生态，做 AI 视觉和整合工作流的可以直接拖节点用，不用再切窗口写 prompt 了。

08 @LeonardoAi 3D Generation is now live on L…

Leonardo 官方宣布上线 3D 生成功能，基于 Rodin V2 模型，支持从文本或图像直接生成 3D 角色资产，已集成至现有工作流中，用户可在线使用。

Leonardo 正式上线 3D 生成功能，底层用 Rodin V2 模型，做角色 IP 和短剧资产的美术师可以直接上手生成 3D 角色，省掉建模环节。

09 @GoogleDeepMind Google Flow 🤝 Gemini Omni

Google DeepMind 在 Google I/O 上宣布 Flow by Google 接入 Gemini Omni 模型，新增批量编辑（batch editing）和角色一致性（improved character consistency）能力，旨在支持更电影化的叙事创作。具体参数和定价未在推文中公开，需查看官方博客链接。

Google Flow 接入了 Gemini Omni 模型，主打批量剪辑和角色一致性提升，做 AI 短剧和视觉开发的可以直接上手测出片稳定性。

10 @GoogleAI Conversational editing: Gemini…

GoogleAI 宣布 Gemini Omni 支持自然语言视频编辑（Conversational editing），用户通过描述即可更改视频中的角色、场景和风格，类似 Nano Banana 但面向视频场景。该功能已集成至 Gemini Omni 产品中，具体技术细节和可用性需查看链接原文。

Google 把自然语言视频编辑塞进 Gemini Omni，改角色、换场景、调风格一句话搞定，做后期和编导的可以直接上手试，省掉拖轨道的时间。

方法与经验

Methods

11 @HeyGen THIS IS A TUTORIAL ON AVATAR V… · Full Avatar V research re…

HeyGen 官方发布 Avatar V 自定义动作教程，讲解如何通过 prompt 控制虚拟角色的眼神接触、说话节奏、停顿、姿态、手势及能量变化，从而塑造更自然的表演。教程面向创作者工作流，未公开具体参数或模型细节。

HeyGen 官方出的 Avatar 动作控制教程，讲怎么用 prompt 调眼神、节奏、停顿、姿态和手势。做虚拟角色对话和 AI 短剧的可以直接套用这套 prompt 思路来控表演细节。

12 @HeyGen RT @liu8in: @OpenAI Codex pret…

用户 @liu8in 演示了用 OpenAI Codex 一次性生成视频，配合 HeyGen 插件和 HyperFrames 完成从代码到成片的流程，提示词在回复中。该推文为个人实测分享，未公开完整工作流细节或具体参数。

一条实测演示：OpenAI Codex 写代码 + HeyGen 插件 + HyperFrames 一条龙出视频，做 AI 短剧和视觉的可以看看这个工作流能省多少步。

13 @HeyGen Last week we showed educators …

HeyGen 官方发布教程，展示如何将 Avatar Shots 制作的电影感开场，通过 Avatar V 扩展为长视频内容。核心技巧是在 AI Studio 中创建场景间的“自然门户”转场，使多段素材拼接成连续单镜头效果。推文附有完整 prompt 供复现。

HeyGen 官方演示如何用 Avatar V 做长视频场景转场，做 AI 虚拟人内容的可以看看这个“自然门户”拼接思路，跑一遍 prompt 就知道效果稳不稳。

14 @krea_ai Krea 2 deep dive

Krea 官方发布 Krea 2 深度教程，涵盖风格参考（style references）、情绪板（moodboards）以及针对 Krea 2 的提示词编写方法，面向希望系统掌握该工具视觉风格控制能力的创作者。

Krea 官方出的 2.0 深度教程，讲风格参考、情绪板、提示词写法，视觉师和编导可以直接当工作流模板用。

15 @lovart_ai 🎬 Three steps to make product …

Lovart 发布三步产品广告制作流程：上传任意产品照片（手机拍摄即可）→ 用 GPT-Image 2.0 生成 Storyboard → 导入 Seedance 2.0 生成电影级视频。完整 prompt 附在链接中。对做电商广告、短剧物料的美术和制片来说，这套流程降低了产品视频的生成门槛，从单图到成片无需切换工具链。

从手机随手拍到 Seedance 2.0 成片，三步走流程适合做电商广告和短剧物料的美术和制片直接套用，prompt 在链接里。

作品 / 案例

Works

16 B站「AI 短片/短剧/视频」搜索诸葛村夫但是激情迪曲MV【多梦综合征】【B站AI创作大赛-…

B 站 UP 主「多梦综合征」用 AI 工具制作的三国主题迪曲 MV，将诸葛孔明形象融入快节奏电子舞曲，画面风格混搭古风与赛博元素，节奏卡点密集，属于 B 站 AI 创作大赛三国主题赛参赛作品。

AI 生成的迪曲 MV，把诸葛村夫做成蹦迪主角，视觉师和编导可以拉片看风格混搭和节奏卡点怎么玩。

17 @liu8in Bin Liu @liu8in · 1小时 @OpenAI …

Bin Liu 用 OpenAI Codex 配合 HeyGen 插件和 HyperFrames，一句 prompt 直接生成完整视频，展示了 AI 编程工具（vibe-coding）替代传统剪辑软件（CapCut）的潜力。视频成品已发布，prompt 在推文回复中。

用 OpenAI Codex 一句话生成 HeyGen 插件 + HyperFrames 视频，做 AI 短剧和编导的可以点开看 prompt 和成品效果，感受 vibe-coding 对剪辑工作流的冲击。

18 @gizakdag Gizem Akdag @gizakdag · 5小时 Po…

AI 创作者 Gizem Akdag 发布一组名为《Postcards from Italy》的 AI 生成影像作品，内容为意大利主题的视觉风格探索，未公开具体工具链或工作流细节。

AI 视觉师和编导可以点开看看，当风格参考或拉片素材用。

19 @HeyGen Grand Prize ($3000): Pitchfram…

HeyGen 官方大赛 Grand Prize 获奖作品 Pitchframe，基于 HeyGen v3 + HyperFrames 深度集成，构建了从 AI 生成到自动 lint 检查再到修复的完整 agentic 工作流，具备生产级执行能力。该方案展示了 AI 短剧/广告批量制作中自动化质量控制的可行路径。

HeyGen 大赛头奖作品，把生成-检查-修复做成自动化工作流，做 AI 短剧和批量制片的可以直接当模板跑一遍。