← 全部日报AIGC 信息日报Daily Digest
2026-05-21 · 周四
19 条 · 4 板块
Daily Digest

2026-05-21

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

Google 在 Google I/O 发布 Gemini Omni 模型,支持文本、音频、图像混合输入生成和编辑高质量视频,首批能力从视频生成开始。Demis Hassabis 演示了通过对话式交互完成视频创作,具体参数、分辨率、时长限制和开放时间待后续公布。

Google 官宣 Gemini Omni,多模态输入直接生成视频,编导和视觉师可以蹲后续实测看镜头语言和风格一致性表现。

Google 官方宣布推出 Gemini 3.5 Flash 模型,主打 4 倍于其他前沿模型的推理速度,同时保持 frontier 级性能表现。该模型面向高吞吐、低延迟场景,适用于 AI Agent、实时编程助手、批量内容生成等需要快速响应的应用。具体定价和 API 接入细节待官方进一步公布。

Google 官宣 Gemini 3.5 Flash,主打 4 倍速度+前沿性能,做 AI 编程和 Agent 工作流的可以直接接 API 测一周,看推理速度和成本能压到什么程度。

Figma 官方发布设计 Agent,由 @taamannae 和 @rodrigodavies 演示,支持通过自然语言指令直接生成和修改 UI 设计稿,覆盖从零创建到迭代改稿的完整流程。目前处于早期演示阶段,未公开具体可用性、定价或 API 接入方式。

Figma 官方发布设计 Agent,能直接按指令生成和修改 UI 界面。做 AI 短剧 UI/视觉设计的可以蹲一下,看能不能把角色界面、道具面板这类重复设计自动化掉。

Recraft 发布 V4.1 版本,主打时尚杂志级视觉风格,支持高一致性排版、戏剧化构图和高端品牌调性,覆盖从 glossy 封面到极简奢侈 campaign 的多种风格,官方同步放出 prompt 示例供直接使用。

Recraft V4.1 出图质感又升了一档,时尚杂志级构图和光影,做视觉开发和 KV 海报的可以直接拿 prompt 跑一轮看风格一致性。

Google 在 I/O 2026 上宣布了 100 项更新,以 Gemini 模型生态为核心,覆盖 AI 视频生成、多模态理解、实时交互等方向。具体能力点需查看完整发布清单,当前摘要仅含活动预告图,无实质技术细节。

Google I/O 2026 的 100 项发布汇总,Gemini 生态是主线。做 AI 影视和短剧的可以扫一遍,看哪些新能力能直接塞进创作管线。

工具与能力更新

Tools

OpenAI 官方宣布 Codex 已集成至 ChatGPT 移动端 App,用户可在手机上直接调用 Codex 进行编程问答、代码生成与调试,并支持跨设备(手机↔电脑)无缝续接对话上下文。该更新面向所有 ChatGPT 用户,无需额外配置即可使用。

Codex 现在能从 ChatGPT 手机端直接调用了,写脚本、调 prompt、改工作流不用再守着电脑。做 AI 编程和工具链整合的可以装起来用,实测跨设备续接的流畅度。

Midjourney 官方宣布 V8.1 模型上线 --no 反提示(anti-prompting)功能,用户可在生成时用 --no people 等指令排除特定元素,该功能在早期版本中存在但 V8 一度缺失,现应社区要求回归。

Midjourney V8.1 正式上线 --no 反提示功能,做视觉和美术的可以直接拿来排除画面里不想要的人物或元素,省掉后期修图步骤。

HeyGen 开源了 17 款字幕模板集成到 HyperFrames 框架中,通过 `npx hyperframes add captions` 一条命令即可安装,支持完全自定义。同时附带免费本地背景去除功能,达到工作室级效果。面向视频创作者,旨在替代视频应用中昂贵的“智能字幕”付费功能。

HeyGen 开源了 17 款字幕模板,一条命令就能装进 HyperFrames,还带免费本地去背景。做后期和短剧的可以直接装来用,省掉剪映/PR 里调字幕的时间。

HeyGen 推出 Hyperframes 字幕模板目录,支持通过 npx hyperframes add <模板名> 命令一键安装,并可让 AI agent 自动将模板应用到视频中并自定义样式。该功能面向视频后期和自动化工作流场景,降低字幕模板的安装与适配成本。

HeyGen 把字幕模板做成了可一键安装的 CLI 工具,后期和整合师可以直接跑 npx 命令装模板,再让 agent 自动套到视频里。

Google Flow Music 上线 AI 翻唱功能,用户可将已生成的歌曲一键转换为不同风格(如摇滚转爵士)、语言(如 bossa nova 转法语)或添加和声(如福音合唱团),支持自定义与原曲的相似度,同时保留原曲核心旋律与结构。

Google 的 AI 音乐工具上线了翻唱功能,能把一首歌转成不同风格和语言,做 AI 短剧配乐和后期音效的可以直接上手试,省掉重新编曲的功夫。

方法与经验

Methods

PixVerse 官方发布 AI 视频一致性工作流:先在该平台生成干净的角色故事板(storyboard),再以此作为参考生成最终视频,确保同一角色、清晰叙事节拍、镜头方向和运动细节的一致性。附 15 秒烹饪短片案例。

PixVerse 官方分享的 AI 视频一致性工作流:先出角色故事板再当参考生成视频。做 AI 短剧和视觉开发的可以直接套这个流程跑一遍,省掉后期修角色脸的功夫。

开发者 Joruno 分享了一个开源工具 App Store Screenshots Generator,专为 AI 编程助手设计,能自动生成符合苹果 App Store 规范的上架宣传截图,解决手动排版和尺寸适配的痛点。

一个开源工具,专为 AI 编程助手生成符合苹果规范的 App Store 截图。做 AI 应用上架的技术整合者可以装起来用,省掉手动切图排版的功夫。

ComfyUI 官方推文演示 Seedance 2.0 工作流,可将任意场景的简单表演镜头转化为电影级画面,推文附工作流链接。该工作流面向 ComfyUI 用户,适用于 AI 短片、短剧的视觉增强和场景风格化处理。

ComfyUI 官方演示 Seedance 2.0 工作流,把普通表演镜头一键变电影级画面,做视觉和后期可以直接套工作流跑一遍看效果。

@heyglif 分享一条 AI 角色制作工作流:先用 GPT Images 生成角色设定图,再用 Claude 生成 Seedance 提示词,在 RunFieldUI 中找到 Seedance 并粘贴提示词和图片,或直接在 Glif 端到端完成,最后让 Agent 转为 Remotion 视频。该推文仅含工作流概述,未公开具体参数或工具配置细节。

一条从 GPT 角色图到 Seedance 提示词再到 Glif 出片、最后转 Remotion 视频的完整工作流,做角色 IP 和短剧的可以直接套用跑一遍。

赵纯想发推称AI几乎知道世界上所有剧本原文,并用光速默写出来,举例写一个完整的《苔丝》剧本只需2分钟。该推文为个人使用体验感慨,未提及具体模型、工具或工作流细节,无技术参数或可复现的方法论。

个人使用体验分享,AI 2分钟默写出完整《苔丝》剧本,编导路过可看,不用专门点开。

作品 / 案例

Works

B站UP主发布《渣反》番外AI动画《梦沉记》,全长22分钟,采用无配音、仅保留必要音效的极简白描手法,旨在表达梦境安静意向。UP主自述为赶工期提前开工,后续将补做另一投票胜出番外。该片为个人创作者独立完成,未公开具体工具链或工作流细节。

22分钟AI动画番外,全片无配音只靠音效和画面叙事,做AI短剧和动画的可以拉片看白描手法怎么撑起梦境氛围。

创作者 @MayorKingAI 用 Seedance 2.0 制作了一段极道打斗短片,以本人为主角,通过瞬移效果在房间内穿梭击倒敌人,视频经 Magnific 增强处理,并公开了 prompt。展示了 Seedance 2.0 在动作场景中处理角色连续性和空间跳跃的能力。

Seedance 2.0 的瞬移效果实测,做动作短剧和视觉特效的可以拉片看镜头衔接和角色一致性处理。

创作者 @aziz4ai 用 Seedance 2.0 和 Hailuo AI 重制了自己的 AI 短片《Disconnected》,从简单赛博格片段升级为完整电影感短片,并利用 Mirelo AI 重建了全部音效和配乐。

创作者用 Seedance 2.0 和 Hailuo AI 重制了自己的 AI 短片,从赛博格片段升级到完整电影感,做 AI 短片的可以拉片看两版差异和音效重做思路。

B 站 UP 主发布 AI 动画短片《勇者林登万》第一集,基于 2013 年构思的异世界冒险小说改编,使用 updream 平台和 Seedance 2.0 模型制作。作品展示了个人创作者借助单一 AI 视频工具链完成从文字到动画成片的完整流程,题材为异世界冒险,视觉风格偏日式动画。

个人创作者用 Seedance 2.0 圆了十年小说梦,做 AI 短剧的可以拉片看单工具链下的叙事和角色一致性处理。