← 全部日报AIGC 信息日报Daily Digest
2026-06-06 · 周六
30 条 · 4 板块
Daily Digest

2026-06-06

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

PixVerse 宣布 PixVerse Originals 计划正式上线,首批扶持 10 位来自印尼、加拿大、美国、中国和乌克兰的 AI 电影人,提供积分、资金和全球发行支持。该计划旨在推动 AI 原生长叙事作品产出,是视频生成平台从工具向制片生态延伸的典型案例。

PixVerse 正式启动创作者扶持计划,10 位全球导演获资金和发行支持。做 AI 短剧和独立项目的可以关注后续成片质量,看平台级资源能跑出什么水准的长叙事。

Riverflow 2.5 图像模型在 OpenRouter 上线,核心卖点是用户可自定义评分标准来引导模型思维和编辑方向,同时支持可控推理努力(速度/质量权衡)。免费至6月9日。

首个能让你自定义评分标准来引导图像生成的模型,做视觉和美术的可以上手调一调,看能不能控住风格和编辑方向。

Viggle AI 推出 PINOC 免费动捕测试,用户只需用手机拍摄自己动作视频,即可转换为动作捕捉数据,无需专业动捕套装或工作室。目前处于测试阶段,完全免费开放。

Viggle 把动捕门槛拉到手机自拍级别,还免费。做 AI 短剧和动画的可以直接拍一段自己动作,看骨骼映射和角色驱动效果稳不稳。

Kimi 发布 Kimi Work,整合 Kimi Code 核心能力与 Kimi Agent 的建站、PPT 等专业 Skills,打通金融、科研、法律等专业数据库,支持最多 300 个 Agent 并行调度完成任务。用户通过文字描述需求即可让 AI 在电脑上拆解任务、调用工具、使用浏览器、交付文档表格 PPT,无需终端或命令行。

Kimi 把 Coding 和 Agent 能力打包成办公套件,最多 300 个 Agent 并行干活。做 AI 短剧的制片和整合者可以看看这套多 Agent 调度逻辑能不能套进批量制作流程里。

X 用户 Ce Sun 基于社区反馈总结 Codex 封号原因:低价/共享/批量注册账号最易触发,OpenAI 已加强审核,免费号额度从周限改为月限并强制手机验证;网络环境(频繁切换 VPN、共享 IP)和异常使用行为(高频调用、多设备登录)也是高发因素。

社区经验总结,不是官方公告。用 Codex 做自动化工作流的可以扫一眼避坑,但别当权威指南。

工具与能力更新

Tools

DomoAI 官方宣布正式集成 Seedance 2.0,主打电影级运镜、角色一致性、叙事增强、快速生成和高画质。该模型此前已在即梦平台上线,此次接入 DomoAI 意味着短剧和视觉创作者多了一个可直接使用的工具入口。

Seedance 2.0 正式接入 DomoAI,做 AI 短剧和视觉叙事的可以直接上手测角色一致性和电影级运镜,看废片率降了多少。

Google 官方展示 Gemini Omni 新增文字同步生成能力:支持选择字体类型、位置、动画、曝光等参数,文字可与画面逐帧同步出现。示例 prompt 实现逐词逐帧显示效果,适用于 AI 短片字幕、MV 歌词、动态标题等场景。

Google 给 Gemini Omni 加了文字同步生成能力,做 AI 短片和 MV 的可以试试文字逐帧卡画面节奏,省掉后期手动对位。

ComfyUI 宣布集成 DeemosTech 的 Rodin Gen-2.5 3D 生成模型。支持从文本提示或参考图生成 3D 资产,提供不同生成档位(快速草稿到高细节纹理),用户可在 ComfyUI 工作流内直接调用,适用于 3D 资产批量生产、视觉开发、概念设计等场景。

ComfyUI 集成 Rodin Gen-2.5,做 3D 资产和视觉开发的可以直接在 ComfyUI 里跑,从文字或参考图生成 3D 模型,支持不同质量档位,省掉切工具的麻烦。

Glif 更新音乐视频工作流,上传音频即可自动生成完整 MV,官方称速度提升 2 倍。具体生成效果和画质需查看链接中的演示视频。

上传一首歌直接出 MV,后期和导演团队可以实测看生成质量和速度提升幅度。

阿里 Wan2.7 视频生成模型已集成至 Venice 平台,用户可直接在 Venice 上调用该模型生成视频内容。具体能力参数和生成效果需查看平台实际体验。

阿里 Wan2.7 模型上线 Venice 平台,做 AI 视频的可以直接去测出片效果和风格一致性。

Move AI 宣布其 GENESIS 实时动作捕捉方案即将量产,该方案基于 ZCams 实现同一系统上实时输出与高质量解算,实时输出延迟为 100-150 毫秒,并强调高保真度与时间同步。

Move AI 的实时动作捕捉方案快量产了,延迟压到 100-150 毫秒,后期和虚拟制片团队可以蹲一下正式上线后的集成方案。

Google 在 Gemini Live 对话模式中新增实时图像创建与编辑能力,用户可通过共享摄像头画面或语音指令,在对话中直接生成或修改图像,支持房间装饰测试、数学题可视化、梗图制作等场景,所有操作实时完成。

Gemini Live 现在能边聊边改图,视觉师做概念参考或快速出梗图可以省一步,不用切工具了。

Krea AI 的 Krea 2 Turbo 模型已集成至 Runware 平台,可通过 API 调用。该模型主打快速生成,具体参数和定价需查看 Runware 文档。

Krea 2 Turbo 模型上线 Runware 平台,做 AI 视觉的可以接 API 跑一遍出图速度和风格表现。

Glif 推出新功能:用 SAM 代理一键移除 AI 视频中的多余音乐,无需手动分离或重写 prompt,几秒内完成。解决视频模型常生成无用配乐的问题,降低后期清理成本。

后期和短剧团队可以装起来用,AI 视频自带废配乐一键清掉,省去手动分离的麻烦。

Google Cloud 宣布 Gemini Enterprise 应用新增 Agent 构建功能,无需编码即可创建能自动调研最新趋势并生成符合品牌调性的营销文案的智能体。该功能面向企业营销场景,降低 Agent 搭建门槛。

Google Cloud 给 Gemini Enterprise 加了个零代码 Agent 功能,能自动调研趋势并生成品牌调性一致的营销文案。做 AI 工具链整合的可以点开看看怎么搭,编导和制片人暂时用不上。

方法与经验

Methods

ComfyUI 发布 Draw-to-Direct 方法:在图像上画草图即可指定运动方向、镜头移动和场景动作,替代纯文本提示的模糊描述。本质是把分镜草图变成 AI 视频的视觉指令,降低镜头控制门槛。

画草图就能指挥镜头运动,比纯文字提示直观太多。编导和视觉师可以直接装起来用,省掉来回写 prompt 调镜头的功夫。

NVIDIA Research 的 PixelDiT(像素扩散变换器)入选 CVPR2026 最佳论文决赛。该模型去掉了传统图像生成模型中的预训练自编码器压缩步骤,直接在像素空间端到端学习扩散过程,避免质量损失在流程中累积。这是一个单阶段模型架构创新。

NVIDIA 的像素级扩散模型入选 CVPR2026 最佳论文决赛,去掉自编码器压缩步骤,直接端到端学像素空间。做 AI 视觉和模型整合的可以看看这个方向对图像质量的影响。

Adobe Research 在 CVPR 2026 展示 75+ 篇论文,核心方向是提升 AI 图像编辑的精确控制能力,解决「想要的效果很难一次到位」的痛点。

Adobe 在 CVPR 2026 发了 75+ 篇论文,核心方向是给创作者更多控制力。做视觉和后期的最该关注,看看哪些控制能力能落地到工作流里。

VC Tomer Tunguz 分享技能蒸馏实践:将 78% 的 AI 工作交由 Mac 本地模型处理,仅复杂任务发往云端。智能体自动分类任务,双车道设计使吞吐量提升约 25%,平均任务时长从 47 秒降至 19 秒,队列等待时间从 73 秒降至 4 秒(降幅 94%)。该模式类比 Nucor 小钢厂,每台能运行蒸馏模型的边缘设备都成为小型 AI 工厂,仅对那 1/5 困难任务支付云费用。

做 AI 短剧批量生产的可以看看这个本地+云端分流思路,省云成本、提吞吐量,直接套用工作流设计。

创作者 @madpencil_ 分享 Seedance 2 Omni 与 Runway 参考功能配合的工作流技巧:先用文本或参考图生成第一段视频,然后将该视频作为参考,配合提示词“从输入视频的最后一帧继续,保持角色和环境一致”来续写故事。该方法旨在解决 AI 视频生成中角色和环境一致性的核心痛点,适用于短剧、系列短片等需要多镜头连贯叙事的场景。

一个很实用的 Seedance 2.0 工作流技巧:用 Runway 的参考图功能做角色和环境一致性续写。做短剧和长叙事的可以直接套用这个 prompt 模板跑一轮试试。

HeyGen 官方展示了一个 AI 数字人 Twitch 直播案例:数字人 24/7 在线,观众发 GitHub 仓库链接后,它能自动打开、审查代码、吐槽糟糕设计,并实时操控浏览器导航。本质是 AI 数字人 + 浏览器 Agent 的集成演示,展示了实时互动和自主操作能力。

HeyGen 把 AI 数字人扔上 Twitch 24 小时直播,能读代码、吐槽设计、自己操作浏览器。做 AI 短剧和虚拟主播的可以看看实时互动和浏览器控制怎么落地。

Suno 官方发布 Voices 功能录音指南,面向 Web 付费用户开放。6 个实操技巧:安静环境降噪、先练词再录、保留真实情感不追求完美、录音时长超 1 分钟、人声匹配音乐流派(民谣/流行/死亡金属/波萨诺瓦等)、大胆尝试不同风格。

Suno 官方出的录音指南,做 AI 音乐和短剧配音的可以直接当操作手册用,6 个技巧都是实操经验,省自己试错。

个人创作者 VictorInFocus 分享工作流:从 Krea 2 生成单帧,用 GPT Image 2 创建 3x3 联系表保持美学风格,再导入 Seedance 2 生成动态片段。最终片段有瑕疵,但原始图像到生成画面的美学一致性保持较好。

个人创作者分享从 Krea 2 单帧到 GPT Image 2 联系表再到 Seedance 2 的完整工作流,视觉师和做风格一致性的可以直接套用这个三件套流程跑一遍。

作品 / 案例

Works

AI 团队受浦东美术馆邀请,为莫兰迪上海个展制作官方宣传片,工具链公开:Nanobanana pro + GPT Image 2 + Seedance 2.0。宣传片风格需与莫兰迪画作的低饱和度、静物凝视感对齐,是 AI 视觉风格与美术馆调性匹配的实战案例。

AI 团队为浦东美术馆做的官方宣传片,工具链公开(Nanobanana pro + GPT Image 2 + Seedance 2.0),做 AI 短剧和视觉的可以拉片看风格一致性怎么跟美术馆调性对齐。

PixVerse 发布 Originals S1 系列首部短片《Neon Salvage Gothic》,由 PixVerse 首批合作创作者 @michaelheina 使用 PixVerse V6 制作。短片设定为太空 urbex 题材,五名 Gen-Z 拾荒者+一台苏醒 AI 的群像叙事,主打匹配剪辑动作和跨镜头角色一致性锁定。PixVerse V6 的多人角色一致性能力在短片中首次得到系列级验证。

PixVerse V6 首部官方系列短片,五人角色一致性+匹配剪辑,做 AI 短剧和视觉开发的直接拉片看角色锁定和镜头衔接怎么处理。

Runway 官方发布 AI 生成游戏过场短片《50 Crowns》,讲述两名赏金猎人的公路故事。单人制作,耗时不到一周,全片使用 Runway 工具链完成。

Runway 官方放出的单人一周出片案例,做 AI 短剧和视觉的可以拉片看镜头调度和角色一致性处理。

导演 PJaccetturo 宣布 AI 长片《Nexus》预告成片,3 人团队 2 周内用 Dreamina(Octo + Seedance 2.0)完成,工作流后续公开。

AI 长片《Nexus》预告,3 人 2 周用 Dreamina 完成,做 AI 短剧和长片的可以拉片看小团队出片效率和质量。

B站UP主制作的《逆转裁判》AI同人二创短剧第一案大结局纯享版,融合90年代港剧/日剧风格,两周内完成。画面和声音均由AI辅助生成,非官方作品。

粉丝两周爆肝的AI同人短剧纯享版。做AI短剧的可以拉片看角色一致性和复古风格化处理,尤其是真人化游戏IP的叙事节奏怎么拿捏。

B站作者「六舅动漫」的AI动漫系列《鬼眼林宇》第62集,使用小云雀Seedance生成,属于长连载AI动漫作品,题材为玄幻/都市异能类。

62集AI动漫长系列,用Seedance生成,做AI短剧的可以拉片看长叙事下的角色一致性和镜头稳定性处理。