Google 核心产品负责人 Logan Kilpatrick 宣布 Gemini Omni Flash 在图像到视频、文本到视频和视频编辑三项任务上达到 SOTA,并预告即将通过 API 向开发者开放。这意味着 Google 的多模态视频生成能力即将进入可调用阶段,覆盖从静态图/文字生成视频到已有视频编辑的全链路。
Gemini Omni Flash 视频能力达到 SOTA,图像/文本转视频和视频编辑都覆盖了。做 AI 短剧和视觉的可以蹲 API 上线实测出片质感。
为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达
Google 核心产品负责人 Logan Kilpatrick 宣布 Gemini Omni Flash 在图像到视频、文本到视频和视频编辑三项任务上达到 SOTA,并预告即将通过 API 向开发者开放。这意味着 Google 的多模态视频生成能力即将进入可调用阶段,覆盖从静态图/文字生成视频到已有视频编辑的全链路。
Gemini Omni Flash 视频能力达到 SOTA,图像/文本转视频和视频编辑都覆盖了。做 AI 短剧和视觉的可以蹲 API 上线实测出片质感。
Runway 宣布与狮门影业深化合作,新增联合开发原创 IP 项目,双方将共同孵化原创内容。此前狮门已接入 Runway 模型用于内部制作,此次合作从工具授权升级为内容共创,是主流制片厂与 AI 视频公司深度绑定的新案例。
Runway 和狮门影业从工具合作升级到联合开发原创 IP,做 AI 短剧和长片的制片人可以关注这个合作样本——大制片厂怎么用 AI 公司做原创内容,后续出片节奏和成本结构值得跟踪。
Runway与Lionsgate扩大战略合作:Lionsgate取得Runway股权,双方启动联合开发项目,首推一部基于Lionsgate现有IP和Runway生成模型的短剧系列。Lionsgate还将作为主持伙伴参与6月Runway AI电影节。这是2024年9月首次合作后的深化,Lionsgate此前已在预可视化、故事板及最终帧制作中应用Runway工具。
好莱坞制片厂真金白银入股Runway,还签了联合开发新IP和短剧系列。做AI短剧和制片的可以关注这个合作样本——大厂怎么用AI工具走通从预可视化到成片的链路。
PixVerse 宣布与 Fastlane 合作推出 V6 视频模型,Fastlane 用户可在未来 2 周内享受专属福利(具体福利内容未公开)。PixVerse V6 是继 V5 后的新一代视频生成模型。
PixVerse V6 新模型发布,合作方 Fastlane 有 2 周限时福利。做 AI 短剧和视觉的可以蹲一波实测,看 V6 在角色一致性和镜头语言上有没有升级。
ComfyUI 官方发布统一桌面 App,支持本地、远程、便携、云四种运行模式,无需手动配置环境即可在不同设备间切换使用。该 App 旨在解决 ComfyUI 用户长期面临的环境配置痛点,降低使用门槛。
ComfyUI 官方出了个跨平台桌面 App,本地、远程、便携、云四种模式一键切,不用再折腾环境配置。做 AI 视觉和短剧批量出图的可以直接装起来用,省掉配环境的时间。
Pixelcut 的视频背景去除工具正式上线 fal 平台,主打超清晰抠像和高速处理,支持商用。fal 是 AI 模型推理 API 平台,该工具可直接通过 API 集成到后期工作流中,适合批量视频背景处理场景。
视频背景去除工具上线 fal,后期和剪辑团队可以直接接 API 跑一遍,看速度和精度能不能替代现有方案。
Runway 官方宣布 2026 Runway AI Festival 纽约首映场次已售罄,今晚在影院举行。该活动为 AI 影视作品展映,具体片单和展映内容未在推文中公开。
Runway AI Festival 纽约首映今晚开场,做 AI 短剧和长片的可以蹲后续展映片单,看看今年行业水准线在哪。
Midjourney 官方宣布将 V8.1 设为所有用户的默认模型,V8 将在两周后废弃下线,同时 V8.2 即将开始测试。这是 Midjourney 在 V8 系列上的快速迭代,视觉风格和生成质量预计有持续优化。
Midjourney 默认模型从 V8 跳到 V8.1,两周后 V8 下线,V8.2 马上开测。做视觉和美术的这周直接切 V8.1 跑一轮,看看出图风格和一致性有没有变化。
Ideogram 4.0 新增 JSON bounding box 提示功能,用户可为画面中每个元素单独指定位置坐标和文字描述,模型按指定位置渲染,提升定制化与准确性。该功能已在 r/StableDiffusion 社区有用户实测案例。
Ideogram 4.0 的 JSON bounding box 提示,每个元素单独定位置和描述,做分镜和视觉设计的可以直接套用这个工作流,精准控制画面布局。
Krea 2 上线 Generative Sliders 功能,新增三个滑块分别控制生成图像的强度(intensity)、复杂度(complexity)和动态(movement),用户可在生成后实时微调画面风格和细节密度,无需重新输入 prompt。
Krea 2 新加三个滑块控制生成图的强度、复杂度和动态,视觉师和美术总设可以直接上手调风格,不用反复改 prompt 了。
ElevenLabs 为 ElevenCreative 平台新增 Avatar 节点,支持在单一工作流中批量生成内容:固定同一个数字人形象,可批量替换脚本、语音、语言和钩子(hook),实现一条管线产出多个投放版本。面向短剧、广告、多语言内容等批量生产场景。
做短剧和批量内容生产的可以直接套用,一个数字人形象换脚本、换语言、换钩子,省掉反复拍摄和后期重剪的人力。
Replit Agent 新增自定义指令与技能功能,允许用户设定项目组织方式、品牌指南等偏好,Agent 会在后续每个项目中自动应用这些惯例,无需重复输入。
Replit Agent 终于能记住你的项目惯例了,不用每次重复写品牌指南和项目结构。做 AI 短剧或工具链整合的,可以省下大量重复配置时间。@HeyGen
Perplexity 将 Deep Research 作为原生技能集成到 Computer Agent 中,可调用搜索、代码生成、长期沙箱、连接器、工具和授权数据。已对 Pro 和 Max 订阅用户开放。
Perplexity 把 Deep Research 塞进 Computer Agent 里,做 AI 编程和自动化工作流的可以接上试试,搜索+代码生成+沙箱跑一条线。
mlx-vlm v0.6.3 上线,Day-0 支持 Google DeepMind DiffusionGemma 和 Cohere North Mini Code 1.0。DiffusionGemma 采用 256 token 块并行生成、双向注意力、迭代自纠错架构,26B MoE 仅激活 3.8B,量化后 18GB 可运行。North Mini Code 1.0 为 30B MoE 激活 3B,BF16 下约 66 tok/s。两款模型均可在 Mac 本地通过 `uv pip install -U mlx-vlm` 安装运行。
Mac 本地跑 VLM 的可以装起来用,DiffusionGemma 的并行生成架构值得关注,搞本地推理和模型集成的直接 `pip install` 测一周。
fal 平台更新:Minecraft 风格 3D 生成速度提升至 10 秒内,工作流为文本→FLUX.2 Klein 生成 2D 图像→TripoSpl 转为 3D Gaussian splat 模型。面向游戏资产和虚拟场景快速生成场景。
Minecraft 3D 生成进到 10 秒内,做游戏资产或虚拟场景的可以接 API 试一下出图到 3D 的链路稳不稳。
Thariq 展示了一种全代码驱动的视频制作工作流:用 Claude Code 配合 Fable 5,将剪辑流程抽象为软件工程项目,通过自动编写代码和调用命令行工具完成视频剪辑,完全跳过 Premiere 或 Final Cut 等传统非编软件。
后期和整合岗直接看:Claude Code + Fable 5 把剪辑变成写代码,全自动命令行出片,省掉 Premiere 手动流程。
ComfyUI 官方发布一套工作流,用 LLM 将一句话创意自动扩展为完整故事板分镜,再结合 Seedance 2.0 和参考图直接生成动画。从概念到成片无需切换工具,适合短剧、视觉开发、概念验证等场景的快速迭代。
ComfyUI 官方出的 Seedance 2.0 工作流,从一句话创意到分镜再到成片一条线走通,做短剧和视觉开发的可以直接套用跑一遍。
个人开发者用 Fable 5 零代码在 2 天内完成了一款 iOS 游戏的完整开发,最后 10 次构建均一次通过。Fable 5 是一款 AI 驱动的无代码游戏开发工具,支持自然语言描述生成游戏逻辑、UI 和交互。该案例展示了 AI 编程工具在非编程人员手中从想法到上线的完整闭环能力。
Fable 5 零代码 2 天搓出一个 iOS 游戏,做 AI 短剧工具链整合的可以看看这个工作流能怎么套到视频生成上。
Fable 创始人 Thariq 发布视频,演示如何用 Fable 自身 AI 能力自动剪辑其发布视频:通过代码和工具调用,串联转录服务、ffmpeg、调色、Figma MCP、Remotion UI 渲染等环节,全程未手动操作视频编辑器。
Fable 自己用 AI 工具链(转录+ffmpeg+调色+Figma MCP+Remotion)全自动剪完发布视频,后期和整合者可以直接扒工作流跑一遍。
ElevenLabs 官宣 Dubbing v2 配音功能,以马修·麦康纳的语音为案例展示:可将演员原声翻译成多国语言并保留其标志性嗓音特征,适用于影视配音、海外发行、多语言内容本地化等场景。
ElevenLabs Dubbing v2 保真度又升了一档,做 AI 配音和海外发行后期的可以直接接 API 试一轮,看看马修·麦康纳这种标志性嗓音的还原度。
宝玉在X分享使用Claude Design的5点经验:1. 加入Adobe Spectrum 2等设计系统设为默认以减少AI味;2. 先搭建少量功能再通过左侧聊天逐步调整;3. 用Markup框选局部评论并手动Edit元素树;4. 新任务创建新会话管理上下文;5. 通过Tweaks面板调整主题、布局、加载状态及添加导航。
Claude Design 用户可直接抄这5条:引入设计系统去AI味、先搭少量功能再迭代、Markup局部编辑、开新会话控上下文、Tweaks面板调主题布局。
OpenAI Devs 官方账号分享音乐家 @sound4movement 使用 Codex 的案例:通过自然语言指令生成一段 3/4 拍钢琴曲,包括设定节奏、和声以及描述表演如何逐步展开。展示了 Codex 在音乐创作场景下的交互方式,属于官方用例展示,非新功能发布。
OpenAI 官方展示 Codex 在音乐创作上的一个具体用例:作曲家通过自然语言描述节奏、和声和表演展开,Codex 直接生成钢琴曲。做 AI 配乐和后期声音的可以看看这个交互方式,当个 prompt 模板参考。
开发者 @anshuc 用 Claude Fable 一个提示生成了一款卡路里追踪 iOS 应用,声称效果“极其令人愉悦”。推文附有应用截图。
一个提示生成完整 iOS 应用,做 AI 编程和工具链整合的可以点开看 Fable 的实际输出质量。
HeyGen 发布客户案例:比利时一人公司 Happy Cats 创始人 Anneleen Bru 用 HeyGen 将 7 本书快速转化为视频,产出效率超过十倍规模的公司。案例展示了单人团队借助 AI 视频工具实现内容批量生产的可能性,适用于短剧、IP 化内容等场景。
HeyGen 的客户故事,讲一个人公司用 AI 视频工具把 7 本书快速转成视频,产出效率超过大公司。做短剧和 IP 运营的可以看看单人工作流能卷到什么程度。
用户分享一条提示词技巧:在 Morphic 图像生成提示中加入“使用 65mm IMAX 拍摄,浅景深,自然窗光”,可提升画面电影质感。
一条提示词小技巧,做 AI 视觉的可以顺手存一下,给画面加电影感。
Wonder Studios 发布《Beyond the Loop》第二季首部作品《THE TRIALS》,由 BAFTA 获奖导演 Hal Watmough 执导。短片以外星力量挑战地球物种的宇宙奥运会为题材,延续系列科幻竞技风格,是 AI 长片系列第二季的开篇之作。
BAFTA 获奖导演新作上线,做 AI 短剧和长片的可以拉片看叙事节奏和视觉风格怎么撑起系列第二季的开篇。
B站作者「油菜Fafa丶」的AI短剧《妖孽小村医》,已完结,题材为乡村+擦边爽文风格,属于AI短剧在特定垂类题材上的尝试。
B站AI短剧,题材偏擦边爽文,播放量不错,做AI短剧的可以拉片看这类题材的叙事节奏和观众接受度。
小红书作者「ZERO ColorLab」的 AI 短片,个人创作者首次用 AI 完成导演作品,题材和视觉风格偏剧情向,角色一致性和镜头语言是看点。
个人创作者用 AI 圆导演梦的短片,做 AI 短剧和编导的可以拉片看叙事和视觉风格,当个参考案例。
小红书作者 nuk201 发布的 AI 短片《白星撤离》,个人创作者作品。
小红书作者 nuk201 的 AI 短片,点赞量不高,可当个人创作者作品参考,不赶时间可略过。
B站AI漫剧《室友竟是大魔头》,双男主仙侠题材,持续更新中。个人创作者作品,主打AI漫剧风格下的角色互动与叙事节奏。
B站AI漫剧,双男主仙侠题材,做AI短剧和漫剧的可以拉片看叙事节奏和角色一致性处理。