2026-06-12 · 周五

30 条 · 4 板块

Daily Digest

2026-06-12

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

01 @OfficialLoganK Gemini Omni Flash 视频任务达 SOTA

Google 核心产品负责人 Logan Kilpatrick 宣布 Gemini Omni Flash 在图像到视频、文本到视频和视频编辑三项任务上达到 SOTA，并预告即将通过 API 向开发者开放。这意味着 Google 的多模态视频生成能力即将进入可调用阶段，覆盖从静态图/文字生成视频到已有视频编辑的全链路。

Gemini Omni Flash 视频能力达到 SOTA，图像/文本转视频和视频编辑都覆盖了。做 AI 短剧和视觉的可以蹲 API 上线实测出片质感。

02 @runwayml Today, we’re deepening our par…

Runway 宣布与狮门影业深化合作，新增联合开发原创 IP 项目，双方将共同孵化原创内容。此前狮门已接入 Runway 模型用于内部制作，此次合作从工具授权升级为内容共创，是主流制片厂与 AI 视频公司深度绑定的新案例。

Runway 和狮门影业从工具合作升级到联合开发原创 IP，做 AI 短剧和长片的制片人可以关注这个合作样本——大制片厂怎么用 AI 公司做原创内容，后续出片节奏和成本结构值得跟踪。

03 Runway Runway与Lionsgate扩大战略合作

Runway与Lionsgate扩大战略合作：Lionsgate取得Runway股权，双方启动联合开发项目，首推一部基于Lionsgate现有IP和Runway生成模型的短剧系列。Lionsgate还将作为主持伙伴参与6月Runway AI电影节。这是2024年9月首次合作后的深化，Lionsgate此前已在预可视化、故事板及最终帧制作中应用Runway工具。

好莱坞制片厂真金白银入股Runway，还签了联合开发新IP和短剧系列。做AI短剧和制片的可以关注这个合作样本——大厂怎么用AI工具走通从预可视化到成片的链路。

04 @PixVerse_ RT @UseFastlane: BREAKING: We’…

PixVerse 宣布与 Fastlane 合作推出 V6 视频模型，Fastlane 用户可在未来 2 周内享受专属福利（具体福利内容未公开）。PixVerse V6 是继 V5 后的新一代视频生成模型。

PixVerse V6 新模型发布，合作方 Fastlane 有 2 周限时福利。做 AI 短剧和视觉的可以蹲一波实测，看 V6 在角色一致性和镜头语言上有没有升级。

05 @comfyui One app to run ComfyUI anywher…

ComfyUI 官方发布统一桌面 App，支持本地、远程、便携、云四种运行模式，无需手动配置环境即可在不同设备间切换使用。该 App 旨在解决 ComfyUI 用户长期面临的环境配置痛点，降低使用门槛。

ComfyUI 官方出了个跨平台桌面 App，本地、远程、便携、云四种模式一键切，不用再折腾环境配置。做 AI 视觉和短剧批量出图的可以直接装起来用，省掉配环境的时间。

06 @fal Pixelcut Video Background Remo…

Pixelcut 的视频背景去除工具正式上线 fal 平台，主打超清晰抠像和高速处理，支持商用。fal 是 AI 模型推理 API 平台，该工具可直接通过 API 集成到后期工作流中，适合批量视频背景处理场景。

视频背景去除工具上线 fal，后期和剪辑团队可以直接接 API 跑一遍，看速度和精度能不能替代现有方案。

07 @runwayml The sold out New York premiere…

Runway 官方宣布 2026 Runway AI Festival 纽约首映场次已售罄，今晚在影院举行。该活动为 AI 影视作品展映，具体片单和展映内容未在推文中公开。

Runway AI Festival 纽约首映今晚开场，做 AI 短剧和长片的可以蹲后续展映片单，看看今年行业水准线在哪。

工具与能力更新

Tools

08 @midjourney We've made V8 · Midjourney V8.1 已成为默认模型

Midjourney 官方宣布将 V8.1 设为所有用户的默认模型，V8 将在两周后废弃下线，同时 V8.2 即将开始测试。这是 Midjourney 在 V8 系列上的快速迭代，视觉风格和生成质量预计有持续优化。

Midjourney 默认模型从 V8 跳到 V8.1，两周后 V8 下线，V8.2 马上开测。做视觉和美术的这周直接切 V8.1 跑一轮，看看出图风格和一致性有没有变化。

09 @ideogram_ai Ideogram 4.0 新增 JSON bounding … · 相关推文 · 相关推文 · 相关推文 · 相关推文 · Within a week, the commun… · One week ago, we released…

Ideogram 4.0 新增 JSON bounding box 提示功能，用户可为画面中每个元素单独指定位置坐标和文字描述，模型按指定位置渲染，提升定制化与准确性。该功能已在 r/StableDiffusion 社区有用户实测案例。

Ideogram 4.0 的 JSON bounding box 提示，每个元素单独定位置和描述，做分镜和视觉设计的可以直接套用这个工作流，精准控制画面布局。

10 @krea_ai introducing Generative Sliders

Krea 2 上线 Generative Sliders 功能，新增三个滑块分别控制生成图像的强度（intensity）、复杂度（complexity）和动态（movement），用户可在生成后实时微调画面风格和细节密度，无需重新输入 prompt。

Krea 2 新加三个滑块控制生成图的强度、复杂度和动态，视觉师和美术总设可以直接上手调风格，不用反复改 prompt 了。

11 @elevenlabs @ElevenCreative Scale with Flo… · Introducing Avatars in @E… · @ElevenCreative Select yo… · @ElevenCreative The avata… · @ElevenCreative Browse th… · @ElevenCreative For cours…

ElevenLabs 为 ElevenCreative 平台新增 Avatar 节点，支持在单一工作流中批量生成内容：固定同一个数字人形象，可批量替换脚本、语音、语言和钩子（hook），实现一条管线产出多个投放版本。面向短剧、广告、多语言内容等批量生产场景。

做短剧和批量内容生产的可以直接套用，一个数字人形象换脚本、换语言、换钩子，省掉反复拍摄和后期重剪的人力。

12 @Replit Replit Agent 新增自定义指令与技能功能

Replit Agent 新增自定义指令与技能功能，允许用户设定项目组织方式、品牌指南等偏好，Agent 会在后续每个项目中自动应用这些惯例，无需重复输入。

Replit Agent 终于能记住你的项目惯例了，不用每次重复写品牌指南和项目结构。做 AI 短剧或工具链整合的，可以省下大量重复配置时间。@HeyGen

13 @perplexity_ai We're integrating Deep Researc…

Perplexity 将 Deep Research 作为原生技能集成到 Computer Agent 中，可调用搜索、代码生成、长期沙箱、连接器、工具和授权数据。已对 Pro 和 Max 订阅用户开放。

Perplexity 把 Deep Research 塞进 Computer Agent 里，做 AI 编程和自动化工作流的可以接上试试，搜索+代码生成+沙箱跑一条线。

14 @berryxia mlx-vlm v0.6.3 发布，Day-0 支持 Goo…

mlx-vlm v0.6.3 上线，Day-0 支持 Google DeepMind DiffusionGemma 和 Cohere North Mini Code 1.0。DiffusionGemma 采用 256 token 块并行生成、双向注意力、迭代自纠错架构，26B MoE 仅激活 3.8B，量化后 18GB 可运行。North Mini Code 1.0 为 30B MoE 激活 3B，BF16 下约 66 tok/s。两款模型均可在 Mac 本地通过 `uv pip install -U mlx-vlm` 安装运行。

Mac 本地跑 VLM 的可以装起来用，DiffusionGemma 的并行生成架构值得关注，搞本地推理和模型集成的直接 `pip install` 测一周。

15 @fal RT @BlendiByl: New Update: Min…

fal 平台更新：Minecraft 风格 3D 生成速度提升至 10 秒内，工作流为文本→FLUX.2 Klein 生成 2D 图像→TripoSpl 转为 3D Gaussian splat 模型。面向游戏资产和虚拟场景快速生成场景。

Minecraft 3D 生成进到 10 秒内，做游戏资产或虚拟场景的可以接 API 试一下出图到 3D 的链路稳不稳。

方法与经验

Methods

16 @dotey 这段视频展示了一个极其前沿且硬核的视频制作方式：视频完全没有…

Thariq 展示了一种全代码驱动的视频制作工作流：用 Claude Code 配合 Fable 5，将剪辑流程抽象为软件工程项目，通过自动编写代码和调用命令行工具完成视频剪辑，完全跳过 Premiere 或 Final Cut 等传统非编软件。

后期和整合岗直接看：Claude Code + Fable 5 把剪辑变成写代码，全自动命令行出片，省掉 Premiere 手动流程。

17 @comfyui Turn one idea into a complete …

ComfyUI 官方发布一套工作流，用 LLM 将一句话创意自动扩展为完整故事板分镜，再结合 Seedance 2.0 和参考图直接生成动画。从概念到成片无需切换工具，适合短剧、视觉开发、概念验证等场景的快速迭代。

ComfyUI 官方出的 Seedance 2.0 工作流，从一句话创意到分镜再到成片一条线走通，做短剧和视觉开发的可以直接套用跑一遍。

18 @maxescu Fable 5 just turned me into an…

个人开发者用 Fable 5 零代码在 2 天内完成了一款 iOS 游戏的完整开发，最后 10 次构建均一次通过。Fable 5 是一款 AI 驱动的无代码游戏开发工具，支持自然语言描述生成游戏逻辑、UI 和交互。该案例展示了 AI 编程工具在非编程人员手中从想法到上线的完整闭环能力。

Fable 5 零代码 2 天搓出一个 iOS 游戏，做 AI 短剧工具链整合的可以看看这个工作流能怎么套到视频生成上。

19 @trq212 很多人问我如何用 Fable 编辑它自己的发布视频，所以我做…

Fable 创始人 Thariq 发布视频，演示如何用 Fable 自身 AI 能力自动剪辑其发布视频：通过代码和工具调用，串联转录服务、ffmpeg、调色、Figma MCP、Remotion UI 渲染等环节，全程未手动操作视频编辑器。

Fable 自己用 AI 工具链（转录+ffmpeg+调色+Figma MCP+Remotion）全自动剪完发布视频，后期和整合者可以直接扒工作流跑一遍。

20 @elevenlabs Matthew @McConaughey is celebr…

ElevenLabs 官宣 Dubbing v2 配音功能，以马修·麦康纳的语音为案例展示：可将演员原声翻译成多国语言并保留其标志性嗓音特征，适用于影视配音、海外发行、多语言内容本地化等场景。

ElevenLabs Dubbing v2 保真度又升了一档，做 AI 配音和海外发行后期的可以直接接 API 试一轮，看看马修·麦康纳这种标志性嗓音的还原度。

21 @dotey 用好 Claude Design 的一些经验

宝玉在X分享使用Claude Design的5点经验：1. 加入Adobe Spectrum 2等设计系统设为默认以减少AI味；2. 先搭建少量功能再通过左侧聊天逐步调整；3. 用Markup框选局部评论并手动Edit元素树；4. 新任务创建新会话管理上下文；5. 通过Tweaks面板调整主题、布局、加载状态及添加导航。

Claude Design 用户可直接抄这5条：引入设计系统去AI味、先搭少量功能再迭代、Markup局部编辑、开新会话控上下文、Tweaks面板调主题布局。

22 @OpenAIDevs 对于音乐家和作曲家 @sound4movement 来说，C…

OpenAI Devs 官方账号分享音乐家 @sound4movement 使用 Codex 的案例：通过自然语言指令生成一段 3/4 拍钢琴曲，包括设定节奏、和声以及描述表演如何逐步展开。展示了 Codex 在音乐创作场景下的交互方式，属于官方用例展示，非新功能发布。

OpenAI 官方展示 Codex 在音乐创作上的一个具体用例：作曲家通过自然语言描述节奏、和声和表演展开，Codex 直接生成钢琴曲。做 AI 配乐和后期声音的可以看看这个交互方式，当个 prompt 模板参考。

23 @anshuc 哇，Claude Fable 对于 iOS 应用来说简直太疯…

开发者 @anshuc 用 Claude Fable 一个提示生成了一款卡路里追踪 iOS 应用，声称效果“极其令人愉悦”。推文附有应用截图。

一个提示生成完整 iOS 应用，做 AI 编程和工具链整合的可以点开看 Fable 的实际输出质量。

24 @HeyGen "There's an era before HeyGen,…

HeyGen 发布客户案例：比利时一人公司 Happy Cats 创始人 Anneleen Bru 用 HeyGen 将 7 本书快速转化为视频，产出效率超过十倍规模的公司。案例展示了单人团队借助 AI 视频工具实现内容批量生产的可能性，适用于短剧、IP 化内容等场景。

HeyGen 的客户故事，讲一个人公司用 AI 视频工具把 7 本书快速转成视频，产出效率超过大公司。做短剧和 IP 运营的可以看看单人工作流能卷到什么程度。

25 @DiabloNemesis 将这个添加到你在 @morphic 上的图像提示中 “使用 …

用户分享一条提示词技巧：在 Morphic 图像生成提示中加入“使用 65mm IMAX 拍摄，浅景深，自然窗光”，可提升画面电影质感。