← 全部日报AIGC 信息日报Daily Digest
2026-06-19 · 周五
29 条 · 4 板块
Daily Digest

2026-06-19

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

Luma Labs 推出 Luma Skills 功能,允许用户将一次性的创意工作流(如特定风格的角色动画、镜头运动、调色方案)保存为可重复调用的 Skill,后续新项目可直接复用,无需重新搭建。该功能面向批量内容生产场景,旨在降低重复劳动、提升 AI 创作的一致性。

Luma 把可复用的创作工作流做成了产品功能,做短剧和批量视觉的可以当周上手测,看能不能把常用流程一次搭好反复跑。

fal 平台上线 Rodin v2.5 模型,支持文本或最多 5 张参考图生成生产级 3D 资产,输出带 PBR 材质和 HD 纹理,三角面数从 50K 到 2M 分档可选,覆盖背景到主角级资产。

3D 资产生成从 50K 到 2M 三角面可选,带 PBR 材质和 HD 纹理,做 AI 视觉和场景搭建的可以直接上 fal 测一轮出图质量。

fal 平台上线 Boogu Image,一个约 10B 参数的开源图像模型,主打照片级写实感和指令式图像编辑能力。提供 Text-to-Image 和 instruction-based Edit 两个 API 端点,支持原生 2K 分辨率输出。

Boogu Image 上架 fal,10B 参数开源模型,原生 2K 出图+指令编辑,做视觉和美术的可以直接接 API 跑一轮看质感。

xAI 官方宣布 Grok TTS 语音模型,定位为「最像人的语音合成」,该条推文文本仅含标题和链接,无实质内容。

xAI 官宣 Grok TTS 语音模型,主打拟人度。做 AI 配音、虚拟角色对话的可以直接蹲 API 实测,看自然度和延迟能不能打。

Adobe 发布重新设计的 Firefly AI 工作室,今日开启私测。核心更新是「持久上下文」:AI 能记住你之前创建的设计风格和素材,跨项目复用,无需每次重新描述。所有编辑和生成操作整合在单一界面内完成,支持可复用的资产库和结构化工作流。

Adobe Firefly 的 AI 工作室大改版,核心是记住了你之前做的图,跨项目复用素材和风格。做视觉和美术的可以蹲私测,省掉反复调参的功夫。

PixVerse 与《足球小将》官方 IP 合作,推出限时 AI 共创活动(2026年6月12日-7月26日),用户可用 PixVerse 平台创作自己的足球故事。活动含转发抽奖送 300 积分。这是 PixVerse 首次与知名动漫 IP 进行官方授权合作,验证了 AI 视频平台与经典 IP 联动的商业化路径。

PixVerse 拿下《足球小将》官方 IP 授权做 AI 共创活动,做短剧和 IP 衍生内容的可以看看官方怎么玩授权合作和用户共创的链路。

Async Pro v1.0 多语言 TTS 模型上线 fal 平台,支持英、德、法、西、意、葡六语种,主打自然语速、清晰发音和流畅句间过渡,内置混合内容文本归一化处理。

多语言 TTS 模型上线 fal,后期和短剧团队做多语配音可以直接接 API 跑一轮,听自然度和语种覆盖够不够用。

Krea 推出创作者计划,面向艺术家、设计师和 AI 原生创作者开放申请。入选者可获得算力支持、新功能提前体验权、创作者奖励,以及与 Krea 团队更直接的沟通渠道。申请链接已开放。

Krea 开了个创作者计划,给算力、提前用新功能、还有奖励。做视觉和 AI 原生创作的可以填表申请,离团队近一点。

Vibe Jam 2026 获奖名单公布,由 Cursor、Bolt、Glif、Tripo 等 AI 工具厂商联合赞助。该推文仅列出获奖者名单,赞助商阵容覆盖了 AI 编程、前端生成、图像生成和 3D 建模,可作为当前 AI 创作工具链生态的参考。

Vibe Jam 2026 获奖名单公布,赞助商阵容(Cursor、Bolt、Glif、Tripo)本身就是工具链风向标,做 AI 短剧和整合工作流的可以看看获奖作品用了哪些工具组合。

Wonder Studios 宣布将于 6 月 24 日与 OpenArt AI 联合举办大师课,主题为 OpenArt 新推出的智能体工作流「Director」。目前该工作流已向 Wonder 社区开放抢先体验,具体功能细节和操作方式需通过链接查看。

OpenArt 的 AI 导演工作流「Director」即将办大师课,现在有社区抢先体验名额。做 AI 短剧和编导的可以蹲一下这个工作流怎么用,看看能不能套进自己的制作流程。

工具与能力更新

Tools

Luma 在 Agents 产品中推出 Skills 功能:上传一次创意资产(品牌视觉、角色设定、产品图等),即可构建一个可复用的工作流,后续输入新想法或客户需求,自动生成数百个保持产品一致性的概念方案。面向快速出稿和批量创意迭代场景。

Luma 把创意资产打包成可复用的工作流,做短剧和广告批量的可以直接把品牌素材丢进去跑一轮,看自动出多少版物料。

Leonardo 推出图生视频新功能:从单张静态图直接生成电影级动态画面,支持 720p 分辨率、最长 15 秒,并同步生成匹配音效,一次完成无需后期合成。已开放使用。

Leonardo 把图生视频做到 720p/15 秒,还带同步音效,做短剧和视觉的可以上手跑一遍,看废片率和质感够不够直接进剪辑线。

HeyGen 推出 MCP 服务器,可接入 Cursor AI 编程工具。用户只需在 Cursor 中配置该服务器并指向项目 README,AI 即可自动提取产品功能、定价等信息,一句话生成完整的发布视频,无需拍摄和剪辑。

HeyGen 的 MCP 服务器接入 Cursor,一句话从 README 自动生成产品发布视频。做后期和工具链整合的可以直接装起来跑一遍,省掉拍摄和剪辑环节。

Midjourney 官方发布技术博文,详细拆解新功能「Midjourney Scanner」的内部原理与实现方式。该功能可将实体扫描件/照片输入后,通过 AI 进行修复、增强或风格化处理。

Midjourney 官方技术拆解新 Scanner 功能,做视觉和后期修复的可以点开看具体怎么用,省得自己试错。

Pika Labs 推出「Fix My Look」功能,用户可通过自然语言指令让 AI 代理自动优化视频的视觉美学,覆盖头发、灯光、化妆、背景等维度。该功能内置于 Pika 现有视频生成平台,无需额外工具或插件。

Pika 给视频加了个 AI 造型师,调头发、打光、化妆、换背景一句话搞定。做后期和视觉的可以省掉一多半逐帧修图的时间,直接跑一遍看效果稳不稳。

ComfyUI 官方宣布集成 Kling 3.0 Turbo 模型,主打 Kling 系列最快生成速度、强提示词遵循(首次运行即出片)、改进的音画同步,以及最佳性价比。用户更新 ComfyUI 至最新稳定版即可使用。

Kling 3.0 Turbo 进 ComfyUI 了,生成速度最快、提示词一次跑准、音画同步也修了。做短剧和批量出片的可以直接接进工作流跑一轮,看废片率降多少。

Topaz Labs 的 AI Sharpen 功能正式集成进 Adobe Lightroom,位于菜单栏 Photo > Enhance with AI > AI Sharpen。该功能专为高分辨率 RAW 图设计,能在保留自然噪点和胶片颗粒的前提下恢复细节纹理,适合后期修图、素材预处理等场景。

后期修图直接省一步,AI 降噪锐化塞进 Lightroom 菜单栏了,做 AI 后期和视觉的可以装上实测效果。

LetzAI Canvas 推出协作式 AI 编辑功能,AI 能实时看到用户屏幕内容,支持共同编辑网页、演示文稿、故事板等。官方发布教程演示如何用该功能克隆并编辑现有网站。

LetzAI Canvas 新功能:AI 能实时看到你的屏幕,一起协作改网页、做分镜、改 PPT。做分镜和视觉开发的可以上手试一下协作效率。

Replicate 平台上线 Riverflow 2.5 图像生成模型,该模型在 Designarena 榜单排名靠前。需实测确认风格与质量。

Riverflow 2.5 上了 Replicate,Designarena 榜单前排的图生模型,视觉师可以跑几张看看风格质感,做工作流集成的顺手接个 API。

Perplexity 推出 Brain 功能,让 AI Agent 在每次任务开始时自动携带项目上下文、历史决策和来源信息,而非从零开始。官方数据:在需要过往上下文的任务上,答案正确性提升 25%,召回率提升 16%,单次任务成本降低 13%。已开放 API 调用。

Perplexity 给 AI Agent 加了个长期记忆层,做 AI 编程和自动化工作流的可以接 API 测一周,看上下文复用对创作工具链的提效有多大。

方法与经验

Methods

推文展示 Fusion Agent Swarms 多 Agent 协作系统,组合 Kimi 2.7、GLM 5.2、Opus 4.8 和 GPT 5.5 四个模型,90 秒内完成一个带 Stripe 支付的完整 SaaS 应用搭建。核心是多 Agent 分工协作而非单模型完成全流程。

多个 AI Agent 协作 90 秒搭完带支付的 SaaS 应用,做 AI 短剧工具链和自动化工作流的可以看看这个 Agent 协作模式能不能套到批量出片上。

ComfyUI 官方账号发布 Krea 2 与 GPT Image 2 的风格迁移对比测试:同一 prompt、同一参考图,7 轮对照。结论是 Krea 2 更侧重风格化诠释(如 Dithered Print、Retro-Future 等),GPT Image 2 更偏向精准执行 prompt 指令。

Krea 2 和 GPT Image 2 同 prompt 同参考图硬碰硬 7 轮,视觉师可以直接看对比图判断哪个更适合自己的风格方向。

ComfyUI 官方账号分享创作者 seungho__yeo 的工作流:用鼓手真实动作数据逐帧重绘现场鼓演奏的背景氛围、灯光和空间深度,而非随机生成。pipeline 链接已公开,适合 AI 视觉师和后期剪辑参考。

用鼓手真实动作数据逐帧重绘背景光影和空间深度,做 AI 视觉和后期剪辑的可以点开 pipeline 跑一遍,比纯抽卡式生成有控制力得多。

创作者 Bear Liu 将过去五年 11 本共 500 多页手绘素描本扫描后,用 Claude 视觉 API + Obsidian 搭建了一套可搜索、过滤、查询的个人知识库,总成本不到 10 美元。该流程是一个固定结构的视觉处理管道,可指向任何非结构化个人内容(手写日记、会议便签、涂鸦等),视频中拆解了 schema 设计、批量打标签、Obsidian 画廊搭建等步骤。

个人创作者用 Claude 视觉 API + Obsidian 把 500 页手绘素描本变成可搜索知识库,成本不到 10 美元。做视觉开发的可以套用这套管道来管理自己的灵感素材库。

创作者 @maxescu 展示在 Claude 内完成产品广告全流程:竞品调研、创意策略、素材生成,最终产出成片。视频中所有内容均为 AI 生成,展示了单一 Agent 工具链从策略到成片的闭环能力。

一个人用 Claude 从竞品调研到出片全包,做短剧和广告的可以看看这个工作流能省多少人力。

个人创作者分享:Seedance 2.0 可将分镜故事板直接转为商业级成片,保持角色、产品和场景一致性。推文附 Arcads 平台操作链接,适合短剧和广告批量出片场景。

Seedance 2.0 把分镜草稿转成商业成片,角色、产品、场景一致性都保住了。做短剧和广告的可以点开链接看具体怎么在 Arcads 上操作。

Google 官方演示一条工作流:用 Gemini API 将提示词扩展后,通过 Nano Banana 生成精灵图(sprite sheet),再为前景元素生成法线、粗糙度和发射贴图,利用推断的深度信息将纹理映射到 3D 纸箱模型上,在 Spline 中渲染。

Google 官方演示 Nano Banana + Gemini API 做 3D 贴图的工作流,做视觉和 3D 美术的可以当工作流模板跑一遍。

个人创作者 @CharaspowerAI 用 Runway Aleph 2.0 模型(集成在 Firefly Boards 平台内),将一段摩托车 POV 实拍素材转换为多种风格的新世界和电影级环境,并展示了不同迭代版本之间的对比效果。

个人创作者用 Runway Aleph 2.0 把摩托车 POV 实拍转成不同风格的电影级环境,做后期和视觉的可以看看迭代对比效果稳不稳。

作品 / 案例

Works

个人创作者 StevieMac03 用 Seedance 2.0、Pixverse 和 Topaz 三款工具制作科幻短片《The Banshee part two - Akari》,输出 4K 60fps。多工具混搭工作流下,角色一致性和视觉风格统一是看点。

个人创作者用 Seedance 2.0 + Pixverse + Topaz 拼出的科幻短片,做 AI 短剧和视觉的可以拉片看多工具混搭下的风格统一和画质修复效果。