← 全部日报AIGC 信息日报Daily Digest
2026-06-24 · 周三
25 条 · 4 板块
Daily Digest

2026-06-24

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

Runway 官方宣布平台现已集成 Seedance 4K、Seedance Mini 和 Kling 3.0 Turbo 三款模型,用户可在同一工作流中调用。Seedance 4K 主打高分辨率视频生成,Seedance Mini 侧重快速轻量输出,Kling 3.0 Turbo 为快手旗下视频生成模型。新用户使用优惠码 30RUNWAY 可享前 3 个月 30% 折扣。

Runway 把 Seedance 4K、Seedance Mini、Kling 3.0 Turbo 全塞进一个平台,做 AI 短剧和视觉的直接去测 4K 出片和 Mini 的快速迭代,30% 折扣码限时。

Google DeepMind 旗下 AI 项目 Project Genie 在 2025 年戛纳国际创意节(Cannes Lions)获得 AI Craft 类别全场大奖(Grand Prix)。该奖项表彰在 AI 辅助创意制作领域的杰出作品。Project Genie 是 DeepMind 面向视频生成与创意制作的 AI 工具。

Google DeepMind 的 Project Genie 拿下戛纳创意节 AI Craft 全场大奖,做 AI 短剧和品牌内容的可以关注这个案例的评审逻辑和行业风向。

ElevenLabs 今日发布《奥德赛》有声书,由已故演员 Sir Michael Caine 的 AI 合成声音完整朗读,并配有原创音乐和电影级声音设计。这是 ElevenLabs 在长篇叙事音频领域的正式产品发布,展示了其语音合成技术在情感表达、长篇连贯性和声音设计整合上的能力。

ElevenLabs 用已故演员 Sir Michael Caine 的声音做了整部《奥德赛》有声书,AI 配音和声音设计团队可以直接点开听成品质感,看合成语音在长篇叙事和情感表达上到了什么程度。

Google 官方宣布推出 Gemini Spark,定位为 24/7 全天候个人 AI Agent,可在用户指令下自主完成从启动到收尾的完整任务流程,无需人工中间干预。该产品面向自动化执行场景,适用于复杂多步骤任务的端到端调度与执行。

Google 把 Gemini 升级成 24/7 自主 Agent,能从头到尾执行复杂任务。做 AI 短剧和工具链整合的可以关注它怎么接管端到端工作流,省掉中间手动调度环节。

Sky Computing Lab 发布 FastWan-QAD 视频生成模型系列,基于 FastVideo 的量化感知蒸馏方案训练。在单张 RTX 5090 上,端到端生成 5 秒 480P 视频仅需 1.8 秒。模型、代码及博客已开源。

单卡 5090 上 1.8 秒出 5 秒视频,做短剧和批量出片的可以直接跑开源代码测生成速度和质量。

字节跳动推出豆包专业版,基于豆包2.1系列大模型,面向复杂办公与生产力场景。核心能力包括:Agent 任务模式(操作本地电脑、浏览器、调用 Skills 技能、定时任务)、内置 Office 办公套件、可生成带后端数据库的在线应用。免费用户可用豆包2.1 Turbo 版办公任务模式,专业版接入豆包2.1 Pro 模型。定价:标准套餐68元/月(连续包月),加强套餐200元/月,高级套餐500元/月,大学生认证后标准套餐38元/月(持续6个月)。

字节把 Agent 能力塞进办公套件,能操作本地电脑和浏览器、自动生成带数据库的在线应用。做 AI 短剧和工具链整合的可以看看这套自动化工作流能不能接进自己的生产管线。

Mistral AI 发布 OCR 4 模型,新增边界框、块分类(标题、表格、方程式、签名等)及逐页逐词置信度分数。支持 170 种语言、10 个语系,可单容器全自托管部署。在 OlmOCRBench 上得分 85.20,独立标注者偏好率平均 72%。定价每 1000 页 $4,Batch API 享 50% 折扣。

Mistral 把 OCR 做到 170 语种+自托管,后期团队做多语言字幕/脚本提取的可以直接接 API 或本地部署,省掉传统 OCR 的后期校对成本。

Move AI 官方推文说明其 PLAY 和 GENESIS 两款产品的底层求解算法相同,区别在于应用场景。同时透露正在对 MOVE 无标记点动捕方案进行鲁棒性测试,重点验证在实拍环境和多变光照条件下的表现。推文附有测试链接。

Move AI 在讲自家 MOVE 无标记点动捕方案在复杂光照下的鲁棒性测试,做 AI 后期和动捕整合的可以点开看看测试环境细节。

工具与能力更新

Tools

OpenAI 在 ChatGPT 网页版和 App 端上线双向 AI 语音模型 Bidi 1,位于模型选择器中,与标准语音和高级语音并列。核心能力是支持边说话边监听,用户可在对话中途打断并发出新指令,例如要求从1数到10时中途喊停倒数,模型会立即切换执行。目前部分用户可见,OpenAI 尚未官宣,预计本周启动更大范围测试。

ChatGPT 语音模式最大升级,双向打断和实时指令切换,做 AI 配音、虚拟角色对话、短剧对白录制的可以直接上手测交互流畅度。

Seedance 2.0 在 Higgsfield 平台新增原生 4K 生成能力,并支持将旧生成片段升级至 4K 分辨率。该模型此前已用于高端 AI 视频制作,此次分辨率升级直接缩小了 AI 视频与传统制作的画质差距。

Seedance 2.0 在 Higgsfield 上直接出原生 4K,还能把老生成片段升级到 4K。做 AI 短剧和视觉的可以实测一下,看 4K 下角色一致性和细节保持得怎么样。

Blackmagic Design 发布 DaVinci Resolve 21.0.1 更新,主要改进包括:更精确的 DNG 和 Apple ProRAW 解码,确保图像色彩和亮度一致性;优化 H.265 HDR 渲染的 HDR 元数据处理。已开放下载。

达芬奇 21.0.1 修了 RAW 解码和 HDR 元数据,后期调色和输出 H.265 HDR 的可以直接更新,省一版手动调色时间。

Fish Audio S2.1 Pro 语音模型已集成至 Runware 平台,支持 80+ 语言自动检测、自然语言情绪与表达控制,可生成带情感和语气的语音输出。面向配音、虚拟角色对话、多语言内容制作等场景,API 已开放调用。

Fish Audio S2.1 Pro 上线 Runware,80+ 语言+自然语言情绪控制,做配音和后期可以直接接 API 试一周,看语音质量和情绪表达稳不稳。

Manus AI 更新:Agent 现在能根据用户描述的项目需求,自动搜索并推荐相关网页作为参考来源,用户选择后,Manus 会在后续任务中引用这些页面。这补上了 Agent 工作流中「自主检索外部信息」的环节,减少了人工喂 URL 的步骤。

Manus 的 Agent 工作流补了一块关键拼图——不用再手动喂 URL,AI 自己搜网页当参考。做 AI 短剧工作流编排的可以看看这个交互逻辑,省掉不少人工筛选步骤。

Anthropic 推出 Claude Tag 功能,Claude 可以以团队成员身份加入 Slack 频道,直接访问频道上下文和消息历史,无需手动 @ 或搬运信息。适用于团队协作场景下的信息检索、任务分配和自动化工作流。

Claude 直接以团队成员身份接入 Slack,做 AI 工作流编排和团队协作自动化的可以看看怎么用 Tag 功能减少手动搬运。

Glif 官方宣布新增视频转 GIF 功能,用户上传视频即可直接生成 GIF,无需额外工具。该功能面向创作者日常素材处理场景,操作门槛低。

Glif 新增视频转 GIF 功能,做后期和视觉的可以顺手用,不用再切工具。

方法与经验

Methods

Krea AI 官方发布 Krea 2 技术报告,详细公开了模型的数据构成、架构设计和训练技术细节,包括图像生成和视频生成能力的底层实现。报告面向技术研究者与高级用户,可从中拆解其风格一致性和生成质量的关键方法。

Krea 2 的技术报告公开了,做 AI 视觉和工具链整合的可以进去翻数据、架构和训练细节,看它怎么做到现在的出图质量。

Lovart 官方发布客户案例:一支价值 2.5 万美元的广告片,仅用 Lovart 平台一晚完成,无传统剧组、无 CGI 团队、无实拍,从创意到成片全在提示词内完成。案例展示了 AI 广告制作在成本和时间上的极端压缩能力。

Lovart 官方案例:2.5 万美元广告片,一晚出片,零剧组零拍摄。做短剧和广告的制片人可以点开看成本结构和出片效率,算算能不能套进自己的项目里。

ComfyUI 官方账号展示创作者 seungho__yeo 在 Comfy 内完成从分镜到最终渲染的完整 2D 动画工作流,另一位创作者 whatzuwant 负责 AI 生成动画与声音设计。pipeline 包含海报艺术环节。

ComfyUI 官方号推的完整 2D 动画工作流案例,从分镜到成片全在 Comfy 里跑完。做 AI 动画和短剧的可以顺着工作流拆一遍,看分镜到最终渲染的链路怎么搭。

用户 @sailorv321 分享用于制作短 MV 的舞蹈视频 prompt 第二弹,支持多镜头(multi-shot)和 VFX 效果,需使用一张参考角色图像(面部、发型、体型、服装轮廓、表情、氛围),由 PixVerse 官方账号转发。

做 AI 舞蹈 MV 的可以直接抄 prompt,多镜头加 VFX 的写法有参考价值。

作品 / 案例

Works

创作者 @maxescu 用 OpenArt 的 Director 功能,仅通过对话指定歌曲、视觉方向和主角,AI 自动完成故事、场景、口型同步、剪辑和全片一致性。展示了从一句话创意到完整 MV 成片的极简工作流,适合编导和短剧团队评估全自动出片的质量上限。

OpenArt 的 Director 功能,从对话到 MV 全自动出片,编导和短剧团队可以拉片看叙事连贯性和角色一致性处理得怎么样。

Kling 官方发布完整 MV《WILD》,主题为足球丛林(Football Jungle),已可观看。作为官方出品的 AI 生成 MV,展示了 Kling 在动态场景、角色动作和叙事节奏上的能力,适合作为模型能力参考片。

Kling 官方出品的 MV 成片,足球+丛林题材,视觉师和编导可以拉片看 Kling 在动态镜头和角色一致性上的最新表现。

AI 电影人 Kavanthekid 发布恐怖科幻短片《Last Recall》,由 Wonder Studios 出品,已在 X 上线完整正片。该导演是 X 平台最受关注的 AI 电影人之一,作品风格偏硬核恐怖科幻,不铺垫直接进入剧情。

AI 恐怖科幻短片新作,导演 Kavanthekid 是 X 上最受关注的 AI 电影人之一,做 AI 短剧和编导的可以拉片看叙事节奏和视觉风格处理。

LumaLabsAI 官推发布创作者 @MazuranDomagoj 的 AI 短片《Wolf of Arcadia》,使用 Luma 制作。短片构建了一个「文明非自然,是建造的」世界观,视觉风格偏暗黑史诗,场景和角色一致性是看点。

Luma 官号推的 AI 短片,世界设定和视觉风格有看头,做 AI 短剧和视觉开发的可以拉片看氛围营造和场景一致性。

PixVerse 官方账号转发创作者 @karyabangjumawa 的 AI 短片《Lapangan Mimpi》,讲述一个男孩在巷子里踢球,球飞向天空后世界变成梦想球场的幻想场景。短片主打视觉创意和镜头转场,属于个人创作者作品。

PixVerse 官方转发的 AI 短片,足球少年幻想变球场的视觉创意,做 AI 短片和视觉的可以拉片看镜头转场和氛围渲染。

小红书作者「张拉灯」的 AI 短片《外星人来地球了!但迟到了那么一小会......》,外星人题材,带幽默感的叙事短片。

小红书高赞 AI 短片,外星人题材带点幽默感,做 AI 短剧的可以拉片看叙事节奏和角色一致性处理。