← 全部日报AIGC 信息日报Daily Digest
2026-06-14 · 周日
19 条 · 4 板块
Daily Digest

2026-06-14

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

AI 电影《LAST RECALL》将于 6 月 12 日在翠贝卡电影节首映,由 @WonderStudiosX 转发宣布。该片入选国际顶级电影节主竞赛/展映单元,是 AI 长片进入主流电影节的最新案例。

AI 电影入选翠贝卡电影节,做 AI 长片和短剧的可以关注正片上线后的叙事和视觉一致性处理方式。

智谱 AI 宣布 GLM-5.2 模型完全开源,强调科学全球性,回应近期部分前沿模型被限制访问的事件。该模型可本地部署,对依赖 API 的 AI 编程、Agent 工作流开发者是直接利好。

智谱 GLM-5.2 完全开源,做 AI 编程和 Agent 工作流的可以直接拉下来本地部署,不用再担心 API 被断供。

KOL @jumperz 预测 GLM 5.2 在 DeepSWE 基准上得分约 25%,基于 GLM 5.1 的 18% 成绩加上小版本更新典型提升 4 分,并提及 1M 上下文窗口能力。该推文为个人预测,非官方发布或实测数据。

个人对 GLM 5.2 的 DeepSWE 成绩预测,非官方发布,信息量有限。搞 AI 编程 Agent 的可以当个参考,但别当事实用。

工具与能力更新

Tools

Suno 官方宣布音轨分离功能大幅升级:不再通过频率隔离提取音轨,而是从零重新生成纯净音轨,输出无伪影、可直接拖入 DAW 使用的分轨文件。

Suno 音轨分离从「隔离」升级到「重新生成」,做 AI 音乐和后期混音的可以直接拖进 DAW 用,省掉去伪影的功夫。

MiniMax 开源多模态模型 M3 上线 Together AI 平台,推理吞吐量提升 125%。M3 原生支持 1M 上下文、稀疏注意力和思考/非思考模式,适合长文档、多模态理解等场景。做 AI 工具链集成和 API 调用的可以直接在 Together AI 上跑起来测效果。

MiniMax-M3 上了 Together AI,推理速度翻倍,做工作流集成的可以直接接 API 跑长上下文任务,省不少等待时间。

方法与经验

Methods

通义实验室发布实测案例:Qwen3.7-Max 在无设计稿、无后端代码条件下,仅凭一份约 15 万字产品调研文档,于隔离环境中全自动完成移动端(可安装 APK)与 Web 端(34 条路由全部可达)两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用“分阶段注入约束→逐层验收→带错纠正”的闭环控制系统,失败时错误文本自动注入下一轮重试,使模型数小时内收敛。

通义实验室的实测案例,Qwen3.7-Max 仅凭一份 15 万字文档,零人工干预 4 小时交付双端应用。做 AI 编程工具链和自动化交付的可以细看闭环控制系统的设计思路。

HuggingFace 社区热门论文发布 i1,一个 3B 参数的文本到图像扩散模型,仅用公开数据集训练。在 GenEval、DPG 等五个基准上性能与领先模型相当,平均比最佳现有完全开源模型高 29.5 个百分点。研究基于 300 余项控制实验(超 700K TPU v6e 小时),发现等权重混合 curated 数据集是强默认配置。检查点、训练与推理代码及数据处理流程已全部开源。

3B 参数开源文生图模型,性能追平闭源,平均比现有最佳开源模型高 29.5 个百分点。做视觉风格开发和工具链整合的可以拉代码跑一遍,看能不能当免费平替用。

HYDRA-X 是首个在单个 Vision Transformer 中统一图像与视频 tokenization 的多模态模型。核心创新:帧级因果时间注意力实现视觉重建,层级时间压缩替代单步压缩,轻量级解压器在联合图像-视频教师监督下工作。编辑管线在分词器内部潜在层面进行,而非 LLM 语义层面,提升编辑一致性与收敛速度。7B 密集模型在图像与视频理解及生成任务上表现强劲。

首个统一图像和视频 tokenization 的 ViT 模型,做 AI 视觉和后期处理的可以关注编辑一致性和时间压缩能力,技术团队值得细读论文。

MiniMax M3 模型驱动 Hermes Agent 实现桌面自动化创作:Agent 自主连接 TouchDesigner、读取参考图、在自我学习循环中迭代视觉作品,并将学到的技能保存复用。展示了 AI Agent 从零学习专业创作工具并形成可复用工作流的可能性。

AI Agent 自学 TouchDesigner 做视觉创作,搞工作流整合和自动化美术的可以看看这个自我学习循环怎么跑通的。

Hugging Face 博客分享了一个工作流:编码Agent调用两个HuggingFace Space,先用ideogram-ai/ideogram4生成纪念碑黑色背景图像,再通过VAST-AI/TripoSplat将单张图重建为3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过`agents.md`暴露可调用API。

一个Agent串起两个HuggingFace Space,从文生图到3D高斯散点图一键出交互式画廊。做AI视觉和技术整合的可以拆这条工作流,看怎么用`agents.md`暴露API做链式调用。

开源工具 Tokei 是 macOS 菜单栏小工具,只读本地日志、零网络调用,30 秒自动刷新,实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据,并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖,闲置过久会提醒休息。数据全程私有,零侵入,无需任何认证。

做 AI 短剧或批量出片的团队,如果深度依赖 Claude Code 或 Aider 来跑工作流,这个菜单栏小工具能帮你实时盯住 token 成本,省得月底对账才发现超支。

Manus AI 发布客户案例:Heicoders 团队(无专职软件工程师)在几个月内用 AI Agent 重建了包括招聘门户、学生支持系统、HR 门户、课程反馈看板在内的整套运营基础设施。展示了非技术团队借助 AI 工具完成全栈开发的能力。

一个没有专职工程师的团队用 AI Agent 几个月内搭了整套运营系统,做 AI 短剧/动画的制片人和技术整合者可以看看这种模式能不能套到自己的制作管线里。

作品 / 案例

Works

B站团队协作完成的伊藤润二《鱼》AI真人化二创,10集合集版,制作总监、AI制作、剪辑、声音、美术分工明确。作品将伊藤润二标志性的恐怖漫画风格转化为AI真人影视质感,验证了团队化AI二创长片的可行性。

伊藤润二《鱼》的AI真人化二创,10集合集近,团队协作完成。做AI短剧和视觉的可以拉片看恐怖题材的AI视觉风格化处理和长叙事节奏把控。

新片场发布 AI 原创藏地短片《莫羌》,获海影节 AI 电影季获奖影片及首尔国际 AI 电影节金奖。短片为藏地题材,风格化视觉叙事,适合拉片分析 AI 影像在特定地域美学与叙事节奏上的处理方式。

藏地题材 AI 短片,拿了两个电影节奖项,做 AI 短剧和视觉的可以拉片看风格化叙事和地域美学怎么落地。

PixVerse 官方发布 AI 短片《The Uninvited Sea》,定格动画质感混搭奇幻海盗题材,官方同步公开了 Canvas 工作流细节。

PixVerse 官方放出的 AI 短片,定格动画质感混奇幻题材,视觉师和编导可以拉片看风格一致性处理,顺便拆一下官方公开的 Canvas 工作流。

PixVerse 官方原创系列《Divine Agent》第一集,由 TEAM 88GO 制作,基于 PixVerse Canvas 工作流构建。题材为奇幻动作惊悚,角色包括 stoic shaman、鲨鱼头盔女孩、以恐惧为食的隐形怪物。

PixVerse 官方扶持的原创系列第一集,奇幻动作惊悚题材,做 AI 短剧的可以拉片看 PixVerse Canvas 工作流下的叙事和视觉风格处理。

B站UP主「李佳薇」为B站AI创作大赛三国主题赛制作的貂蝉单曲MV《凤仪亭》,含AI生成内容。该系列已有多首三国人物单曲,视觉风格统一,角色形象一致性处理是看点。

B站AI大赛三国主题赛作品,貂蝉AI单曲MV,视觉风格和角色一致性是看点,做AI MV和角色IP的可以拉片看人物形象统一度。

B 站 UP 主「真人AI短剧」系列《末世求生之重卡》已更新至第 8 集,末世求生题材,AI 生成角色与场景。

B 站 UP 主连载的 AI 短剧系列,末世求生题材,已更新到第 8 集。做 AI 短剧的可以拉片看长系列的角色一致性和叙事节奏怎么处理。

B站个人创作者「萌新」的AI原创末日废土短剧《归墟》第五集《失序》,讲述从失踪案到巨蚁出现、城市失序的逃亡故事。业余时间制作,更新不定时,属于个人创作者的长篇AI叙事尝试。

个人创作者连载的末日废土AI短剧,第五集已出。做AI短剧的可以看看个人创作者在长线叙事和视觉一致性上怎么处理的。