Anthropic 发布 Claude Fable 5,定位为 Mythos 级模型,已做安全对齐可开放使用。能力超越此前所有 Claude 模型,具体参数和 API 接入细节待官方后续披露。
Anthropic 新模型发布,Mythos 级能力,做 AI 编程和 Agent 工作流的可以直接接 API 测一周,看推理和代码生成比前代强多少。
为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达
Anthropic 发布 Claude Fable 5,定位为 Mythos 级模型,已做安全对齐可开放使用。能力超越此前所有 Claude 模型,具体参数和 API 接入细节待官方后续披露。
Anthropic 新模型发布,Mythos 级能力,做 AI 编程和 Agent 工作流的可以直接接 API 测一周,看推理和代码生成比前代强多少。
LumaLabs 官方宣布 Ray3.2 模型发布,核心卖点是方向控制(Direction goes in, Cinema comes out),强调通过更精准的镜头方向指令生成电影感画面。
Luma 官宣 Ray3.2,主打方向控制让画面有电影感。做 AI 短剧和视觉的可以直接点链接看 demo 和参数,判断这次出片质感稳了多少。
fal平台上线Bernini-R模型,统一支持视频生成与指令式编辑:可替换物体、天气、背景、镜头角度或风格,同时保持场景结构不变;支持最多5张参考图像引导,实现角色/场景视觉一致性。已开放API调用。
一个模型搞定视频生成+指令编辑,还能用5张参考图锁风格一致性。做短剧和视觉开发的可以直接上fal测,省掉来回切工具的时间。
LumaLabs 发布 Ray3.2 API,定位电影级画质(cinematic-grade)的规模化视频生成,面向开发者、机构和企业的产品集成场景。API 已开放,可接入现有工具链。
Luma 把 Ray3 升级到 3.2 并开放 API,主打电影级画质和规模化生产。做 AI 短剧和视觉开发的可以直接接 API 测出片稳定性和风格一致性。
Letz AI 发布 Canvas,一个 Agent 工作台,可自动生成视频、网站、演示文稿等多种内容,并附有使用指南。
一个能同时出视频、网站、PPT 的 Agent 工作台,做短剧和视觉的可以蹲实测看它视频生成的质量和可控性。
LumaLabs 的 UNI-1 图像模型已上线,定位为多模态推理模型,能生成像素并具备参考图跟随和视觉智能能力,适用于风格统一的图像生成场景。
Luma 的 UNI-1 图像模型正式上线,主打多模态推理和参考图跟随,视觉师和做风格统一的可以直接上手测出图质感。
微软开源工具遭供应链攻击,攻击者植入恶意代码窃取 AI 开发者的密码和凭证。该事件在 Hacker News 引发 523 分高热度讨论,涉及 AI 开发工具链的安全风险。
微软开源工具被植入后门窃取 AI 开发者凭证,搞 AI 工具链和 Agent 的这周自查一遍依赖和 CI/CD 管道。
LetzAI 发布 Canvas 工作区,重新设计了节点式 UI,支持在单一画布内创建网站、Pitch Deck、电影等多种内容类型,所有生成元素均可直接编辑修改,面向 AI 艺术家和创作者。
LetzAI 把节点式 UI 重做了一遍,能直接在里面出网站、Pitch Deck 甚至电影,所有元素可编辑。做 AI 工作流整合的可以点开看它跟 ComfyUI 比改了什么。
Hyperframes 成为 Anthropic Claude 官方 MCP 连接器,可将 LLM 生成的密集文本自动转化为视频内容,运行在用户工作流中。官方称「文档被扫读,视频被理解」,并附有一段用 Hyperframes 制作的视频作为示例。
Hyperframes 成了 Claude 官方 MCP 连接器,能把文档自动转成视频。做 AI 后期和工具链整合的可以接上试试,省掉手动把文档转成视频素材的环节。
Skywork 发布 Designers Skill Pack,一套从品牌识别到网站上线的全流程工具包,面向设计师级网站制作。
Skywork 出了一套从品牌到上线的网站设计工具包,做 AI 视觉和美术的可以看看工作流有没有可复用的环节。
Google DeepMind 发布 Gemini 3.5 Live Translate,在 Google AI Studio、Google Translate 和 Google Meet 中提供近实时、自然的语音翻译能力。该功能基于 Gemini 3.5 模型,支持多语言实时对话翻译,延迟低、语调自然,适用于配音、实时字幕、多语言会议等场景。
Google 把实时语音翻译塞进 AI Studio、Translate 和 Meet,延迟和自然度都升了一档。做 AI 配音、多语言字幕、虚拟角色对话的可以直接接 API 试一周,看能不能替代现有 TTS 翻译方案。
LumaLabs 宣布其视频生成模型全线升级:输出分辨率提升至 1080p,Video-to-Video(V2V)时长延长至 20 秒,新增原生 HDR 生成和 16-bit EXR 导出能力,AI 生成画面可直接与实拍素材在 DaVinci Resolve 或 Nuke 中合成调色。
Luma 把视频生成拉到 1080p 和 20 秒 V2V,还支持原生 HDR 和 16-bit EXR 导出,后期可以直接叠实拍素材进 Nuke/Resolve 调色。做 AI 短片和视觉特效的可以实测一下合成管线兼容性。
Pika Labs 推出 Language Swap 技能,通过 Pika MCP 实现视频内语言替换,支持口型同步和语音替换,让视频中的人物看起来像在说另一种语言。该功能面向视频本地化场景,适用于短剧出海、多语言配音、内容全球化分发等需求。
Pika 官方出的视频语言替换技能,口型同步+语音替换一条龙,做短剧出海和后期配音的可以直接装 MCP 跑一遍,省掉传统配音对口型的麻烦。
Anthropic 的 Claude Fable 5 模型现已在 Replicate 平台正式开放 API 调用,开发者可直接通过 Replicate 接口使用该模型,无需等待 Anthropic 官方直接开放。
Claude 最新模型通过 Replicate 开放 API,做 AI 编程和工具链集成的可以直接接上跑工作流,不用等官方排队。
Move AI 宣布其混合无标记动捕方案(MOVE solve)已成功运行在 Qualysis 光学摄像系统上,实现即时(on premise)解算,无需标记点,适用于任何拍摄视频的光学系统。从演示看数据质量很高,意味着传统光学动捕棚可以无缝接入 AI 无标记工作流,省去贴点、清理数据等后期环节。
Move AI 的无标记动捕方案跑通了 Qualysis 光学系统,做虚拟制片和后期动捕的可以直接接自家光学棚测数据质量。
HeyGen 推出视频录制自动修词功能,可自动清除填充词、尴尬停顿、口误和重录片段,无需重新录制或手动重建剪辑。适用于口播、配音、短剧对白等场景,降低后期修音修词工作量。
HeyGen 给视频录制加了自动修词功能,后期不用再手动剪掉口吃和空白,做口播和短剧配音的可以省一版粗剪时间。
Runway 官方宣布其视频编辑工具新增一键重裁视频至不同宽高比的功能,支持横屏、竖屏、方形等主流比例,适配不同社媒平台分发需求。该功能直接集成在 Runway 现有编辑工作流中,无需手动裁剪或重渲染。
Runway 官方推的横竖屏一键重裁功能,做短剧和社媒分发的后期可以直接省掉手动重剪的功夫,点开链接看支持哪些比例。
Adobe 创意工具集成至 Claude,用户可在对话中直接调用设计、视频、照片工作流的 Skills 模块(如 Portrait Retouch 人像修图),无需切换软件即可完成创意编辑。
Adobe 创意工具直接嵌入 Claude 对话,修图、调色、视频剪辑都能在聊天里调技能模块。做视觉和后期的不妨装起来试一轮,看能不能省掉来回切软件的功夫。
LumaLabs 官方 X 账号转推 @patrickcarlyle 的推文,内容仅提及「Shipping, shipping, and more shipping. Enjoy Ray 3.2」,暗示 Ray 3.2 版本已上线或即将推送。
Luma 官号转推暗示 Ray 3.2 更新,具体能力未知,做 AI 视频的可以蹲一下看是不是出片质量或工作流有变化。
ComfyUI 官方发布 Seedance 2.0 集成工作流:用 LLM 将一句话创意自动拆解为分镜级场景描述,可搭配参考图直接送入 Seedance 2.0 生成视频。从创意到分镜到出片一条线走通,无需手动编写逐段 prompt。
ComfyUI 官方出的 Seedance 2.0 工作流,从一句话创意到分镜再到出片一条线走通,做短剧和编导的可以直接套用跑一遍,省掉手动拆 prompt 的功夫。
HeyGen 官方展示了一条全自动广告制作链路:Claude Code 写代码 → HyperFrames 生成视觉素材 → HeyGen MCP/CLI 驱动数字人出镜 → 最终渲染出完整的 Ollama 品牌广告。整个流程由 Agent 自主完成,无需人工介入。
一条从 Claude Code 到 HeyGen 全自动出广告的 Agent 链路,做短剧批量生产和工具链整合的可以直接抄工作流跑一遍。
OpenAI 发布 Notion 使用 Codex 的客户案例:Notion 用 Codex 一次性生成技术规格文档、为网页端构建 AI 语音输入功能、并让小团队实现工程产出倍增。案例展示了 Codex 在代码生成、语音交互和团队效率提升三个场景的实际落地效果。
OpenAI 官方客户案例,讲 Notion 用 Codex 一次生成技术规格、做网页端 AI 语音输入、小团队放大工程产出。做 AI 工具链整合和 Agent 工作流的可以当参考模板看。
创作者 @CharaspowerAI 演示了 Higgsfield 平台上的 Seedance 2.0 功能:在静态图像上随意画几根红色箭头,模型即自动理解并生成对应的镜头运动轨迹,输出电影级飞越镜头,无需时间线或相机参数设置。
在图上随手画几根红箭头就能控制镜头运动,做分镜和视觉的可以点开看效果,省掉 timeline 和相机参数。
Transformer Lab 发布 Ideogram 4 的消费级 GPU 量化方案,Q4_K 版本在显存占用和出图质量之间做了平衡,让原本需要高端显卡的模型能在普通消费卡上运行。
Transformer Lab 搞定了 Ideogram 4 的消费级显卡量化,做 AI 视觉和本地部署的可以跑一遍 Q4_K 看看出图质量损失多少。
ComfyUI官方账号转发@heydoughogan的AI电影制作工作流演示,核心观点:最佳工作流不是找一个万能模型,而是为不同镜头混搭不同模型,并用LLM编写prompt再逐模型适配。视频演示了帧级调整的具体操作。
讲的是不同镜头混搭不同模型、用LLM写prompt再逐模型适配的思路,做AI短剧和视觉的可以点开看具体怎么拆镜头配模型。
创作者 @MayorKingAI 分享用 Pika MCP 配合 Language Swap Skill 实现 AI 日语配音,用自己的声音说出不熟悉的语言,适用于多语言内容本地化和配音场景。
个人创作者用 Pika MCP + Language Swap 实现 AI 配音日语,做后期和配音的可以看看这个工作流,省掉真人配音和语言学习成本。
Leonardo AI 发布一个 Blueprint 模板,可将产品与包装图自动转为 10 秒竖屏开箱视频,仅含手部交互,面向营销和内容创作者。模板链接内含具体工作流步骤。
Leonardo AI 官方出的开箱视频模板,10 秒竖屏、只拍手部动作,做电商视觉和产品短片的可以直接套用这个 Blueprint 跑一遍。
创作者 @mxvdxn 分享其视频工作流中角色表(character sheets)的迭代过程:从最初仅 3 视图的简单设计,逐步演进到更精细的版本。该推文为个人经验分享。
个人创作者分享角色表从简到繁的迭代思路,做 AI 动画和短剧的视觉师可以看看角色一致性怎么靠前期设计卡住。
个人创作者 @underwoodxie96 用 AI 制作《美少女战士》真人变身视频,完整工作流、prompt 和 Canvas 分享链接已公开在评论区。视频为单角色变身片段,非完整叙事作品。
个人创作者用 AI 做美少女战士真人变身视频,工作流和 prompt 都公开在评论区,做角色动画和视觉特效的可以直接套用跑一遍。
LumaLabsAI 转发 DreamLabLA 的 AI 短片《Ray3.2》预告片,已上线可观看。主打全控制面(full control surface)和电影级画质,强调导演对画面方向的控制力。
Luma 官号转发的 AI 短片预告片,主打全控制面和电影级画质,做 AI 视觉和短剧的可以拉片看镜头质感和控制力表现。
小红书作者ROBBBB-Shorts的AI微电影《午夜髮廊》短片,悬疑剧情向题材。个人创作者独立完成的长叙事AI作品。
小红书作者ROBBBB-Shorts的AI微电影,题材偏悬疑剧情向,做AI短剧的可以拉片看长叙事和氛围营造怎么处理。