Runway 宣布作为创始成员加入 NVIDIA 发起的 Cosmos Coalition 全球倡议,该联盟联合多家头部 AI 实验室,共同构建并开源面向物理 AI 的前沿世界模型。此举旨在推动物理世界模拟的基础模型开放共享,Runway 将贡献其在视频生成和世界理解方面的技术积累。
Runway 加入 NVIDIA 牵头的世界模型开源联盟,搞物理 AI 的底层模型。做 AI 视觉和工具链整合的可以关注后续开源模型对视频生成工作流的影响。
为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达
Runway 宣布作为创始成员加入 NVIDIA 发起的 Cosmos Coalition 全球倡议,该联盟联合多家头部 AI 实验室,共同构建并开源面向物理 AI 的前沿世界模型。此举旨在推动物理世界模拟的基础模型开放共享,Runway 将贡献其在视频生成和世界理解方面的技术积累。
Runway 加入 NVIDIA 牵头的世界模型开源联盟,搞物理 AI 的底层模型。做 AI 视觉和工具链整合的可以关注后续开源模型对视频生成工作流的影响。
Replit 上线新功能:用户只需输入一个提示词,即可免费生成一个包含网站、移动应用、幻灯片和发布视频的完整业务原型。同时集成了 Stripe(支付)、Atlas(公司注册)、QuickBooks(财务)、Mercury(银行)和 doolaHQ(合规)等商业服务工具。对AI影视创作者来说,这意味着可以用单个提示词快速搭建作品展示站点、自动化分发后台或轻量级SaaS工具原型,大幅降低从创意到上线的技术门槛。
从一句话到网站+App+幻灯片+发布视频全自动生成,还绑了Stripe、QuickBooks等商业工具。做AI短剧或MCN的可以试试用它搭个作品展示站或自动化分发后台。
NVIDIA 发布 RTX Spark,一款专为本地 AI 智能体设计的 Windows 电脑,提供 1 petaflops AI 算力与 128GB 统一内存。通过多 token 预测等优化,Qwen 3.6 和 3.5 27B 模型推理吞吐量提升最高达 2 倍,多 GPU 优化使 llama.cpp 和 ComfyUI 获得最高 2 倍性能提升。
NVIDIA 出了台专跑本地 AI 的 Windows 电脑,1 petaflops 算力 + 128GB 内存,ComfyUI 性能翻倍。做 AI 视觉和后期的工作室可以看看本地部署能省多少云成本。
OpenAI 宣布其前沿模型(含 GPT-4o 系列)和 Codex 代码生成模型已在 AWS 上正式可用,企业客户可通过 AWS 的采购、安全和部署环境直接使用 OpenAI 模型,无需额外切换平台或走独立 API 签约流程。
OpenAI 模型正式上架 AWS,企业级采购和部署门槛降了一档。做 AI 短剧或视觉工具链的技术整合者,可以关注 AWS 环境下的 API 调用和合规流程。
商汤发布 SenseNova-U1-8B-MoT-Infographic 模型,专门解决AI生成图表时数值错误(如负值显示为正)、柱状图位置偏移、元素关系混乱等常见问题。支持实时调整设计和布局,已在Hugging Face开源,GitHub有效果案例。
商汤专治AI图表数值错乱和布局偏移,做信息图/数据可视化视觉的可以直接拉模型跑一批测试图看看效果。
Google Gemini 官方账号发布 Gemini Omni 数字分身创建教程,支持用户上传个人影像和声音素材,生成外观和声音都像自己的 AI 数字分身,并用于视频创作。教程以 Thread 形式逐步拆解操作流程。
Google 官方号发的 Gemini Omni 数字分身创建教程,做虚拟角色和 AI 短剧的可以直接套用工作流,省掉自己摸索 prompt 的时间。
Runway 发布 Aleph 2.0 新功能:通过文字提示即可为视频生成黑白蒙版(matte),用于隔离主体与背景,实现合成、调色或特效的局部应用。操作流程为上传视频、输入提示词描述白色主体轮廓、预览并导出。该功能直接替代传统逐帧 rotoscoping 工作流,适用于后期合成与视觉特效场景。
Runway 把 AI 蒙版塞进 Aleph 2.0,后期抠像做合成不用手动逐帧了,做后期和视觉的直接上手试,省掉传统 rotoscoping 的功夫。
MiniMax 官方宣布其 M3 模型已上线 Vercel AI Gateway,这是 MiniMax 首个支持 1M token 长上下文和多模态输入的模型,本周提供 50% 折扣。开发者可通过 Vercel 平台直接调用 M3 API。
MiniMax M3 模型上线 Vercel AI Gateway,支持 1M token 长上下文和多模态输入,本周 5 折。做 AI 工具链集成的可以直接接 API 测一周,看长上下文对剧本/分镜生成的实际效果。
ChatGPT 官方宣布新增全屏编辑模式,支持编辑更长文章,并可将内容保存至个人资料库中随时继续。该功能直接提升 ChatGPT 作为写作工具的长文本处理能力,适用于剧本、分镜、项目文档等创作场景。
ChatGPT 终于给了个正经的写作空间,全屏编辑+保存到资料库,写长剧本、分镜、项目文档的可以省掉来回切文档的麻烦。
OpenRouter 的 Auto Router 新增 `cost_quality_tradeoff` 参数,范围 0-10。设为 0 时始终选最强模型(不限成本),设为 10 时始终选最便宜模型。该功能让自动化模型路由在质量和成本之间可调,适用于批量生成场景下的预算控制。
OpenRouter 给 Auto Router 加了个成本质量滑块,做短剧批量出片的制片和整合者可以调参数控预算,省得每次手动选模型。
以《非暴力沟通》为例,用Claude Opus 4.8(100万token上下文+结构化输出+多步Agent能力)将书籍转化为可调用AI技能。六步流程:文本准备→全局结构分析→五类提炼(框架/原则/技法/反模式/作者声音)→技能生成→自检。保留原书命名(OFNR四要素、长颈鹿语言),触发词优化为日常表达。耗时约45分钟,消耗约30万token,成本不到20元。
把一本书变成AI能调用的技能,45分钟30万token成本不到20块。做AI工作流整合的可以直接套这个六步流程跑一遍,省掉自己摸索prompt结构的时间。
创作者 @underwoodxie96 分享用 GPT Image 2.0 和 Kling 3.0 制作视频的实测体验,并对比 Seedance 2.0 和 Google Omni 在生成变换视频时的速度与自然度。他指出后两者速度更快,但部分镜头仍存在 AI 生成痕迹。
个人实测 GPT Image 2.0 + Kling 3.0 出片,顺带对比了 Seedance 2.0 和 Google Omni 的生成速度和自然度。做 AI 短片的可以看看他说的「有一两帧 AI 味」具体指什么,省自己踩坑。
Google AI for Developers 官方账号展示 Antigravity 中的并行子智能体功能,可对数百个营销资产自动分类和重命名,消除手动文件管理环节。该演示聚焦于 AI Agent 在文件整理场景的自动化能力。
Google 官方演示并行子智能体自动整理文件,做 AI 工作流编排的可以看看这个自动化思路,省掉手动管理素材的环节。
Runway 官博发布客户案例,创意总监 Sasha Kasiuha 分享为 Sonos 和 Maison Margiela 制作 AI 广告 campaign 的过程,涉及品牌视觉一致性、AI 辅助创意提案和商业项目落地流程。
Runway 官博的客户案例,讲创意总监如何用 AI 做奢侈品牌广告。做品牌视觉和商业短片的可以点开看甲方怎么用 AI 过审和提效。