Google DeepMind 在 Gemini 3.5 Flash 模型中新增「computer use」能力,模型可直接操控电脑界面(点击、输入、导航),无需额外工具或脚本。该功能已开放 API 调用,适用于自动化工作流、数据录入、网页操作等场景。
Google 把电脑操控能力塞进 Gemini 3.5 Flash,做 AI 自动化工作流的可以直接接 API 测一周,看它能不能帮你跑通素材批量处理或发布流程。
为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达
Google DeepMind 在 Gemini 3.5 Flash 模型中新增「computer use」能力,模型可直接操控电脑界面(点击、输入、导航),无需额外工具或脚本。该功能已开放 API 调用,适用于自动化工作流、数据录入、网页操作等场景。
Google 把电脑操控能力塞进 Gemini 3.5 Flash,做 AI 自动化工作流的可以直接接 API 测一周,看它能不能帮你跑通素材批量处理或发布流程。
OpenAI 发布 GPT-5.5 Instant 新版本,这是其使用率最高的模型。新版本提升了理解用户提问意图并自适应调整回复的能力,同时更可靠地处理复杂约束条件,并优化了购物等场景的交互体验。
GPT-5.5 Instant 升级了意图理解和复杂约束处理,做 AI 配音和对话脚本的可以直接接 API 测一周,看对话自然度提升多少。
Dreamina 推出 Octo AI Agent,支持通过自然语言对话生成不限长度的 AI 影片。所有画面元素均可编辑,生成前可预览视频效果,大幅降低 AI 长片制作门槛。
Dreamina 的 Octo AI Agent 能直接对话生成无限长度影片,且每帧可编辑、生成前可预览。做 AI 短剧和长片的可以直接上手跑一遍,看工作流能省多少步。
HeyGen 推出 Look Packs 功能,基于新图像引擎,用户创建数字分身后可一键生成多套统一风格形象(妆容、造型、场景),解决 AI 生成中面部不一致问题。首套免费,适用于虚拟角色、短剧角色 IP、品牌代言人形象等场景。
HeyGen 出了 Look Packs 功能,一键生成多套统一风格形象,做数字分身和角色 IP 的可以直接上手试,省掉反复调脸的时间。
ComfyUI 上线 HappyHorse 1.1 官方节点,支持原生音频输出、多角色一致性、电影级构图,一次渲染完成。1.1 版本新增动态表情(更流畅动作)、增强 R2V 功能(最多 9 张参考图)。
ComfyUI 原生节点,一次渲染搞定音频、多角色一致性和电影级构图,做短剧和视觉开发的可以直接装起来跑工作流。
Pika Labs 官方宣布,Seedance 2.0 的 4K 原生输出能力已通过 Pika MCP(Model Context Protocol)开放。创作者可在支持 MCP 的工具链中直接调用 Pika 的 4K 视频生成,无需切换平台。
Pika 把 Seedance 2.0 的 4K 原生输出塞进了 MCP 协议,做短剧和视觉的可以直接在 ComfyUI 生态里调 4K 出片,不用切工具链。
Runway 上线广告本地化功能:上传一张广告图,一键生成适配不同语言市场的版本,无需手动替换文案或重拍素材。面向品牌广告、出海投放、多市场宣发场景,降低本地化制作成本。
Runway 把广告本地化做成了一键操作,做品牌广告和出海投放的制片可以直接省掉多语言重拍和后期替换的环节。
FLORA 发布 Layer Editor 2.0,新增功能包括:上传自定义品牌字体、专业字距(kerning)控制、字母间距/追踪/行高调节、精确边距设置。用户无需离开 FLORA 即可完成专业级图层排版,适用于 AI 视觉创作中的文字排版和海报设计场景。
FLORA 的图层编辑器升到 2.0,加上了字体上传、字距行距和精确边距控制。做 AI 视觉和海报的可以直接在工具里完成专业排版,不用切到 Figma 或 PS 了。
Ostris 为 Krea AI 的 Krea2 Turbo 模型开发了一个训练适配器,允许用户直接在 Turbo 模型上训练 LoRA,无需先转换或导出到其他工具。这意味着角色和风格定制的工作流可以更短、更直接,对需要高频迭代视觉风格的 AI 短剧和美术团队是实打实的效率提升。
Krea 2 Turbo 终于能直接训练 LoRA 了,做角色一致性和风格定制的视觉师可以装起来用,省掉外部训练再导入的步骤。
Manus AI 为其构建的 Web 应用新增托管模式选择:Autoscale 模式适合日常网站,空闲时自动休眠不收费;Reserved 模式保持 24/7 在线,适用于直播、Webcam、机器人等实时应用。
Manus 给 AI 应用加了托管模式,做短剧分发站或实时互动应用的可以看看,省服务器钱。
LumaLabs 上线 Connectors 功能,支持将 Airtable、Dropbox、Google Drive 等外部工具直接接入 Luma 工作区,用户可在任意 board 中按需拉取文件,无需手动上传或切换平台。
Luma 把 Airtable、Dropbox、Google Drive 直接接进工作流,做 AI 短剧和批量项目的可以省掉来回导素材的功夫,制片和整合岗直接上手试。
开发者 Blendi Byl 将 fal 的 AI 视频生成能力集成到 Roblox Studio 中,支持 text/image → video(Seedance 2.0、LTX 2.3 Fast)以及 text/image → 3D 的实时生成,生成内容可直接在游戏引擎内播放。
把视频生成模型直接塞进 Roblox 引擎,做游戏内实时 AI 影像的可以关注这个集成方向。
ComfyUI 官方账号转发 Krea 2 技术论文和模型权重下载链接。Krea 2 是图像生成模型,论文公开了架构细节,权重可下载用于本地部署和二次开发。
Krea 2 的技术论文和模型权重都开放了,做视觉风格和图像生成的可以直接下载跑一遍,看看效果和可控性。
ElevenLabs 官方发布与 FOX Sports 的合作案例。
ElevenLabs 和 FOX Sports 的合作案例,做 AI 配音和体育内容制片的可以点开看看怎么落地的。
HeyGen 官方推文分享其内部团队使用 HyperFrames 的工作流,内容为官方视角的方法论分享。
HeyGen 官方分享内部用 HyperFrames 的工作流,做 AI 视觉和短剧的可以点开看看他们怎么搭角色和场景的框架。
AI 短片《Beyond the Loop》在翠贝卡电影节首映,由 Wonder Studios 制作,CapCut 赞助,InVideo、OpenArt、ElevenLabs 等担任执行制片。影片为 AI 生成影像作品。
AI 短片在翠贝卡电影节首映,做 AI 短剧和长片的可以拉片看电影节级别的叙事和视觉处理。
LumaLabs 官方发布导演 Eran May-Raz 的粘土动画短片《Zozo》,用 Luma 制作,题材为家庭日常小场景,主打 AI 生成定格动画质感。
Luma 官方发的粘土动画短片,视觉师和编导可以拉片看 AI 做定格动画质感的可能性。
LumaLabsAI 官方推文展示创作者 @NinaSabinaAI 用 Luma 制作的 AI 短片《Dante's Inferno》,改编自但丁《神曲·地狱篇》,逐帧重建这一经典叙事。短片定位为文学改编 AI 影像作品,视觉风格偏向经典史诗氛围。
Luma 官号推的 AI 短片,但丁《神曲·地狱篇》改编,视觉师和编导可以拉片看 AI 如何呈现经典文学场景的镜头语言和氛围。
PixVerse 官方发起「Originals S1」系列,首支作品为 Caroline Kiessling 用 PixVerse 独立制作的视觉诗短片,官方称每帧经反复打磨至情绪到位。该片为 PixVerse 生态内的创作者扶持案例,展示单一工具链完成叙事短片的可能性。
PixVerse 官方扶持的视觉诗短片,视觉师和编导可以拉片看单工具链下的镜头质感和情绪控制。
LetzAI 官方账号发布 AI 短片《THOLIN》,由 @karim_yourself 和 @directorquach 联合创作,使用 LetzAI 平台制作。短片为 AI 生成影像作品。
LetzAI 平台上的 AI 短片新作,视觉师和编导可以拉片看风格一致性处理,短剧团队可参考其角色视觉统一度。
B 站 UP 主发布的 AI 短片,使用 Seedance 2.0 生成后经 AI 超分至 2K 分辨率。题材为魔幻战斗,涉及角色与怪物对战。
B 站个人创作者的 Seedance 2.0 短片,2K 画质,做 AI 短剧的可以拉片看角色一致性和超分后的画面质感。
B站作者「OpenAI梦基地」发布的AI短片《我的AI女友》,标题标注制作周期4天,个人创作者作品,题材为AI虚拟伴侣方向。
B站个人创作者用4天做的AI短片,题材是AI女友,做短剧的可以点开看看当风格参考。