Higgsfield AI 发布 Adobe Premiere Pro 和 After Effects 插件,支持在剪辑软件内直接生成图片、视频和转场,拖入时间线即可使用。功能包括:无裁切重构图、移除视频背景、在画面上绘制选区进行局部编辑、导出时一键升格至 4K。
AI 生成直接拖进 Pr/AE 时间线,不用切窗口。后期和剪辑师可以装起来用,省掉来回导素材的功夫。
为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达
Higgsfield AI 发布 Adobe Premiere Pro 和 After Effects 插件,支持在剪辑软件内直接生成图片、视频和转场,拖入时间线即可使用。功能包括:无裁切重构图、移除视频背景、在画面上绘制选区进行局部编辑、导出时一键升格至 4K。
AI 生成直接拖进 Pr/AE 时间线,不用切窗口。后期和剪辑师可以装起来用,省掉来回导素材的功夫。
Recraft 发布 V4.1 模型,专攻真实感产品 mockup 和广告场景图生成。支持包装、标牌、服装、卡片、杯子、手提袋、贴纸、街头广告等品类,生成效果具备自然光照、可信材质、电影感构图和微小瑕疵细节,可直接用于 campaign-ready 场景。
Recraft V4.1 专攻真实感产品场景图,包装、广告牌、服装、杯子等都能直接生成,光影和材质细节到位。做视觉/美术的可以直接当 mockup 工具用,省掉后期合成和打光环节。
Runway 发布 MCP(Model Context Protocol)接口,将 Gen-4.5、Seedance 2.0、GPT Images 2.0、Kling 等图像/视频生成模型打包,可直接接入 Claude、ChatGPT、Cursor、Replit 等 AI 编程与对话工具。用户无需离开当前工作环境即可调用 Runway 模型生成图片和视频,实现从创意到成片的一站式工作流。
Runway 把自家模型和第三方模型打包成 MCP 协议,直接插进 Claude、ChatGPT、Cursor 这些 AI 编程/对话工具里。做 AI 短剧和视觉的,可以边写 prompt 边出图出片,不用来回切窗口了。
Google 发布 AI 图像生成与编辑工具 Google Pics,基于最新 Nano Banana 模型。核心能力是将画面中每个元素视为独立对象而非静态平面,用户可用日常语言指令移动、替换或编辑画面中的具体细节,操作方式类似拖拽式编辑。
Google 出了个新 AI 图像工具,每个元素都是独立对象,用日常语言就能拖拽替换细节。做视觉和美术的可以装起来当快速出图/改图工具用。
ElevenLabs 宣布斯坦·李(Stan Lee)官方授权 AI 语音正式上线 Iconic Marketplace 和 ElevenReader 应用。该语音基于斯坦·李的专业录音素材训练,还原其标志性的语调和幽默感,可用于有声书、配音、AI 短剧等场景。
斯坦·李的官方授权 AI 语音上线 ElevenLabs,配音和后期团队可以直接拿来当角色声库用,做漫威同人或超级英雄题材短剧的尤其合适。
Anthropic 旗下 Claude Code 官方账号发布更新公告,称近期重点提升了工具的响应速度和可靠性,但推文正文仅含标题和链接。
Claude Code 官方发了一波响应速度和稳定性的更新,做 AI 编程和 Agent 工作流编排的可以点进去看具体改了啥,实测一下对日常写代码的体验提升有多大。
Krea AI 宣布本周内为 Pro、Max、Business 订阅计划用户提供 Seedance 2 无限量生成额度,不限制生成次数。Seedance 2 是即梦(Dreamina)的视频生成模型,以角色一致性和镜头语言见长,Krea 此前已集成该模型。
Krea 本周给 Pro/Max/Business 用户开了 Seedance 2 无限量生成,做短剧和视觉的可以趁这周猛跑素材,测角色一致性和镜头稳定性。
Krea 最新图像生成模型已集成至 Hermes Agent,用户可通过 API 直接调用。该模型为 Krea 自研,具体能力参数(分辨率、风格控制、生成速度等)未在推文中公开。对 AI 视觉师和技术整合者来说,这意味着多了一个可直接通过 API 调用的图像生成选项,适合接入现有工作流进行实测对比。
Krea 最新图像生成模型已接入 Hermes Agent,做 AI 视觉和工具链整合的可以直接调 API 试出图效果和风格控制能力。
OpenAI 宣布 ChatGPT、Codex 和 Responses API 支持私有 MCP 服务器安全连接,团队可将 MCP 服务器保留在内部网络中,通过仅出站 HTTPS 与 OpenAI 产品通信,无需暴露公网端口。该更新面向企业级 AI 工具链集成场景,降低数据安全风险,适用于需要将内部数据库、代码库或业务系统接入 AI 工作流的团队。
OpenAI 给 ChatGPT、Codex 和 API 加了私有 MCP 服务器安全连接,做 AI 工具链整合和自动化工作流的可以直接把内部数据源安全接进来,不用暴露公网。
Midjourney 对话模式更新:文本和语音输入改进,语音会话启动时可访问用户的图像提示、风格参考、侧边栏设置和最近任务;图像提示功能现可直接从托盘和侧边栏使用;语音提交过程中托盘图像保持不变直至手动移除。
Midjourney 对话模式小更新,语音输入时能直接调图像提示和风格参考,做视觉开发的可以省掉来回切菜单的功夫。
微软宣布 Copilot Notebooks 将升级为项目中心,未来一个月内陆续上线:支持更多上下文来源(文件、网页、会议记录等),并可在笔记本内直接执行操作(如生成文档、发送邮件、更新任务)。目前信息较模糊,无具体功能列表或上线日期。
微软 Copilot 笔记本功能升级,下月将支持更多上下文来源和操作能力。做 AI 工作流整合的可以关注,看能不能当轻量级项目协作工具用。
Topaz Labs Photo 推出新版本更新,核心功能 Face Recovery 3 在面部修复质量上有明显提升,适用于老照片修复、低清素材面部增强等后期场景。该推文为个人实测体验分享。
Topaz Labs Photo 更新了 Face Recovery 3,做后期修复和视觉精修的可以装起来试,老照片和低清素材修复效果有提升。
Google DeepMind 发布 Gemini Embedding 2 白皮书,这是一款原生多模态嵌入模型,能同时处理文本、图像、音频和视频,生成统一语义向量。相比前代,在跨模态检索和零样本分类任务上有提升,适用于素材库管理、视觉搜索、内容标签化等场景。论文已公开,具体技术细节和 benchmark 数据需查看原文。
Google DeepMind 发了 Gemini Embedding 2 的白皮书,原生多模态嵌入模型,做 AI 视觉搜索和素材标签化的技术整合者可以翻翻论文看能力边界。
Sky Computing Lab 开源 FastVideo Dreamverse,基于单张 NVIDIA B200 GPU 和 LTX-2 模型,7 秒即可生成 30 秒 1080p 视频,实现实时视频生成的氛围引导工具。已开源 GitHub 仓库和博客文档,支持开发者本地部署和二次开发。
单卡 B200 7 秒出 30 秒 1080p 视频,做短剧和批量视觉生成的可以直接拉 repo 跑工作流,看实时出片稳不稳。
歸藏发布 guizang-social-card-skill,一款针对小红书图文排版的 AI Skill,亮点是集成地图组件,输入目的地和线路后 AI 自动在底图上标记并嵌入图片。该 Skill 完全基于 HTML 和实拍图片生成内容,不会被平台标注为 AI 生成,并会主动从高质量图片网站寻找对应主题图片优化排版。
小红书图文排版专用 AI Skill,自动配图+地图组件,做视觉和社媒内容的可以直接套用模板,省掉手动排版时间。
Black Forest Labs 官方发布 FLUX MCP 使用教程,由 @stephenbtl 讲解快速安装和示例。FLUX MCP 能根据用户请求自动判断使用 FLUX 系列中的哪个模型(如快速探索用 Klein,精细出图用 Pro),无需用户手动指定模型参数或精通提示词工程。
FLUX 官方出的 MCP 教程,不用记模型参数,工具会自动选 Klein 还是 Pro。做视觉和整合工作流的可以直接套用 setup 步骤,省掉手动切换模型的功夫。
ComfyUI 官方账号推荐了 7 个 LTX 2.3 的 LoRA 模型,强调开源社区微调后能实现闭源模型无法提供的画面控制能力,可提升 AI 生成视频的成片质量。
LTX 2.3 的 LoRA 社区已经跑出不少实用模型,做 AI 视频的视觉师和后期可以直接装来用,省掉自己微调的时间。
ComfyUI 官方账号对比 Nano Banana Pro 与 GPT Image 2 两款图像生成模型。Nano Banana Pro 在照片级写实、4K 分辨率输出、14 张参考图槽位(用于产品/场景一致性)以及实时网络搜索(保证真实世界准确性)上胜出。GPT Image 2 则在文字渲染(约 99% 准确率)和空间逻辑上更强,适合品牌和广告场景。
视觉师和美术总设直接看对比:Nano Banana Pro 在写实度、4K 输出和 14 张参考图一致性上占优,GPT Image 2 文字渲染和空间逻辑更强。选工具前先拉一遍对比图。
ComfyUI 官方发布 GrooveJonesXR 的深度案例研究,内容聚焦如何基于 ComfyUI 构建企业级、可扩展的 AI 管线(pipeline),涉及工作流编排、规模化部署和实际业务落地经验。
ComfyUI 官方发布的客户案例,讲 GrooveJonesXR 如何用 ComfyUI 搭企业级可扩展 AI 管线。做技术整合和制片流程自动化的可以点开看具体架构和落地细节。
Lovart AI 发布新功能演示:用单句文本指令编辑视频,同时保持角色外观一致性。该推文仅含标题和链接。
一句话改视频+角色一致性保持,做短剧和视觉的可以点开看具体怎么操作。
创作者 @maxescu 分享用 Arcads 和 Claude 在 1 小时 34 分钟内完成从零到完整品牌书(brand book)并产出 4 条 TV 广告的全流程。推文附链接,公开具体工作流和提示词。
1 小时 34 分钟从零到完整品牌书加 4 条 TV 广告,做短剧和 AI 制片的可以直接套工作流跑一遍,看自己团队能压到多快。
创作者分享了一条 3D 动画场景的制作流程:先用 GPT Image 2 在 Leonardo 中生成完整分镜板(含角色、镜头、运镜、节奏和视觉方向),再用 Seedance 2.0 完成动画。推文附有完整 prompt。
从分镜到成片全在 Leonardo 里跑通,GPT Image 2 出分镜板,Seedance 2.0 做动画。做 AI 短剧和视觉开发的可以直接套这个工作流试一轮。
B 站 UP 主发布 AI 短片《大黄AI(红墙4.0)》,林正英僵尸题材,主打唯美视觉风格。出图使用 Banana pro 模型,视频生成使用 VEO 模型。
林正英僵尸题材的唯美风 AI 短片,视觉师和编导可以拉片看风格混搭和角色一致性处理。
小红书 UP 主「橙以零AI」发布 AI 短片《丧尸清道夫》的复刻版,使用 Agent 工作流完成。短片为丧尸题材动作叙事,展示了 Agent 在分镜生成、画面调度和剪辑串联上的自动化能力。
用 Agent 工作流复刻 AI 短片,做短剧和编导的可以拉片看叙事节奏和 Agent 调度逻辑。
日本 AI 创作者 KEETY 发布一条用 Seedance 制作的无人机航拍风格短片片段,内容为简单的无人机拍摄场景,时长较短,属于个人创作分享。
个人创作者用 Seedance 做的无人机视角短片片段,视觉师可当风格参考,但信息量有限,不用专门点开。
B 站 AI 短剧《光脚办公日记》第四集上线,剧情推进至林浩动歪心思、王曼妮安排出差,延续职场情感线。
AI 短剧系列第四集,剧情进入职场冲突和出差线,做 AI 短剧的可以拉片看系列叙事节奏和角色一致性保持。
B 站 UP 主「油墨香车」发布 AI 短片《破冰船完整流程沉浸式第一视角体验》,以第一人称视角呈现 AI 军团作战场景,主打沉浸式体验和视觉冲击力。但题材和视角选择对 AI 短剧叙事有参考价值。
AI 短片新作,沉浸式第一视角+AI 军团题材,做 AI 短剧和视觉的可以拉片看镜头调度和角色一致性处理。
B 站 UP 主发布 AI 修仙短剧《小明修仙传》第五集,该集侧重推进主线剧情,制作难度较前几集有所提升。属于个人创作者持续更新的 AI 短剧系列作品。
AI 修仙短剧系列第五集,做 AI 短剧的可以拉片看剧情推进和角色一致性处理,尤其是多集连载的叙事连贯性怎么保持。
B 站 UP 主「星海大明锦衣卫AIGC」发布 AI 短片《大明14444:别看狐狸了!青梅带你课后补习》,明末历史题材混搭校园日常,主打 AI 角色一致性和叙事节奏。
AI 短剧新作,明末题材加校园元素,做短剧的可以拉片看角色一致性和叙事节奏处理。