Vidu AI 发布 S1 实时交互模型,核心能力是语音驱动的角色实时行为生成,超越传统唇形同步,角色可理解、反应并自然回应。该模型面向实时交互视频场景,适用于 AI 短剧、虚拟角色对话、直播互动等需要低延迟角色反馈的创作场景。
Vidu 官宣实时交互模型 S1,语音驱动角色实时行为生成,做 AI 短剧和虚拟角色对话的可以直接接 API 测交互延迟和自然度。
Vidu AI 发布 S1 实时交互模型,核心能力是语音驱动的角色实时行为生成,超越传统唇形同步,角色可理解、反应并自然回应。该模型面向实时交互视频场景,适用于 AI 短剧、虚拟角色对话、直播互动等需要低延迟角色反馈的创作场景。
Vidu 官宣实时交互模型 S1,语音驱动角色实时行为生成,做 AI 短剧和虚拟角色对话的可以直接接 API 测交互延迟和自然度。
Google DeepMind 与独立电影公司 A24 宣布首次研究合作,这是顶级 AI 研究机构与头部独立电影厂牌的直接联手,信号意义大于实质信息。
Google DeepMind 和 A24 搞了个研究合作,具体做什么还没说,但 A24 的审美底子加上 DeepMind 的技术,做 AI 叙事和短剧的可以蹲后续看能产出什么新玩法。
Browser Use 发布 CLI 3.0 版本,核心升级包括体积缩小 6 倍、token 消耗更低。该工具可作为 skill 集成到 Claude Code 和 Codex 中,使这些 AI 编程助手获得操控浏览器的能力,适用于自动化网页操作、数据抓取、测试等场景。
Browser Use CLI 3.0 体积缩小 6 倍、token 消耗更低,还能作为 skill 装进 Claude Code 和 Codex 里。搞 AI 工作流编排和自动化管线的技术整合者可以直接装起来跑一遍,看浏览器操控能力对创作流程的自动化有多大帮助。
Skywork 推出 Skywork Design 功能,在画布内直接生成 UI 并一键转为可点击原型,无需切换工具或跳转其他站点,所有操作在同一工作流中完成。
Skywork 把 UI 生成和可点击原型合到一个画布里,做 AI 工具界面或交互原型的设计师可以装起来用,省掉切 Figma 的步骤。
阿里万相视频上线「Music to Dance」功能:上传角色图、选一首歌,即可自动生成与音乐节奏同步的舞蹈视频。支持街舞、踢踏、拉丁、K-Pop、中国古典五种舞种风格。从节拍到动作,角色自动表演,无需手动逐帧对齐。
上传角色+选歌就能自动生成卡点舞蹈视频,五种舞种可选,做短剧角色 MV 或虚拟偶像的可以直接套用,省掉手动 K 帧和对节奏的功夫。
PixVerse 为支持的模板新增四项编辑能力:更换服装、添加物体、引入另一人物、切换背景。用户只需提供主体图像、可选参考图像和简短提示词即可完成操作,无需复杂参数调整。该更新降低了模板化角色/场景定制的门槛,适用于短剧角色换装、场景变体、多角色同框等批量生产场景。
PixVerse 模板功能加了换装、加物、加人、换背景四个操作点,做短剧和角色 IP 的可以直接套模板批量出图,省掉逐帧重绘的功夫。
PixVerse 官方宣布 Skyline Orbit Flag 模板上线,推文附链接。
PixVerse 上线了一个 Skyline Orbit 旗帜模板,做 AI 视觉和短剧的可以点开看看具体效果,适合当风格参考或素材模板用。
Promptsref 平台新增对 nano banana lite 模型的支持,图像生成起价每张 0.03 美元,适合低成本快速测试 prompt 和迭代。
Promptsref 接入了 nano banana lite 模型,出图成本降到 3 分钱一张,做视觉测试和批量出图的可以当低成本 prompt 实验场用。
葡萄牙国家队2026世界杯出征视频采用“实拍+AI”混合制作,C罗实拍参演,可灵AI(可灵3.0)用于生成海上风浪、船舱内、跨洋场景等关键画面。海外播放量超7000万,AI导演João Seiça表示可灵AI质感自然,让影片在预算可控下实现宏大视觉隐喻,且实拍与AI生成画面融合统一。他强调技术服务于故事,人是内容的灵魂。
C罗实拍+可灵AI做国家队出征片,做AI短剧和商业项目的可以拉片看实拍与AI画面怎么无缝混剪,以及预算有限时怎么用AI撑大场面。
卡兹克用 Claude Fable 5 自主优化 AIHOT 网站 SEO/GEO。模型自主启动 22 个 Agent 调研 40 分钟,发现豆包 App 每天六千多次访问未被统计等异常。规划境外加速时,否定 Claude Opus 4.8 的 Cloudflare 方案(无法国内直连/国外分流,且 2025 年起默认拦截 AI 爬虫),改用火山引擎 CDN。模型自行找到工单入口提交专业工单,22 分钟开通;发现工程师漏答回源 IP 网段问题,礼貌追问并补充备选方案;发现官方方案有安全漏洞,自行加暗号验证。23:30 切换域名解析,10 分钟后 616 个海外请求走新线路。最终生成运维文档,提醒边缘证书 10 月 2 日到期并附续期步骤。
卡兹克用 Claude Fable 5 自主跑完 SEO 优化全流程,从调研到工单到上线只用了半天。做 AI 短剧和工具链整合的可以当 Agent 工作流模板看,尤其是模型自己找工单入口、补漏、加安全验证的环节,直接复用到自己的自动化流程里。
pxpipe 是一个本地代理,将 Claude Code 请求中的系统提示、工具文档和历史记录等密集文本渲染为 PNG 图像,利用图像 token 成本取决于像素尺寸而非文本密度的特性压缩输入 token。在 Fable 5 模型上,约 25k 文本 token 压缩为约 2.7k 图像 token,端到端账单降低 59-70%。SWE-bench Lite 10 个实例全部通过,成本从 $54 降至 $27。该方法有损(精确 ID 等需保持文本),默认仅处理 `claude-fable-5` 请求。
做 AI 短剧批量生产的团队,如果 Claude Code 账单吃紧,这个本地代理能省 60-70% 的 token 成本,技术整合者可以直接部署跑一周看实际节省。
claude-real-video 是一个开源 Python 工具,通过场景变化检测提取关键帧、滑动窗口去重并转录音频,生成干净的本地文件夹供任何 LLM 读取。支持 YouTube 链接或本地文件,依赖 ffmpeg 和 Whisper,全部处理在本地完成,不上传云端。相比固定 1fps 采样(58 秒视频 58 帧),该工具只保留实际有变化的帧(26 帧),并用 `--grid` 打包成 3 张联系表,大幅减少 token 消耗。
开源工具,让 LLM 基于视频画面而非字幕理解内容,做后期和 AI 工作流整合的可以装起来用,省 token 还能抓关键帧。
AI 虚拟偶像 YURI 发布阿根廷世界杯应援曲《AMAZING!》,获阿根廷足协形象授权及华为支持,合作方包括梅西。这是 YURI 目前合作过的最高级别明星 IP,展示了 AI 虚拟角色与顶级体育/商业品牌联动的可行性。
AI 虚拟偶像 YURI 拿到阿根廷足协和梅西的官方授权做应援曲,做 AI 短剧和虚拟 IP 的可以看看这种「官方授权+明星联动」的落地路径,商业合作样本。
小红书作者「西西弗驴子」的 AI 短片,主题为电影角色意识到镜头存在,属于打破第四面墙的叙事创意。个人创作者作品。
小红书作者「西西弗驴子」的 AI 短片,题材是角色打破第四面墙,做 AI 短剧的可以拉片看叙事创意和镜头设计。