← 全部日报AIGC 信息日报Daily Digest
2026-05-16 · 周六
16 条 · 4 板块
Daily Digest

2026-05-16

为影视导演 / 编导 / AIGC 创作者精选 — 每天 8 点准时送达

行业与平台动向

Industry

OpenAI 周五对内宣布组织调整,联合创始人 Greg Brockman 接管产品战略,ChatGPT、编程智能体 Codex 和 API 业务整合进同一核心产品团队,目标是将 ChatGPT 与 Codex 合并为统一体验。对 AIGC 技术整合者来说,这意味着未来 AI 编程能力可能直接嵌入对话界面,工作流编排和 Agent 工具链的接口形态将随之变化。

OpenAI 把 ChatGPT 和 Codex 合并成一个产品团队,做 AI 编程和 Agent 工作流的可以直接关注后续 API 和工具链变化。

开发者 Haichao 发布开源工具 Starry Slides,专为 AI Agent 时代设计,以 HTML 为源文件,支持所见即所得编辑器直接修改,无内置模板,设计完全由输入上下文定义。解决了 AI 生成幻灯片常产生锁定格式(不可编辑)的问题。对 AIGC 技术整合者来说,这是一个可嵌入工作流的轻量级演示输出方案,适合需要批量生成可编辑演示文档的场景。

开源 HTML 幻灯片工具,AI 生成结果可直接编辑,做 AI 工作流编排和工具链集成的可以装起来用,省掉手动调格式的环节。

商汤 SenseNova U1 开源多模态模型发布,支持单 prompt 生成完整三格漫画(线稿、灰度、分镜、跨格风格一致性),推理与绘图在同一空间完成,无需外部管线拼接。对漫画/分镜/视觉开发团队来说,这是目前少有的端到端漫画生成方案,开源可自部署,适合测试角色一致性和叙事连贯性。

一条 prompt 出完整三格漫画,线稿、灰度、分镜、跨格风格一致性全包,做漫画/分镜/视觉开发的可以直接跑开源模型试效果。

MoveAI 宣布其旗舰产品 GENESIS 已于上月上线,这是一套无标记动作捕捉系统,完全本地运行于 Nvidia GPU,无需动捕服或外部标记点,结合多项创新技术实现高精度捕捉。对 AI 动画师、虚拟角色创作者和后期团队来说,这套系统可大幅降低动捕门槛和成本,适合角色动画、虚拟人驱动等场景,但具体精度数据和价格尚未公开。

无标记动捕系统,本地跑在 Nvidia GPU 上,做 AI 动画和虚拟角色的可以看看精度和延迟表现。

Image-blaster 是一款新工具,能从单张图片自动生成 3D 环境、特效(SFX)和网格模型,在 Hacker News 上获得 116 分热度。该工具面向 3D 场景快速搭建和视觉特效生成场景,可大幅缩短从概念图到 3D 资产的制作周期。对 AI 视觉师、后期特效师和技术整合者来说,这是一个值得实测的资产生成管线,尤其适合需要快速产出 3D 背景或特效素材的短剧和 MV 项目。

一张图生成 3D 场景、特效和网格,做视觉开发和后期的可以装起来跑一遍,省掉手动建模和找素材的时间。

工具与能力更新

Tools

ComfyUI 原生集成三个新开源模型:Google DeepMind 的 Gemma 4 多模态大模型(支持文本、图像、音频、视频输入,内置逐步推理模式),Netflix 的 VOID 视频物体移除模型(可擦除阴影和反射),以及第三个未具名模型。用户可直接在 ComfyUI 节点内调用,无需额外安装或配置。

ComfyUI 原生接入三个新模型,后期和视觉师可以直接在节点里跑视频物体移除和阴影擦除,不用切工具。

HeyGen 正式集成至 Canva,用户无需离开 Canva 编辑界面即可直接添加 AI 数字人(AI avatars)到演示文稿、培训文档、社交媒体帖子和营销素材中,实现静态内容向视频化内容的直接转化。该集成面向 Canva 的 1.9 亿月活用户开放,降低了 AI 数字人视频的制作门槛。

HeyGen 官方集成进 Canva,做营销物料和培训视频的团队可以直接在画布里加 AI 数字人,不用切工具,省掉后期合成环节。

Leonardo 推出 Pro Upscaler,专为 AI 生成图像设计的放大与精修工具,支持在平台内直接完成放大、细节优化并进入生产流程,无需切换外部软件。该工具面向 AI 图像后期处理场景,提升从生成到交付的效率。

Leonardo 出了个专为 AI 图设计的放大工具,后期和视觉师可以直接在平台内放大精修,不用切软件了。

Pika Labs 推出 Pika MCP 功能,内置 /baseball-trend 和 /kiss-cam 两个热门模板技能,用户可直接调用生成对应风格的 AI 视频。该功能降低了模板化视频的制作门槛,适合快速产出社交传播向的短片内容。

Pika 把热门模板做成 MCP 技能,做短剧和视觉创意的可以直接套用 baseball-trend 和 kiss-cam 两个模板出片,省掉自己调参的时间。

Recraft 官方宣布 V4.1 版本已上线 Design Arena 平台,可在线体验。该版本为图像生成模型的迭代更新,具体改进点(如风格一致性、分辨率、细节质量等)未在推文中说明,需进入 Design Arena 实测对比。

Recraft V4.1 上线 Design Arena,做视觉和美术的可以点进去看看出图质感有没有变化。

方法与经验

Methods

FLORAai 发布 Character Lock Technique,一种角色一致性技术方案,支持同一角色在六个不同角度下保持外观一致,可接入广告、故事板、视频、产品图等场景。该方案通过特定工作流实现,而非单一模型,适合需要批量生成角色多角度素材的创作流程。

FLORAai 公开了角色一致性技术方案,能跨六个角度锁定同一角色,做短剧和视觉开发的可以直接套用工作流跑一遍。

FLORAai 官方账号分享了一个角色一致性生成技巧:输入动态镜头素材和角色静态图,输出时能保持角色外观统一。推文附有具体技术链接,未公开详细参数或模型信息。对视觉师和短剧团队来说,这是一个可参考的角色一致性工作流方向,适合点开链接看具体实现方式。

FLORAai 分享了一个角色一致性技巧:输入动态镜头和角色静态图,输出保持统一。做角色 IP 和短剧的可以点开链接看具体工作流。

作品 / 案例

Works

B站UP主「增殖的发呆」发布AI短片《无能的郝哥》,播放量超672万,是近期AI视频社区的高热度作品。该片在AI角色一致性、镜头语言连贯性和叙事节奏上均有可拆解之处,适合AI短剧团队和编导作为长叙事案例参考。

B站近700万播放的AI短片,做AI短剧和编导的可以拉片看叙事节奏和角色一致性怎么撑起长内容。

Luma Labs 官方发布 Spotlight 系列新作《Origami》,由创作者 Misho 使用 Luma 工具链制作,呈现两只鸟与一把剑的对峙场景,风格冷峻,动作感强。作品展示了 Luma 在角色动态和镜头语言上的表现力,未公开具体工作流细节。

Luma 官方 spotlight 系列新作,动作场面和角色对峙的视觉风格值得拉片,做 AI 短片和视觉开发的可以看看镜头调度怎么用单工具链出效果。

DreamLabLA 发布 Frog Game 开发日志第三期,展示将 LumaLabs AI 生成的青蛙概念图转化为可动画游戏角色的完整流程,涉及概念设计到角色绑定与动画的管线衔接。

LumaLabs 官方转发的游戏开发日志,展示从 AI 生成概念图到可动角色的完整流程,做角色视觉和 3D 资产管线的可以拉片看工作流衔接。

创作者@MayorKingAI 用Leonardo的GPT Image 2生成3x2故事板,Seedance 2.0动画化镜头,Suno配乐,CapCut剪辑,完成30秒阿波罗vs阿瑞斯战斗短片。工作流覆盖分镜→动画→配乐→剪辑全链路,prompt已公开。

30秒神话战斗短片,从分镜到成片全流程公开,做AI短片的可以拉片看Seedance 2.0的动作连贯性和镜头调度。