LPM 1.0

12小时前更新 0 0

米哈游推出的Video-based Character Performance Model

所在地:
美国
收录时间:
2026-04-26
广告也精彩
正文上方广告位
78fb64d174cde2f72aee7c486b1d8816

LPM 1.0 生成实时视频,支持全双工对话、身份一致性的无限长度生成,以及细腻的人机化表现。

LPM将图像转化为表演视频,作为对话代理、直播角色和游戏NPC的视觉引擎。

37f3df6a53cd6602caa1caafde95ee36

这是全球首个真正破解表演三难困境的AI模型,实现了高表现力实时推理、长期身份稳定三者同时突破。一张照片就能让他开口说话——侧耳倾听、眉头微皱,而且永远不会停**。GB参数former**延迟仅1.35秒,支持无限时长流式生成。它不只是让嘴巴动起来,而是让角色真正说话时唇形精准,肢体有节奏:聆听时点头,眼神忧郁,微表情自然流露。

在线 LPM 实时对话演示

视频对话模式可即插即用,兼容ChatGPT和Doubao等音频对音频(A2A)模型生成角色视频。主要有三种对话状态: (1) [收听] 接收用户音频后,LPM会实时生成具有字符适用的听觉行为和表情的流媒体视频,取代预设动画;同时,同一音频被转发到A2A模型进行处理; (2) [说话] A2A模型返回响应音频,LPM将其作为驱动信号,生成角色的说话表现; (3) [静默] 在用户和A2A音频均缺失的情况下,LPM继续基于文本条件实时生成视频,呈现自然的对话闲置状态。

ff262950272ce0e214b3a4ec70ff6fe0 848e61f5d8eab57d06a0acf4703acfa1
正文底部广告位

相关导航