面壁MiniCPM

1周前更新 0 0

MiniCPM是由面壁智能研发的端侧大模型系列,以高效参数压缩与多模态处理能力为核心优势。该系列模型通过技术创新实现端侧设备的高效部署,在自然语言处理、多模态理解、长文本处理等任务中展现卓越性能,2024年2月推出的2B版本在多项基准测试中超越微软Phi-2模型。截至2025年5月,该系列已推出包含MiniCPM-V2.6、MiniCPM...

收录时间:
2025-08-30
广告也精彩
正文上方广告位

MiniCPM是由面壁智能研发的端侧大模型系列,以高效参数压缩与多模态处理能力为核心优势。该系列模型通过技术创新实现端侧设备的高效部署,在自然语言处理、多模态理解、长文本处理等任务中展现卓越性能,2024年2月推出的2B版本在多项基准测试中超越微软Phi-2模型。截至2025年5月,该系列已推出包含MiniCPM-V2.6、MiniCPM-o2.6、MiniCPM3.0等多个版本,其中8B参数模型在端侧内存占用仅6GB,支持实时视频理解与多图联合推理 ,3.0版本则在上下文处理长度和FunctionCalling能力上达到GPT-3.5水平 面壁MiniCPM

技术突破

  1. 1.
    多模态能力
    • MiniCPM-V2.6(2024年11月)整合视觉/语音/文本处理,支持视频流实时解析与多图OCR联合推理,token编码密度达GPT-4o两倍 
    • MiniCPM-o2.6(2025年1月)实现全模态流式交互,推理速度18tokens/s,支持中英双语实时对话 [4] [6]
  2. 2.
    长文本处理
    • 2024年9月的3.0版本采用LLMxMapReduce分帧技术,将上下文处理长度拓展至512K,在InfiniteBench测试中超越GPT-4
  3. 3.
    端侧优化
    • 经int4量化后内存占用6GB,可在移动端部署 
    • 首创端到端全模态架构,支持CPU本地推理与模型微调 

版本迭代

  • MiniCPM-V2.6(2024年11月):8B参数模型,首次实现端侧实时视频理解,OCR准确率提升40% 
  • MiniCPM3.0(2024年9月):4B参数规模,FunctionCalling性能接近GPT-4o,强化RAG检索能力

应用场景

  • 智能终端:支持手机/平板设备运行实时视频解析与多轮对话 
  • 工业应用:与曦灵数字人整合提升虚拟形象交互,应用于智能监控系统
  • 车载系统:与MTK合作开发车载多模态解决方案,实现驾驶场景语义理解
正文底部广告位

相关导航

评论上方广告位