注意,本页面只提供大模型的导航与简单对比,所有数据皆来自网络公开数据,不保证数据的绝对准确。想要得到更加全面的参考数据,请直接进入源头数据页面,以免被误导。
详细且专业的大模型资料库,可以进魔搭社区:模型库首页 · 魔搭社区>>>>>
国内外大模型横向对比
模型选型
选择模型,查看参数、价格、能力和适合领域。
公司
开源
推理
中文
多模态
编程
已选 0 个模型
| 选择 | 模型名称 | 最新版本 | 所属公司 | 是否开源 | 核心优势 | 参数量 | 推理能力 | 推理速度(tokens/s) | 编程能力 | 代码能力(HumanEval) | 中文能力 | 长文本能力 | 评测得分 | 适合领域 | 多模态 | agent能力 | 价格 | 输入支持 | 输出支持 | 最大输出token值 | 发布日期 | 知识更新截止时间 | API提供者 | 操作 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Claude Opus 4.7 | - | Anthropic | 否 | 字面理解指令、高分辨率图像长边可接受高达 2,576 像素 | 未公布 | 强 | 中 | ★★★★★ | 未公布 | 强 | 200k | 以官方与第三方最新评测为准 | 代码生成、内容创作、合同分析、研究助理、知识库 | 支持 | 适合工具调用和长任务 | 输入:$14.58 / 百万 token;输出:$72.92 / 百万 token | 文本 | 文本 | 按版本不同 | 20260416 | 20260416 | Anthropic | 查看详情 | |
| Qwen3.5 | Qwen3.5-35B-A3BQwen3.5-9BQwen3.5-4BQwen3.5-2BQwen3.5-397B-A17BQwen3.5-122B-A10BQwen3.5-27BQwen3.5-0.8BQwen3.5-27B-FP8Qwen3.5-35B-A3B-FP8Qwen3.5-122B-A10B-FP8Qwen3.5-27b-GPTQ-Int4Qwen3.5-397B-A17B-FP8Qwen3.5-35B-A3B-GPTQ-Int4Qwen3.5-122B-A10B-GPTQ-Int4Qwen3.5-35B-A3B-BaseQwen3.5-0.8B-BaseQwen3.5-9B-BaseQwen3.5-397B-A17B-GPTQ-Int4Qwen3.5-4B-BaseQwen3.5-2B-Base | 阿里巴巴 | 是 | 中文、多语言、代码和开源生态强,尺寸覆盖灵活。 | 参考小版本 | 强 | 快 | ★★★★★ | 4 | 5 | 5 | 76 | 全模态大模型,支持文本、图片、音频、音视频理解 | 支持 | 适合工具调用和长任务 | 文本 | 文本 | 按版本不同 | 20260330 | 20260330 | 阿里巴巴 | 查看详情 | ||
| GPT-image2 | GPT-image2 | OpenAI | 否 | 图像生成能力 | 参考小版本 | 强 | 快 | ★★★★★ | 4 | 5 | 32,000 字符 | 76 | 文生图 | 支持 | 适合工具调用和长任务 | 文本 | 文本 | 按版本不同 | 20260330 | 20260330 | OpenAI | 查看详情 | ||
| GPT-4.1 mini | GPT-4.1 mini | OpenAI | 否 | 低成本、长上下文、文本与视觉综合能力强,适合高频应用调用。 | 未公布 | 强 | 快 | ★★★★★ | 未公布 | 强 | 1048k | 综合表现优秀 | 聊天助手、知识库问答、代码辅助、图文理解、企业应用 | 支持 | 支持函数调用、工具调用与结构化输出 | 输入 $0.39 / 百万 token;输出 $1.60 / 百万 token | 文本、图像、音频、文件 | 文本 | 32k | 2025-11-11 | 2024-05-31 | OpenAI | 查看详情 | |
| z_image_turbo_bf16.safetensors(acevsok/z_image_turbo_bf16.safetensors) | z_image_turbo_bf16.safetensors | acevs | 是 | z_image_turbo_bf16.safetensors;任务:文本生成图片;许可证:Apache License 2.0;ModelScope 下载量:1777;收藏数:11 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 未公布 | 未公布 | 未公布 | 文本生成图片、safetensors、pytorch | 支持 | 未公布 | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2026-03-13 | 未公布 | ModelScope | 查看详情 | |
| Claude Opus 4.6(Anthropic/claude-opus-4.6) | opus-4.6opus-4.6-thinkingopus-4.6-vision | Anthropic | 否 | Anthropic最新旗舰模型;推理能力大幅提升;支持扩展思维和复杂多步推理;在数学、编程、科学推理方面表现卓越;支持100万token上下文窗口 | 未公布(推测千亿级) | 极强 | 45-80 | ★★★★★ | 92.5+ | 优秀 | 支持200K+扩展至1M | MMLU-Pro:88.2+;GPQA:78.5+;HumanEval:92.5+ | 科研分析、复杂编程、长文档处理、战略咨询、法律文书、医学诊断 | 文本+图像 | 强 | $15/$75(输入/输出每百万token) | 文本+图像 | 文本 | 32768 | 2026/3/15 | 2026/2月 | Anthropic API | 查看详情 | |
| Gemini 2.0 Flash-Lite | Gemini 2.0 Flash-Lite | 否 | 轻量、低价、响应快,适合大规模文本和多模态基础任务。 | 未公布 | 中 | 快 | ★★★★★ | 未公布 | 良好 | 1048k | 轻量任务性价比高 | 客服、摘要、内容分类、轻量多模态、批量处理 | 支持 | 支持工具调用 | 输入 $0.07 / 百万 token;输出 $0.29 / 百万 token | 文本、图像、音频、视频 | 文本 | 65k | 2025-11-11 | 2024-06-01 | 查看详情 | |||
| CAM++说话人确认-中文-通用-200k-Spkrs(iic/speech_campplus_sv_zh-cn_16k-common) | speech_campplus_sv_zh-cn_16k-common | iic | 是 | CAM++是基于密集连接时延神经网络的说话人识别模型。相比于ResNet34和ECAPA-TDNN,CAM++具有更准确的识别率和更快的推理速度。该模型可以用于说话人确认、说话人日志、语音合成、说话人风格转化等多项任务。;CAM++说话人确认-中文-通用-200k-Spkrs;任务:说话人确认;标签:speaker verification、CAM++、中文模型;许可证:Apache License 2.0;ModelScope 下载量:55266432;收藏数:231 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 说话人确认、speaker verification、CAM++、中文模型、audio、pytorch、cn | 未公布 | 未公布 | 未公布 | 音频 | 音频 | 未公布 | 2024-06-24 | 未公布 | ModelScope | 查看详情 | |
| Claude Opus 4.7 Plus(Anthropic/claude-opus-4.7-plus) | opus-4.7-plusopus-4.7-plus-thinking | Anthropic | 否 | Opus 4.7增强版;针对企业级场景优化;更强的指令遵循能力和工具调用能力;支持更长的思维链输出 | 未公布(推测千亿级) | 极强 | 40-70 | ★★★★★ | 93.0+ | 优秀 | 支持200K+扩展至1M | MMLU-Pro:89.0+;GPQA:80.0+ | 企业级应用、自动化工作流、复杂数据分析、代码生成与审查 | 文本+图像 | 极强 | $25/$125(输入/输出每百万token) | 文本+图像 | 文本 | 65536 | 2026/4/1 | 2026/3月 | Anthropic API | 查看详情 | |
| Gemini 2.0 Flash | Gemini 2.0 Flash | 否 | 速度、成本与多模态能力平衡,适合实时应用。 | 未公布 | 强 | 很快 | ★★★★★ | 未公布 | 强 | 1048k | 综合表现优秀 | 实时助手、内容生成、多模态理解、视频分析、应用代理 | 支持 | 支持工具调用和多步骤任务 | 输入 $0.10 / 百万 token;输出 $0.39 / 百万 token | 文本、图像、音频、视频 | 文本 | 8k | 2025-11-11 | 2024-06-01 | 查看详情 | |||
| ChenkinNoob-XL-V0.5(ChenkinNoob/ChenkinNoob-XL-V0.5) | ChenkinNoob-XL-V0.5 | ChenkinNoob | 未公布 | ChenkinNoob-XL-V0.5;任务:文本生成图片;标签:Diffusers、Safetensors、anime;许可证:other;ModelScope 下载量:790;收藏数:16 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 文本生成图片、Diffusers、Safetensors、anime、diffusion、diffusers、safetensors、pytorch、zh、en | 支持 | 未公布 | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2026-04-10 | 未公布 | ModelScope | 查看详情 | |
| Claude Opus 4.7 Flash(Anthropic/claude-opus-4.7-flash) | opus-4.7-flashopus-4.7-flash-thinking | Anthropic | 否 | Opus 4.7轻量高速版;保持高质量输出的同时大幅提升响应速度;适合实时交互场景 | 中等规模 | 很强 | 120-200 | ★★★★★ | 88.0+ | 良好 | 支持200K | MMLU-Pro:84.0+;HumanEval:88.0+ | 实时对话、内容创作、快速问答、客服机器人、摘要生成 | 文本+图像 | 中等 | $5/$25(输入/输出每百万token) | 文本+图像 | 文本 | 16384 | 2026/3/20 | 2026/2月 | Anthropic API | 查看详情 | |
| Gemini 2.5 Flash | Gemini 2.5 FlashGemini 2.5 Flash Preview 06-05 | 否 | 推理增强、速度快、长上下文,适合复杂任务和实时产品。 | 未公布 | 很强 | 快 | ★★★★★ | 未公布 | 强 | 1048k | 推理和多模态表现优秀 | 复杂问答、数据分析、代码辅助、多模态 Agent、企业应用 | 支持 | 强,适合工具编排 | 输入 $0.29 / 百万 token;输出 $2.43 / 百万 token | 文本、图像、音频、视频 | 文本 | 65k | 2025-11-11 | 2024-06-01 | 查看详情 | |||
| BAAI/bge-large-zh-v1.5 | bge-large-zh-v1.5 | BAAI | 是 | 任务:特征抽取;标签:sentence-transformers、feature-extraction、sentence-similarity、transformers;许可证:mit;ModelScope 下载量:1951392;收藏数:120 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 特征抽取、sentence-transformers、feature-extraction、sentence-similarity、transformers、bert、pytorch、transformer、zh | 未公布 | 未公布 | 未公布 | 文本 | 文本 | 未公布 | 2024-09-13 | 未公布 | ModelScope | 查看详情 | |
| Claude Opus 4.7 Max(Anthropic/claude-opus-4.7-max) | opus-4.7-maxopus-4.7-max-thinking | Anthropic | 否 | Opus 4.7最大规模版本;最强推理能力;专为最复杂的任务设计;支持超长上下文和多模态深度理解 | 超大规模(万亿级参数) | 极强 | 30-55 | ★★★★★ | 94.5+ | 卓越 | 支持200K+扩展至1M | MMLU-Pro:91.0+;GPQA:82.0+ | 前沿科学研究、超复杂编程、多模态理解、顶级推理任务 | 文本+图像+视频 | 极强 | $50/$250(输入/输出每百万token) | 文本+图像+视频 | 文本 | 131072 | 2026/4/10 | 2026/3月 | Anthropic API | 查看详情 | |
| Gemini 2.5 Pro | Gemini 2.5 ProGemini 2.5 Pro Preview 06-05 | 否 | 高阶推理、代码和长文本综合能力强。 | 未公布 | 很强 | 中 | ★★★★★ | 未公布 | 强 | 1048k | 旗舰级综合表现 | 复杂推理、研发辅助、深度研究、长文档处理、多模态理解 | 支持 | 强,适合复杂 Agent 工作流 | 输入 $1.22 / 百万 token;输出 $9.72 / 百万 token | 文本、图像、音频、视频 | 文本 | 65k | 2025-11-11 | 2024-06-01 | 查看详情 | |||
| Eco-Tech/MiniMax-M2.7-w8a8-QuaRot | MiniMax-M2.7-w8a8-QuaRot | Eco-Tech | 未公布 | 许可证:other;ModelScope 下载量:1117;收藏数:0 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 未公布 | 未公布 | 未公布 | minimax_m2、safetensors、pytorch | 未公布 | 未公布 | 未公布 | 文本 | 文本 | 未公布 | 2026-04-12 | 未公布 | ModelScope | 查看详情 | |
| Google Mimo v2.5(Google/mimo-2.5) | mimo-2.5mimo-2.5-promimo-2.5-flashmimo-2.5-lite | 否 | Google新一代原生多模态大模型;统一理解文本、图像、音频、视频;支持原生多模态推理和跨模态生成能力 | 未公布 | 极强 | 50-90 | ★★★★★ | 91.0+ | 良好 | 支持1M-2M | MMLU-Pro:87.5+;MMMU:68.0+ | 多模态理解、图文生成、视频分析、音频处理、跨模态检索 | 文本+图像+音频+视频 | 强 | 价格待公布 | 文本+图像+音频+视频 | 文本+图像+音频+视频 | 8192 | 2026/3/25 | 2026/2月 | Google AI Studio / Vertex AI | 查看详情 | ||
| Gemma 3n E2B Instructed | Gemma 3n E2B Instructed | 是 | 轻量开放模型,适合端侧和低资源部署。 | 2B | 中 | 快 | ★★★★★ | 未公布 | 中 | 未公布 | 轻量开放模型 | 端侧应用、离线助手、教育实验、轻量文本任务 | 有限支持 | 基础 | 开源模型,自行部署成本 | 文本 | 文本 | 未公布 | 未公布 | 未公布 | Google / 自部署 | 查看详情 | ||
| 千问3-VL-2B-Instruct(Qwen/Qwen3-VL-2B-Instruct) | Qwen3-VL-2B-Instruct | Qwen | 是 | 千问3-VL-2B-Instruct;任务:视觉多模态理解;许可证:apache-2.0;ModelScope 下载量:284916;收藏数:40 | 2B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 视觉多模态理解、qwen3_vl、transformer、safetensors、pytorch | 支持 | ModelScope 支持:deploy、train | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2025-10-23 | 未公布 | ModelScope | 查看详情 | |
| Mimo v2.5 Pro | mimo-2.5-promimo-2.5-pro-thinking | xiaomi | 否 | Mimo 2.5专业版;增强的多模态理解和生成能力;支持更精细的图像编辑和视频生成 | 未公布 | 极强 | 40-75 | ★★★★★ | 92.0+ | 良好 | 支持2M | MMLU-Pro:88.5+;MMMU:70.0+ | 专业级多模态创作、高精度图像生成、视频编辑、创意设计 | 文本+图像+音频+视频 | 极强 | 价格待公布 | 文本+图像+音频+视频 | 文本+图像+音频+视频 | 16384 | 2026/4/5 | 2026/3月 | xiaomi | 查看详情 | |
| Gemma 3n E4B Instructed | Gemma 3n E4B InstructedGemma 3n E4B Instructed LiteRT Preview | 是 | 开放、轻量、端侧部署友好,比 E2B 具备更好的文本能力。 | 4B | 中 | 快 | ★★★★★ | 未公布 | 中 | 未公布 | 轻量开放模型 | 移动端 AI、本地助手、离线文本处理、教育场景 | 有限支持 | 基础 | 开源模型,自行部署成本 | 文本 | 文本 | 未公布 | 未公布 | 未公布 | Google / 自部署 | 查看详情 | ||
| unsloth/Qwen3.5-0.8B-GGUF | Qwen3.5-0.8B-GGUF | unsloth | 是 | 任务:视觉多模态理解;标签:unsloth、gguf;许可证:apache-2.0;ModelScope 下载量:11787;收藏数:13 | 0.8B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 未公布 | 未公布 | 未公布 | 视觉多模态理解、unsloth、gguf、pytorch | 支持 | 未公布 | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2026-03-02 | 未公布 | ModelScope | 查看详情 | |
| Google Mimo v2.5 Flash(Google/mimo-2.5-flash) | mimo-2.5-flashmimo-2.5-flash-lite | 否 | Mimo 2.5轻量高速版;快速响应的多模态模型;适合实时交互和批量处理场景 | 中等规模 | 很强 | 150-280 | ★★★★★ | 86.0+ | 一般 | 支持1M | MMLU-Pro:82.0+ | 实时多模态对话、快速图像描述、批量内容处理、API集成 | 文本+图像+音频 | 中等 | 价格待公布 | 文本+图像+音频 | 文本+图像 | 8192 | 2026/3/28 | 2026/2月 | Google AI Studio / Vertex AI | 查看详情 | ||
| Claude 3.5 Sonnet | Claude 3.5 SonnetClaude 3.5 Sonnet 20241022 | Anthropic | 否 | 写作、代码、复杂指令跟随和长文档处理能力强。 | 未公布 | 强 | 中 | ★★★★★ | 未公布 | 强 | 200k | 代码与文本任务表现优秀 | 代码生成、内容创作、合同分析、研究助理、知识库 | 支持 | 强,适合工具调用和长任务 | 输入 $3 / 百万 token;输出 $15 / 百万 token | 文本、图像 | 文本 | 8k | 2024-06-20 | 未公布 | Anthropic | 查看详情 | |
| Qwen/Qwen-Image-Edit-2509 | Qwen-Image-Edit-2509 | Qwen | 是 | 任务:图片生成图片;许可证:apache-2.0;ModelScope 下载量:468217;收藏数:225 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 图片生成图片、pytorch、safetensors、diffusers、en、zh | 支持 | ModelScope 支持:deploy | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2025-09-22 | 未公布 | ModelScope | 查看详情 | |
| Google Mimo v2.5 Lite(Google/mimo-2.5-lite) | mimo-2.5-litemimo-2.5-lite-think | 否 | Mimo 2.5超轻量版本;成本优化型多模态模型;适合大规模部署和高并发场景 | 较小规模 | 强 | 300-500 | ★★★★★ | 78.0+ | 一般 | 支持500K | MMLU-Pro:76.0+ | 简单多模态任务、分类标注、内容过滤、嵌入式部署 | 文本+图像 | 基础 | 价格待公布 | 文本+图像 | 文本 | 4096 | 2026/4/8 | 2026/3月 | Google AI Studio / Vertex AI | 查看详情 | ||
| DeepSeek-V3 | DeepSeek-V3DeepSeek-V3-0324 | DeepSeek | 是 | 高性价比、中文和代码能力强,开放权重生态活跃。 | 671B MoE | 强 | 快 | ★★★★★ | 未公布 | 很强 | 64k | 中文、代码和通用任务表现优秀 | 中文问答、代码助手、企业知识库、内容生成、私有化部署 | 不支持 | 支持函数调用和工具编排 | 以官方 API 或自部署成本为准 | 文本 | 文本 | 8k | 2024-12-26 | 未公布 | DeepSeek / 自部署 | 查看详情 | |
| dealignai/Gemma-4-31B-JANG_4M-CRACK | Gemma-4-31B-JANG_4M-CRACK | dealignai | 是 | 任务:视觉多模态理解;标签:mlx、abliterated、uncensored、crack、jang、gemma4;许可证:gemma;ModelScope 下载量:952;收藏数:8 | 31B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 未公布 | 未公布 | 未公布 | 视觉多模态理解、mlx、abliterated、uncensored、crack、jang、gemma4、safetensors、pytorch | 未公布 | 未公布 | 未公布 | 图像 | 图像 | 未公布 | 2026-04-18 | 未公布 | ModelScope | 查看详情 | |
| DeepSeek V4(DeepSeek/deepseek-v4) | deepseek-v4deepseek-v4-reasonerdeepseek-v4-chat | DeepSeek | 是(MoE架构开源权重) | DeepSeek第四代旗舰模型;MoE架构全新升级;推理效率大幅提升;数学和编程能力达到新高度;性价比极高 | 总参数671B(激活37B) | 极强 | 60-110 | ★★★★★ | 93.2+ | 优秀(中文原生) | 支持128K | MMLU-Pro:88.8+;AIME:95.0%;Codeforces Elo:2800+ | 数学推理、复杂编程、科学研究、金融分析、中文处理 | 文本 | 强 | ¥2/¥8(缓存命中)/¥16/¥64(输入/输出每百万token) | 文本 | 文本 | 32768 | 2026/3/8 | 2026/2月 | DeepSeek API | 查看详情 | |
| 通义千问 Qwen3 | Qwen3Qwen3-235B-A22BQwen3-32B | 阿里巴巴 | 是 | 中文、多语言、代码和开源生态强,尺寸覆盖灵活。 | 0.6B-235B | 强 | 快 | ★★★★★ | 未公布 | 很强 | 最高 128k | 开源综合能力强 | 中文应用、代码生成、多语言翻译、智能体、本地部署 | 部分版本支持 | 强,工具调用生态完善 | 开源模型自部署;API 以百炼平台为准 | 文本 | 文本 | 按版本不同 | 未公布 | 未公布 | 阿里云百炼 / 自部署 | 查看详情 | |
| 写实人像、角色扮演、道具细节(diffsynth-i2L-gallery/Z-Image-realistic_portrait-roleplay-prop_detail-1770363034.962795) | Z-Image-realistic_portrait-roleplay-prop_detail-1770363034.962795 | diffsynth-i2L-gallery | 是 | 写实人像、角色扮演、道具细节;任务:文本生成图片;标签:LoRA、text-to-image;许可证:Apache License 2.0;ModelScope 下载量:502;收藏数:15 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 未公布 | 未公布 | 未公布 | 文本生成图片、LoRA、text-to-image、lora、safetensors | 支持 | 未公布 | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2026-02-06 | 未公布 | ModelScope | 查看详情 | |
| DeepSeek V4 Pro(DeepSeek/deepseek-v4-pro) | deepseek-v4-prodeepseek-v4-pro-reasoner | DeepSeek | 否(部分开源) | DeepSeek V4专业增强版;针对专业领域深度优化;更强的逻辑推理和专业领域知识覆盖 | 总参数1T+(激活约50B) | 极强 | 50-90 | ★★★★★ | 94.0+ | 优秀(中文原生) | 支持256K | MMLU-Pro:90.2+;AIME:96.5% | 专业研究、法律分析、医疗咨询、高级编程、复杂决策 | 文本 | 极强 | ¥4/¥16(缓存命中)/¥32/¥128(输入/输出每百万token) | 文本 | 文本 | 65536 | 2026/3/22 | 2026/3月 | DeepSeek API | 查看详情 | |
| 豆包 1.5 Pro | 字节跳动 | 否 | 中文场景、内容生成、低延迟和平台生态集成较好。 | 未公布 | 强 | 快 | ★★★★★ | 未公布 | 很强 | 按版本不同 | 中文应用表现优秀 | 中文客服、内容创作、企业办公、营销生成、多模态应用 | 部分版本支持 | 支持工具调用 | 以火山引擎官方价格为准 | 文本、图像 | 文本 | 按版本不同 | 未公布 | 未公布 | 火山引擎 | 查看详情 | ||
| 千问3-VL-Embedding-2B(Qwen/Qwen3-VL-Embedding-2B) | Qwen3-VL-Embedding-2B | Qwen | 是 | 千问3-VL-Embedding-2B;任务:特征抽取;标签:transformers、multimodal embedding、qwen、embedding;许可证:apache-2.0;ModelScope 下载量:147615;收藏数:30 | 2B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 特征抽取、transformers、multimodal embedding、qwen、embedding、qwen3_vl、pytorch、safetensors | 支持 | ModelScope 支持:deploy | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2026-01-19 | 未公布 | ModelScope | 查看详情 | |
| DeepSeek V4 Lite(DeepSeek/deepseek-v4-lite) | deepseek-v4-litedeepseek-v4-lite-chat | DeepSeek | 是 | DeepSeek V4轻量版;小参数量但保持强大性能;适合资源受限环境和边缘部署 | 总参数16B(激活3B) | 很强 | 180-320 | ★★★★★ | 85.5+ | 良好(中文原生) | 支持64K | MMLU-Pro:81.5+;AIME:82.0% | 日常对话、轻量编程、教育辅助、移动端部署、API代理 | 文本 | 中等 | ¥0.5/¥2(缓存命中)/¥4/¥16(输入/输出每百万token) | 文本 | 文本 | 16384 | 2026/3/12 | 2026/2月 | DeepSeek API | 查看详情 | |
| 文心一言 4.0 | ERNIE 4.0ERNIE 4.0 Turbo | 百度 | 否 | 中文知识、搜索生态和企业服务能力强。 | 未公布 | 强 | 中 | ★★★★★ | 未公布 | 很强 | 按版本不同 | 中文知识问答表现优秀 | 中文问答、企业知识库、办公助手、内容审核、营销文案 | 支持 | 支持插件和工具生态 | 以百度千帆官方价格为准 | 文本、图像 | 文本 | 按版本不同 | 未公布 | 未公布 | 百度千帆 | 查看详情 | |
| 千问3-Next-80B-A3B-Instruct(Qwen/Qwen3-Next-80B-A3B-Instruct) | Qwen3-Next-80B-A3B-Instruct | Qwen | 是 | 千问3-Next-80B-A3B-Instruct;任务:文本生成;许可证:apache-2.0;ModelScope 下载量:2179373;收藏数:157 | 80B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 文本生成、qwen3_next、transformer、safetensors、pytorch | 未公布 | ModelScope 支持:deploy、train | 未公布 | 文本 | 文本 | 未公布 | 2025-09-17 | 未公布 | ModelScope | 查看详情 | |
| DeepSeek V4 Reasoner(DeepSeek/deepseek-v4-reasoner) | deepseek-v4-reasonerdeepseek-v4-reasoner-pro | DeepSeek | 是 | DeepSeek V4专用推理模型;强化思维链推理能力;擅长数学证明、代码调试等需要深度推理的任务 | 总参数671B(激活37B) | 极强 | 30-65 | ★★★★★ | 94.5+ | 优秀(中文原生) | 支持128K | MATH:96.0%;Codeforces Elo:2900+ | 数学竞赛、算法设计、代码debug、科学发现、逻辑证明 | 文本 | 极强 | ¥4/¥16(缓存命中)/¥32/¥128(输入/输出每百万token) | 文本 | 文本 | 32768 | 2026/3/18 | 2026/2月 | DeepSeek API | 查看详情 | |
| Kimi K2 | Kimi K2 | 月之暗面 | 否 | 长文本、中文阅读和资料整理能力突出。 | 未公布 | 强 | 中 | ★★★★★ | 未公布 | 很强 | 长上下文 | 长文档场景突出 | 长文档分析、研报阅读、论文总结、中文问答、代码辅助 | 部分支持 | 支持工具调用 | 以 Moonshot 官方价格为准 | 文本、文件 | 文本 | 按版本不同 | 未公布 | 未公布 | Moonshot AI | 查看详情 | |
| Jackrong/Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled | Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled | Jackrong | 是 | 任务:视觉多模态理解;标签:unsloth、qwen、qwen3.5、reasoning、chain-of-thought、Dense;许可证:apache-2.0;ModelScope 下载量:99045;收藏数:23 | 27B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | 视觉多模态理解、unsloth、qwen、qwen3.5、reasoning、chain-of-thought、Dense、qwen3_5、safetensors、pytorch、en、zh | 支持 | 未公布 | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2026-04-06 | 未公布 | ModelScope | 查看详情 | |
| GPT-5.5(OpenAI/gpt-5.5) | gpt-5.5gpt-5.5-turbogpt-5.5-mini | OpenAI | 否 | OpenAI第五代半旗舰模型;全能型大模型;在推理、创造力和工具使用方面全面领先;支持实时联网和文件处理 | 未公布(推测千亿级) | 极强 | 55-100 | ★★★★★ | 92.8+ | 良好 | 支持1M | MMLU-Pro:89.5+;GPQA:79.0+ | 通用对话、内容创作、数据分析、编程开发、知识问答 | 文本+图像 | 强 | $10/$50(输入/输出每百万token) | 文本+图像 | 文本 | 32768 | 2026/3/5 | 2026/2月 | OpenAI API | 查看详情 | |
| Doubao-Seed-Translation | Doubao-Seed-Translation | 字节跳动 | 否 | 中文场景、低延迟、内容生成和企业应用集成能力强。 | 未公布 | 强 | 快 | ★★★★★ | 未公布 | 很强 | 按版本不同 | 以官方与第三方最新评测为准 | 中文客服、内容创作、企业办公、营销生成、智能体 | 部分版本支持 | 支持工具调用和应用编排 | 输入:$0.17 / 百万 token;输出:$0.5 / 百万 token | 文本 | 文本 | 按版本不同 | 未公布 | 未公布 | 火山引擎 | 查看详情 | |
| rendeyong888/qwen_2.5_vl_7b_fp8_scaled.safetensors | qwen_2.5_vl_7b_fp8_scaled.safetensors | rendeyong888 | 是 | 千问的 文本编码器,网上只有分片的,这个是合并在一起的,单个文件即可时使用;许可证:Apache License 2.0;ModelScope 下载量:9998;收藏数:24 | 7B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 支持 | 未公布 | 未公布 | safetensors | 支持 | 未公布 | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2025-12-02 | 未公布 | ModelScope | 查看详情 | |
| GPT-5.5 Pro(OpenAI/gpt-5.5-pro) | gpt-5.5-progpt-5.5-pro-reasoning | OpenAI | 否 | GPT-5.5专业版;最强推理变体;深度思考模式支持更长推理链;适合最复杂的分析和创作任务 | 未公布(推测更大规模) | 极强 | 35-65 | ★★★★★ | 94.2+ | 良好 | 支持1M | MMLU-Pro:91.0+;GPQA:82.0+ | 复杂推理、深度分析、学术写作、战略规划、高级编程 | 文本+图像 | 极强 | $30/$150(输入/输出每百万token) | 文本+图像 | 文本 | 65536 | 2026/3/20 | 2026/3月 | OpenAI API | 查看详情 | |
| Doubao-Seed-1.6 | Doubao-Seed-1.6 | 字节跳动 | 否 | 中文场景、低延迟、内容生成和企业应用集成能力强。 | 未公布 | 强 | 快 | ★★★★★ | 未公布 | 很强 | 按版本不同 | 以官方与第三方最新评测为准 | 中文客服、内容创作、企业办公、营销生成、智能体 | 部分版本支持 | 支持工具调用和应用编排 | 输入:$0.11 / 百万 token;输出:$0.28 / 百万 token | 文本 | 文本 | 按版本不同 | 未公布 | 未公布 | 火山引擎 | 查看详情 | |
| ArcFace人脸识别模型(iic/cv_ir50_face-recognition_arcface) | cv_ir50_face-recognition_arcface | iic | 是 | 输入一张图片,检测矫正人脸区域后提取特征,两个人脸特征可用于人脸比对,多个人脸特征可用于人脸检索。;ArcFace人脸识别模型;任务:人脸识别;标签:ArcFace、CVPR2019、Insighface;许可证:MIT License;ModelScope 下载量:341019;收藏数:121 | 未公布 | 未公布 | 未公布 | ★★★★★ | 未公布 | 未公布 | 未公布 | 未公布 | 人脸识别、ArcFace、CVPR2019、Insighface、cv、pytorch | 未公布 | 未公布 | 未公布 | 图像 | 图像 | 未公布 | 2023-02-15 | 未公布 | ModelScope | 查看详情 | |
| GPT-5.5 Mini(OpenAI/gpt-5.5-mini) | gpt-5.5-minigpt-5.5-mini-fast | OpenAI | 否 | GPT-5.5迷你版;成本优化的高效模型;速度快成本低;适合大规模应用和简单任务 | 中等规模 | 很强 | 150-280 | ★★★★★ | 86.5+ | 一般 | 支持256K | MMLU-Pro:83.0+ | 快速响应、批量处理、分类任务、简单对话、嵌入式应用 | 文本+图像 | 中等 | $1/$5(输入/输出每百万token) | 文本+图像 | 文本 | 16384 | 2026/3/15 | 2026/2月 | OpenAI API | 查看详情 | |
| Doubao-1.5-pro-32k | Doubao-1.5-pro-32k | 字节跳动 | 否 | 中文场景、低延迟、内容生成和企业应用集成能力强。 | 未公布 | 强 | 快 | ★★★★★ | 未公布 | 很强 | 32k | 以官方与第三方最新评测为准 | 中文客服、内容创作、企业办公、营销生成、智能体 | 部分版本支持 | 支持工具调用和应用编排 | 输入:$0.11 / 百万 token;输出:$0.28 / 百万 token | 文本 | 文本 | 按版本不同 | 未公布 | 未公布 | 火山引擎 | 查看详情 | |
| mlx-community/Qwen3.6-35B-A3B-4bit | Qwen3.6-35B-A3B-4bit | mlx-community | 是 | 任务:视觉多模态理解;标签:mlx;许可证:apache-2.0;ModelScope 下载量:1052;收藏数:4 | 35B参数 | 未公布 | 未公布 | ★★★★★ | 未公布 | 未公布 | 未公布 | 未公布 | 视觉多模态理解、mlx、qwen3_5_moe、safetensors、pytorch | 支持 | 未公布 | 未公布 | 文本、图像 | 文本、图像 | 未公布 | 2026-04-16 | 未公布 | ModelScope | 查看详情 |
已显示 50 / 22320 个模型