小米AI模型再升级：多模态融合与开源布局引关注

2026-04-23 05:45:45

小米发布多模态融合新世代AI模型，开源战略加速落地

数周前，小米悄然推出万亿参数模型MiMo-V2-Pro。该模型曾以"Hunter Alpha"为代号在OpenRouter平台低调测试，一经官宣便迅速跻身顶级模型行列。实际测试表现令人印象深刻。

V2-Pro仅支持文本与代码处理，其多模态能力由独立发布的MiMo-V2-Omni提供，但后者基准测试成绩相对普通。全新V2.5系列将各项能力融合于单一模型，不仅速度更快、性能更强，更原生集成图像、视频与音频理解功能。

这对普通用户的实际意义远超想象：现在你可以拍摄冰箱照片获取菜谱建议，上传教学视频获得步骤摘要，录制会议记录自动提取待办事项。所有功能集中于同一平台，无需在多工具、多模型与复杂计费策略间来回切换。

小米宣称V2.5-Pro在综合智能体能力、复杂软件工程与长周期任务方面实现重大突破，在多数编程与智能体基准测试中已可比肩前沿模型。数据显示其表现基本符合宣传，仅在复杂推理任务方面仍存在提升空间。

基础版与专业版定位分明：V2.5-Pro作为重型工作引擎，可自主完成涉及千次以上工具调用的专业任务——这类工作通常需要专家数日时间。其处理速度为每秒60-80个标记。

V2.5则定位日常使用场景：速度更快（每秒100-150个标记），支持专业版未涵盖的图像、音频、视频全模态处理。两款模型均具备100万标记的上下文窗口，单次对话可处理约75万字内容。

在修复实际初创企业代码库错误的SWE-bench Pro测试中，V2.5-Pro任务解决率达57.2%，远超行业平均的25%。在τ3-bench与ClawEval评估中，其表现与顶级模型差距仅在数分之内。

真正的突出优势在于标记使用效率：在同等基准得分下，V2.5-Pro比同类模型减少42%的标记消耗，V2.5的标记使用量仅为竞品的一半。对每日处理数千请求的开发者而言，这直接转化为可观的成本节约。

自去年底以来，小米已完成三轮重大模型发布。公司宣布未来三年将投入巨额资金支持AI发展，目前的发布节奏表明相关投入已进入执行阶段。

市场数据揭示了快速迭代的背后动力：截至四月初，小米模型已占据重要AI路由平台约21%的流量，近期周增长率超过42%。当现有模型成为全球最大AI路由平台中最具竞争力的产品之一时，企业既拥有快速迭代的资源，也面临着持续领先的压力。

新版信用计费体系同步上线：V2.5采用1倍标准费率，V2.5-Pro按2倍计费。公司取消了百万标记上下文窗口的额外乘数计费，使得长文档分析成本显著降低。现有用户还可获得全新的信用额度作为发布福利。

目前模型已通过小米官方API对外开放，公司透露下一代模型正在训练中，将具备更深入的推理能力、更紧密的工具集成与更丰富的现实场景基础。按照小米当前的推进速度，新的突破或许会比预期更早到来。

一分钟读懂：小米发布全新MiMo-V2.5系列模型，首次实现文本、图像、音频与视频的原生融合，性能全面超越前代。同时宣布开源计划，并优化计费体系，推动技术普惠。