小米和MiniMax同时放大招，Agent定价战正式开打

By: blockbeats|2026/03/20 13:25:43

3 月 18 日和 19 日，两家中国公司先后发布了各自的 Agent 方向大模型。国内 AI 初创公司 MiniMax 推出 M2.7，小米旗下大模型团队 MiMo 推出 V2-Pro。两款模型在 Agent benchmark 上均进入全球第一梯队，但它们的 API 输出定价分别是 Claude Opus 4.6 的 1/21 和 1/8。

两家同一周出牌，但手里的牌完全不同。它们代表了两条截然不同的技术路线，赌的是 Agent 时代的两种未来。

同一场考试，1/17 的学费

先看最直观的对比。

小米和MiniMax同时放大招，Agent定价战正式开打

据 OpenRouter 和各公司官方定价页数据，以 API 输出价格（每百万 tokens）计，MiniMax M2.7 是 1.2 美元，MiMo-V2-Pro 是 3 美元。作为参照，Claude Opus 4.6 的输出价是 25 美元，GPT-5.2 是 14 美元，Claude Sonnet 4.6 是 15 美元。

价格差距是数量级的，但能力差距不是。在 SWE-bench Verified（当前衡量代码工程能力最主流的 benchmark）上，MiMo-V2-Pro 拿到 78%，Sonnet 4.6 是 79.6%，差距不到两个百分点。M2.7 的 SWE-Pro 成绩为 56.22%，与 GPT-5.3-Codex 持平。在 VIBE-Pro（端到端项目交付能力）上，M2.7 拿到 55.6%，接近 Opus 4.6 的水平。

这张图的重点不在于谁高谁低——各家的 benchmark 体系不完全对齐，直接比较要谨慎。重点在于那个「价格-性能剪刀差」：国产 Agent 模型已经挤进了同一个能力带，但站在完全不同的价格区间里。

万亿参数 vs 自我进化

价格只是表象。两家公司拿出了两套完全不同的底牌。

MiMo-V2-Pro 走的是「大力出奇迹」路线。据小米官方公告，V2-Pro 拥有超过 1 万亿总参数，激活参数 42B，支持 100 万 tokens 的超长上下文。它的核心创新是 Hybrid Attention 混合注意力机制，将滑动窗口注意力（SWA）与全局注意力（GA）的比例调至 7:1——前代 V2-Flash 是 5:1。这套架构让模型在处理长文档、多工具并行调用的 Agent 场景时更稳定。在 PinchBench（Agent 工具调用能力评测）上，MiMo-V2-Pro 拿到 84%。

M2.7 走了一条完全不同的路。据 MiniMax 3 月 18 日发布的官方技术博客，M2.7 的参数量未公开，但它展示了一种「自迭代进化」机制：模型自主运行 100 轮以上的优化循环，包括分析失败轨迹、规划修改、修改自身代码架构、跑评估、再循环，最终在内部评估集上实现了 30% 的性能提升。在 MLE Bench Lite（机器学习竞赛难度评测）的 22 道高难度题中，M2.7 拿下 9 金 5 银 1 铜，平均奖牌率 66.6%。

从五个维度看，两条路线的锋芒朝向完全不同：MiMo-V2-Pro 在上下文长度和代码工程维度上明显占优，M2.7 则在办公自动化和自迭代能力上拉开距离。据 MiniMax 同篇技术博客，M2.7 在 GDPval-AA（办公文档处理评测）上拿到 ELO 1495，居开源模型首位，在覆盖 40 多个复杂技能的 MM-Claw 测试中保持了 97% 的技能遵循率。