雷军宣布:永久降价,最高降99%!

中国经济网微信综合@小米技术 @雷军 界面新闻等 | 2026-05-27 15:23

27日,小米旗下MiMo大模型团队公告称,对V2.5系列模型API进行永久性降价,最高降幅达99%,不再区分上下文窗口长度。同时优化Token Plan计费体系,同等价格下用量提升至原来的5—8倍。随后雷军转发此消息。

据悉,这是继DeepSeek之后,又一家宣布API永久降价的大模型公司。

从具体定价与降幅细节来看,MiMo-V2.5-Pro调价后输入缓存命中价格0.025元/百万tokens,相较于原价≤256k规格1.40元降幅达98%,对比256k-1M规格2.80元降幅触及99%;输入未命中缓存定价3.000元/百万tokens,较原价7.00元下降57%,对比长窗口原价14.00元降幅79%;输出定价6元/百万tokens,相较原价21元、42元分别下降71%与86%。

昨晚,小米集团发布一季度业绩:营收991亿元,经调整净利润61亿元;智能电动汽车及AI等创新业务收入199亿元,当季新车交付80856辆;研发投入90亿元,同比增长33.4%。雷军同时宣布,未来三年在AI领域投入600亿元,预计全年研发投入超400亿元。目前,MiMo-V2.5-Pro已在Artificial Analysis榜单综合智能指数、Agent指数上位列全球开源模型并列第一。

据业内分析,除小米与DeepSeek外,国内大模型市场也呈现出明显的K型分化特征。阿里云通义千问、字节跳动豆包等通用型大模型相继下调API调用价格,而智谱GLM、腾讯混元等主打企业定制服务的模型则维持价格稳定甚至小幅上调,形成“通用模型降价走量、高端模型溢价保值”的新格局。

这一现象背后,是行业从无序价格战向技术效率竞争的转型,降价不再是单纯的市场营销手段,而是底层算法优化、推理技术升级、算力成本下行共同驱动的必然结果。

AI聚合平台AI.cc发布的2026年AI API基础设施报告显示,过去一年企业级大模型Token调用成本同比暴跌67%,开源模型已占据企业Token调用量38%的份额,性价比已成为市场核心竞争要素。