查看: 6|回复: 1

重磅!MiniMax M3 即将发布:稀疏注意力架构突破,百万 Token 上下文效率暴增

17

主题

0

回帖

51

积分

注册会员

积分
51
发表于 3 天前 来自手机 | 显示全部楼层 |阅读模式
AI总结
AI总结中
AIbase 报道 北京时间最新消息,国内 AI 独角兽 MiniMax 即将推出新一代大模型 M3。MiniMax AI 工程负责人 Skyler Miao 近日在社交平台释放预告,称“Something BIG is coming!”,引发业界广泛关注。



M3核心架构创新:稀疏注意力机制

据透露,M3采用了全新稀疏注意力(Sparse Attention)架构,通过 Index Branch 快速索引与 Sparse Branch 精准计算相结合的方式,有效解决了超长上下文场景下的计算瓶颈。

传统 Transformer 在处理百万 Token 级别上下文时,计算量会随序列长度呈平方级增长。而 M3的稀疏设计能大幅降低这一开销,在保持高性能的同时实现显著的效率跃升,为长文本理解、长对话、多文档分析等应用场景提供有力支撑。

实测性能大幅领先 M2

对比前代 M2(支持1M Token 上下文),M3在关键指标上取得突破性提升:


  • Prefill 阶段速度提升9.7倍
  • Decoding 阶段速度提升15.6倍


这意味着在实际部署中,M3能够以极低的算力成本高效处理超长上下文,显著降低推理成本,并为更复杂的 AI 应用打开想象空间。

行业意义:长上下文时代的效率新标杆

MiniMax 此次 M3的预告再次凸显了国内 AI 企业在架构创新上的竞争力。稀疏注意力等技术的突破,有望推动大模型从“参数规模竞赛”转向“效率与实用性竞赛”,为企业级落地和消费者应用带来更实惠、高效的体验。

目前 MiniMax 尚未公布 M3的具体发布时间与完整参数规模,但从工程负责人的预告及性能数据来看,这款模型有望成为长上下文处理领域的有力竞争者。AIbase 将持续关注 MiniMax M3的后续动态,第一时间带来最新报道。

Source URL: https://news.aibase.com/zh/news/28371

0

主题

-2

回帖

-4

积分

限制会员

积分
-4
发表于 昨天 03:15 来自手机 | 显示全部楼层

GloopGhost 发表于 2026-5-27 10:08
重磅!MiniMax M3 即将发布:稀疏注意力架构突破,百万 Token 上下文效率暴增AIbase 报道 北京时间最新消息 ...
MiniMax M3太令人期待啦!稀疏注意力架构创新,性能大幅领先,有望成长上下文处理标杆,推动AI向高效实用迈进!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|BOSS中文网 Stonespider

相关侵权、举报、投诉及建议等,请发 E-mail:admin#boss.im

Powered by Discuz! X5.1 Licensed © 2001-2026 Discuz! Team.|浙ICP备2022024777号-14

返回顶部