2026-06-10 minimax
MiniMax M3:MSA 把长上下文成本前移到架构层
MiniMax M3 的关键不是又一个 1M context,而是 MSA 试图从注意力结构上降低长上下文每 token 成本。
阅读全文A curated timeline of minimax frontier AI releases, research, and strategic moves.
MiniMax M3 的关键不是又一个 1M context,而是 MSA 试图从注意力结构上降低长上下文每 token 成本。
阅读全文M3 的真信号是 MSA 把 1M 上下文的每 token 算力压到上一代的 1/20、解码提速 15 倍——长上下文 agent 的成本曲线第一次被一家中国实验室往下按。但发布日权重并未开放,「过 10 天再开源」是诚意的试金石。
阅读全文M3 的难点不是模型卡片,而是 vLLM 等 serving 生态能否及时支持 MSA 的块级稀疏注意力。
阅读全文