long-context

2026-06-10 deepseek

DeepSeek V4 的核心变化不是把 1M context 写进功能清单，而是让长上下文从能力展示进入成本、路由和产品默认值的重新设计。

2026-06-10 deepseek

DeepSeek V4 同时给出开放权重和当天可用 API，真正挑战闭源前沿模型的是部署自由与低迁移成本的组合。

2026-06-10 minimax

MiniMax M3 的关键不是又一个 1M context，而是 MSA 试图从注意力结构上降低长上下文每 token 成本。

2026-06-10 minimax

M3 的真信号是 MSA 把 1M 上下文的每 token 算力压到上一代的 1/20、解码提速 15 倍——长上下文 agent 的成本曲线第一次被一家中国实验室往下按。但发布日权重并未开放，「过 10 天再开源」是诚意的试金石。

2026-06-10 minimax

M3 的难点不是模型卡片，而是 vLLM 等 serving 生态能否及时支持 MSA 的块级稀疏注意力。