2026-06-10 deepseek
DeepSeek V4:1M 上下文进入成本结构阶段
DeepSeek V4 的核心变化不是把 1M context 写进功能清单,而是让长上下文从能力展示进入成本、路由和产品默认值的重新设计。
阅读全文High-signal frontier AI context tagged with long-context.
DeepSeek V4 的核心变化不是把 1M context 写进功能清单,而是让长上下文从能力展示进入成本、路由和产品默认值的重新设计。
阅读全文DeepSeek V4 同时给出开放权重和当天可用 API,真正挑战闭源前沿模型的是部署自由与低迁移成本的组合。
阅读全文MiniMax M3 的关键不是又一个 1M context,而是 MSA 试图从注意力结构上降低长上下文每 token 成本。
阅读全文M3 的真信号是 MSA 把 1M 上下文的每 token 算力压到上一代的 1/20、解码提速 15 倍——长上下文 agent 的成本曲线第一次被一家中国实验室往下按。但发布日权重并未开放,「过 10 天再开源」是诚意的试金石。
阅读全文M3 的难点不是模型卡片,而是 vLLM 等 serving 生态能否及时支持 MSA 的块级稀疏注意力。
阅读全文