open-weights

2026-06-16 zhipu

GLM-5.2 权重落地：开放阵营把前沿压成了按季度刷新的常态

智谱放出 GLM-5.2 权重，MIT 许可，1M 上下文，主打长程任务和可调思考预算。官方自报跑分把它放到了闭源旗舰一两个点的射程内。真正的信号不是又一次刷榜，而是开放权重的能力成本曲线又压低一格。但厂商自报数字要打折，1M 是否真可用、长程是否真可靠，得自己在目标任务上测。

open-weights long-context frontier-models

阅读全文

2026-06-16 ollama

本地模型够用了吗：两派其实在量两件不同的事

Vicki Boykis 说本地模型现在好用了，1245 分的 Ask HN 帖里却吵成两派。鼓吹派量的是日常编码任务上够用，怀疑派量的是复杂任务上云端仍碾压。拐点不在模型突然变强，而在开放权重模型越过了可用线、本地 agent 工具链把够用重新定义。给 builder 的判断：别问行不行，算你的具体任务里本地这条线的成功率、时延、成本差多少，差的部分值不值你让出隐私和控制权。

local-llm open-weights coding-agents

阅读全文

2026-06-16 alibaba

Qwen 发布机器人基础模型套件：把 LLM 的开放打法搬进具身智能

Qwen 一次推出三个机器人基础模型，导航、操作、世界模型各管一段，用语言接口把它们串成可调用的工具。真正的杠杆不是某个跑分，而是想把物理世界智能做成像 LLM 那样可二次开发的开放底座。但从看懂到会动这条鸿沟，一个套件远没填平，真正的瓶颈在真实机器人上的泛化与可靠性。

robotics embodied-ai foundation-models

阅读全文

2026-06-15 moonshot

Kimi K2.7-Code 开源：开放编码模型的竞争轴心从跑分转向 token 成本

月之暗面开源 Kimi K2.7-Code，1T 总参 32B 激活的编码向 agentic 模型。头号卖点不是榜单峰值，而是 thinking token 比 K2.6 降约 30%。它在主流编码与 agentic 榜上仍全面低于 GPT-5.5 和 Opus 4.8，但把够用加便宜加可自托管这条路又推近一步。真正的瓶颈仍是缺一个好用的英文 CLI。

coding-models open-weights token-efficiency

阅读全文

2026-06-15 model-merging

里约「主权大模型」翻车：开放权重让谎报实验室能力第一次被数学证伪

里约政府 IT 公司发布 397B「巴西主权」开放模型并宣称自训练击败同级。Nex-AGI 用身份测试与权重共线性两套独立证据证明它只是 0.6 倍 Nex 加 0.4 倍 Qwen 的逐元素合并。要害不是没标引用，是对外谎报了自己实验室的能力，而权重张量这次成了无法抵赖的指纹。

model-merging open-weights sovereign-ai

阅读全文

2026-06-14 zhipu

GLM-5.2 完全开放发布：智谱把美国的封禁当成了卖点

智谱发布 GLM-5.2 并宣布完全开放，时间卡在 Anthropic Fable 被叫停的同一周。真正的新闻不是参数（没公开跑分），而是定位：当闭源 API 的访问能被非技术原因随时撤销，开放权重的价值从省钱可定制升级为供给确定性。这是开放阵营当下最锋利的卖点，但权重未上线、无独立 benchmark 前，别据此切换生产负载。

open-weights long-context coding-models

阅读全文