AI 编程

2026-06-11 ai-coding

给 AI「明星开发者」收拾烂摊子:被外部化的技术债

Jesse Skinner 把 AI 编码工具比作一支随叫随到的「明星开发者」大军:产出飞快,代码却没人维护得起。真正的工程难题不在写得多快,而在谁来兜底。

ai-coding engineering tech-debt

阅读全文

2026-06-11 cognition

FrontierCode：把评测问题从「对不对」换成「你会不会真的合并」

Cognition 发布 FrontierCode，用「维护者会不会真的合并这段代码」当评测信号，把可读性、可维护性、改动范围纳入评分，逼近人类代码评审，也暴露出主观性和谁来判合并的难题。

evals ai-coding agents

阅读全文

2026-06-10 moonshot

Kimi Code CLI 的子 agent 设计：把编码流程结构化

Kimi Code CLI 内置 coder、explore、plan 子 agent，并让它们在隔离上下文里并行工作。这个设计的价值，是把 agent 编程拆成可分工、可监督、可组合的流程，明显超出把模型接进终端的包装层。

moonshot coding-agents developer-tools

阅读全文

2026-06-10 moonshot

Kimi Code CLI 的价值在终端闭环，也在权限监督

Kimi Code CLI 把读写代码、执行命令、抓取网页和规划行动放在同一个终端工作流里。这个闭环能提升开发效率，也会把权限、审计和人工监督推到更前面。

moonshot coding-agents developer-tools

阅读全文

2026-06-09 google

Google Antigravity 2.0：真正的武器是分发，不是这个 App

Antigravity 2.0 砍掉 IDE、做成独立 agent 桌面端。但 Google 在 agentic 编码里的真信号不是产品力，而是分发与模型-harness 协同训练，以及强制升级带来的信任账单。

ai-coding agents developer-tools

阅读全文

2026-06-02 openai

Codex 正在从代码 Agent 变成工作台

OpenAI 的角色插件、可分享 Sites 和 annotations 表明，Codex 的重点正在从写代码转向承载团队工作。

agents ai-coding knowledge-work

阅读全文

2026-06-01 openai

OpenAI 把模型挂上 AWS，是去微软的城墙外另开一道门

OpenAI 的模型和 Codex 上了 AWS Bedrock。表面是多一个云平台,真实动机是 OpenAI 不再甘心只活在微软的分发渠道里,要直接站到企业最熟悉的那块地盘上。

ai-infra agents ai-coding

阅读全文

2026-05-14 openai

Codex from anywhere 的重点是监督 Agent，不是在手机上写代码

OpenAI 的 Codex 移动和远程主机更新指向一种新工作流：长时间 coding agent 需要远程检查点、审批和 host governance。

agents ai-coding developer-tools

阅读全文

2026-04-23 openai

GPT-5.5 把模型竞争推向执行型工作

OpenAI 的 GPT-5.5 发布说明，前沿模型正在被长任务执行、工具使用、成本和安全路由共同评估，而不只是比智力分数。

frontier-models agents ai-coding

阅读全文

2026-04-16 anthropic

Claude Opus 4.7：可靠性的较量已经转到控制层

Anthropic 的 Opus 4.7 不只是模型分数更新，更重要的是 effort level、自我验证、长任务成本和 Claude Code 控制面。

agents ai-coding frontier-models

阅读全文

2026-02-17 anthropic

Claude Sonnet 4.6 让性价比成为前沿

Anthropic 的 Sonnet 4.6 重要，不只是因为能力接近 Opus，而是因为它把前沿能力带到更便宜、更广的工作流。

frontier-models agents ai-coding

阅读全文

2026-02-05 anthropic

Claude Opus 4.6 让多 Agent 工作更现实，但不会自动成功

Anthropic 的 Opus 4.6、百万 token 上下文和 Claude Code 智能体团队展示了多智能体工程的价值，也暴露了成本和协调这两道还没解决的坎。

agents ai-coding frontier-models

阅读全文