AI 新闻摘要 2026-05-14

Agent 与工具链

Cline 开源全新 SDK，打造可复用编码 Agent 底层

Cline 发布完全重构的开源 SDK，附带 CLI/TUI、Agent 团队、定时任务和连接器，让开发者能基于它构建自定义编码 Agent，定位为可复用的编程助手基础框架。
> 相关链接：Cline SDK 发布

LangChain 批量发布 Agent 基础设施，SmithDB 提速 12-15 倍

LangChain 在 Interrupt 大会上推出一系列工具：SmithDB（专为嵌套长 trace 设计的可观测数据库，比通用方案快 12-15 倍）、Sandboxes、Managed Deep Agents、LLM Gateway 等，瞄准生产级 Agent 生命周期管理。
> 相关链接：LangChain 更新｜SmithDB 详情

Notion 开放外部 Agent API，支持 Claude、Codex 等直接操作

Notion 推出 External Agents API，允许第三方 AI Agent（如 Claude、Codex、Cursor 等）直接在 Notion 页面内读写数据，让 Agent 共享上下文，不再孤立。
> 相关链接：Notion API 发布

Cursor 升级云代理：自带完整开发环境，支持回滚与隔离

Cursor 让云代理拥有完全配置的开发环境，包括克隆仓库、安装依赖、版本历史、回滚、隔离密钥和出站流量控制，方便处理复杂多文件任务。
> 相关链接：Cursor 更新

研究与方法

Nous Research 提出 Token Superposition Training，预训练提速 2-3 倍

该方法让模型在预训练早期读/预测连续 token 包，之后再切回标准 next-token 预测。不改变推理架构，在 270M 到 3B 密集模型及 10B MoE 上验证有效。
> 相关链接：Nous 论文

多流 LLM 论文：拆分消息流降低延迟，并行推理更清晰

Jonas Geiping 等人认为当前 chat 训练把 Agent 限制在单一流中，提出多流 LLM，能并行推理、工具调用，延迟更低，分离关注更清晰。代码已开源。
> 相关链接：论文与代码

δ-mem 外部记忆模块：冻结主干 + 联想记忆，提升记忆密集型任务

在冻结的全注意力模型上附加在线联想记忆，8×8 状态使平均分提高 1.10×，超越基线 1.15×，在记忆密集型基准上增益更大。
> 相关链接：δ-mem 论文

NVIDIA Star Elastic：一次后训练得到全家推理模型，成本降低 360 倍

只需一次后训练就能生成多种尺寸的推理模型族，成本比从零预训练低 360 倍，比现有压缩方法好 7 倍。
> 相关链接：NVIDIA 发布

Datology：只靠数据筛选，VLM 性能猛涨 11.7 分，训练计算减少 17 倍

通过精心挑选预训练数据，2B 模型在 20 个 VLM 基准上平均提升 11.7 点，超过 InternVL3.5-2B 约 10 点，训练计算仅为其 1/17；4B 模型性能接近前沿，响应 FLOPs 少 3.3 倍。
> 相关链接：Datology 成果

SWE-ZERO-12M：最大开源 Agent 轨迹数据集，112B tokens

由 Kevin Li 发布，包含 12M 条 agent 轨迹、122K 个 PR、3K 个仓库、16 种编程语言，用于训练和评估编码 Agent。
> 相关链接：数据集介绍

产品与应用落地

Figure 机器人直播 8 小时自主分拣：多机协调、自主换电池

Figure 的人形机器人使用 Helix-02 在仓库执行 8 小时无人值守包裹分拣，从像素级视觉推理，约 3 秒/件，可自动换低电量机器人、自我诊断并回退维护，展示了长期多机协同的落地能力。
> 相关链接：Brett Adcock 直播｜后续细节

Perplexity 公布硬件隔离沙箱架构，加固企业 Agent 安全

Perplexity 详细介绍了其 VPC 级硬件隔离、短生命代理令牌、外部内容扫描、自动删除等安全设计，定位为成为企业知识/研究平台的基础。
> 相关链接：Perplexity 沙箱｜更多细节

行业与公司动态

Anthropic 调整 Claude 订阅定价，OpenAI 趁机推 Codex 企业促销

Anthropic 把订阅费等价转为 API 点数，用第三方工具不再划算；同时将 Claude Code 周限制提高 50%。OpenAI 给企业用户两个月免费 Codex，抢客户。4 月商业采用率 Anthropic 34.4% 首次超 OpenAI 32.3%。
> 相关链接：Claude 程式化点数公告｜Claude Code 周限制提高｜OpenAI 企业促销｜Sam Altman 推文｜市场份额数据

Recursive 公司成立：目标是用 AI 自动化科学并安全自我改进

由 Richard Socher、Josh Tobin 等联合创立，团队来自开放研究、AI Scientist 等领域，计划构建能自动做实验、写论文、改进自身的 AI 系统。
> 相关链接：Recursive 发布｜Josh Tobin 介绍

政策、治理与安全

UK AISI：网络安全任务难度每几个月翻倍，Claude Mythos 首次通关全部测评

英国 AI 安全研究所报告前沿模型能完成的网络安全任务长度持续加速。Claude Mythos Preview 是首个完成所有端到端测评范围的模型（含 Cooling Tower），且在 250 万 token 上限内全部通过。XBOW 也发现数千个高/严重漏洞。
> 相关链接：UK AISI 报告｜Claude Mythos 表现｜XBOW 漏洞发现