Agent 与工具链
Cline 开源全新 SDK,打造可复用编码 Agent 底层
Cline 发布完全重构的开源 SDK,附带 CLI/TUI、Agent 团队、定时任务和连接器,让开发者能基于它构建自定义编码 Agent,定位为可复用的编程助手基础框架。
> 相关链接:Cline SDK 发布
LangChain 批量发布 Agent 基础设施,SmithDB 提速 12-15 倍
LangChain 在 Interrupt 大会上推出一系列工具:SmithDB(专为嵌套长 trace 设计的可观测数据库,比通用方案快 12-15 倍)、Sandboxes、Managed Deep Agents、LLM Gateway 等,瞄准生产级 Agent 生命周期管理。
> 相关链接:LangChain 更新|SmithDB 详情
Notion 开放外部 Agent API,支持 Claude、Codex 等直接操作
Notion 推出 External Agents API,允许第三方 AI Agent(如 Claude、Codex、Cursor 等)直接在 Notion 页面内读写数据,让 Agent 共享上下文,不再孤立。
> 相关链接:Notion API 发布
Cursor 升级云代理:自带完整开发环境,支持回滚与隔离
Cursor 让云代理拥有完全配置的开发环境,包括克隆仓库、安装依赖、版本历史、回滚、隔离密钥和出站流量控制,方便处理复杂多文件任务。
> 相关链接:Cursor 更新
研究与方法
Nous Research 提出 Token Superposition Training,预训练提速 2-3 倍
该方法让模型在预训练早期读/预测连续 token 包,之后再切回标准 next-token 预测。不改变推理架构,在 270M 到 3B 密集模型及 10B MoE 上验证有效。
> 相关链接:Nous 论文
多流 LLM 论文:拆分消息流降低延迟,并行推理更清晰
Jonas Geiping 等人认为当前 chat 训练把 Agent 限制在单一流中,提出多流 LLM,能并行推理、工具调用,延迟更低,分离关注更清晰。代码已开源。
> 相关链接:论文与代码
δ-mem 外部记忆模块:冻结主干 + 联想记忆,提升记忆密集型任务
在冻结的全注意力模型上附加在线联想记忆,8×8 状态使平均分提高 1.10×,超越基线 1.15×,在记忆密集型基准上增益更大。
> 相关链接:δ-mem 论文
NVIDIA Star Elastic:一次后训练得到全家推理模型,成本降低 360 倍
只需一次后训练就能生成多种尺寸的推理模型族,成本比从零预训练低 360 倍,比现有压缩方法好 7 倍。
> 相关链接:NVIDIA 发布
Datology:只靠数据筛选,VLM 性能猛涨 11.7 分,训练计算减少 17 倍
通过精心挑选预训练数据,2B 模型在 20 个 VLM 基准上平均提升 11.7 点,超过 InternVL3.5-2B 约 10 点,训练计算仅为其 1/17;4B 模型性能接近前沿,响应 FLOPs 少 3.3 倍。
> 相关链接:Datology 成果
SWE-ZERO-12M:最大开源 Agent 轨迹数据集,112B tokens
由 Kevin Li 发布,包含 12M 条 agent 轨迹、122K 个 PR、3K 个仓库、16 种编程语言,用于训练和评估编码 Agent。
> 相关链接:数据集介绍
产品与应用落地
Figure 机器人直播 8 小时自主分拣:多机协调、自主换电池
Figure 的人形机器人使用 Helix-02 在仓库执行 8 小时无人值守包裹分拣,从像素级视觉推理,约 3 秒/件,可自动换低电量机器人、自我诊断并回退维护,展示了长期多机协同的落地能力。
> 相关链接:Brett Adcock 直播|后续细节
Perplexity 公布硬件隔离沙箱架构,加固企业 Agent 安全
Perplexity 详细介绍了其 VPC 级硬件隔离、短生命代理令牌、外部内容扫描、自动删除等安全设计,定位为成为企业知识/研究平台的基础。
> 相关链接:Perplexity 沙箱|更多细节
行业与公司动态
Anthropic 调整 Claude 订阅定价,OpenAI 趁机推 Codex 企业促销
Anthropic 把订阅费等价转为 API 点数,用第三方工具不再划算;同时将 Claude Code 周限制提高 50%。OpenAI 给企业用户两个月免费 Codex,抢客户。4 月商业采用率 Anthropic 34.4% 首次超 OpenAI 32.3%。
> 相关链接:Claude 程式化点数公告|Claude Code 周限制提高|OpenAI 企业促销|Sam Altman 推文|市场份额数据
Recursive 公司成立:目标是用 AI 自动化科学并安全自我改进
由 Richard Socher、Josh Tobin 等联合创立,团队来自开放研究、AI Scientist 等领域,计划构建能自动做实验、写论文、改进自身的 AI 系统。
> 相关链接:Recursive 发布|Josh Tobin 介绍
政策、治理与安全
UK AISI:网络安全任务难度每几个月翻倍,Claude Mythos 首次通关全部测评
英国 AI 安全研究所报告前沿模型能完成的网络安全任务长度持续加速。Claude Mythos Preview 是首个完成所有端到端测评范围的模型(含 Cooling Tower),且在 250 万 token 上限内全部通过。XBOW 也发现数千个高/严重漏洞。
> 相关链接:UK AISI 报告|Claude Mythos 表现|XBOW 漏洞发现