AI 新闻摘要 2026-06-17

模型与能力

Z.ai 发布 GLM-5.2：744B 开源 MoE 模型，前端编码能力全球第二

Z.ai 推出 MIT 许可的 GLM-5.2，744B 参数 MoE 架构（每 token 激活 40B），1M 上下文，支持 high/max 两种推理模式；在 Code Arena 前端编码榜排第2（仅输 Fable 5），Design Arena 第1，FrontierSWE 第3，终端操作 Terminal-Bench 达 81.0（+19 分）。
> 相关链接：官方发布｜Design Arena 排名｜Code Arena 前端榜单

GLM-5.2 推理优化：IndexShare 降 2.9× FLOPs，MTP 提升 20% 接受率

通过 IndexShare 技术（复用索引器跨 4 层稀疏注意力），GLM-5.2 在 1M 上下文下实现单 token 计算量降低 2.9 倍；多 token 预测（MTP）接受率提升最高 20%，显著加速长上下文推理。
> 相关链接：技术细节说明｜性能对比分析

GLM-5.2 API 定价不变：$1.4/$4.4 每百万输入/输出 tokens

API 价格与 GLM-5.1 一致，Agent Arena 明确标价为 $1.4（输入）/$4.4（输出）每百万 tokens，远低于主流闭源模型（如 Opus/GPT 级别）的报价。
> 相关链接：Agent Arena 定价页

Agent 与工具链

Cursor 推出 Origin：专为 AI 编程代理设计的 Git 托管平台

Cursor 发布 Origin，支持代理级合并冲突处理、MCP/API 扩展、团队协同编程，专为长周期代码代理工作流优化，已开放测试。
> 相关链接：官方公告｜产品介绍

Cloudflare 推出 Agents SDK：支持 CDP 浏览器自动化与可恢复执行

新 SDK 允许 Agent 直接控制 Chrome DevTools Protocol（CDP），支持断点续跑、状态持久化和浏览器任务自动重试，降低 Web 自动化失败率。
> 相关链接：Changelog

LangChain JS 新增流式转换器：实时修改/过滤 Agent 输出流

开发者可在 Agent 响应生成过程中动态 redact 敏感词、重写格式或插入中间逻辑，无需等待完整响应，提升安全与可控性。
> 相关链接：GitHub PR

基础设施与硬件

DeepSpeed 修复长期精度 Bug：解决混合精度下长上下文 RoPE 失效问题

deepseek==0.19.2 修复了 FP16/BF16 混合精度训练中 RoPE 缓冲区精度丢失问题，影响所有依赖长上下文的位置编码模型。
> 相关链接：GitHub Issue 修复说明

Together 推出 Decagon：语音 Agent 成本降近 6 倍，p95 延迟 <400ms

基于 Blackwell GPU 的定制方案，结合微调开源模型、提示缓存、自研 speculator，将语音交互 Agent 单轮成本压至原方案 17%，延迟控制在 400ms 内。
> 相关链接：技术博客

研究与方法

ExpRL 提出直接 RL 中间训练法：过程+结果双奖励优于 SFT 和 GRPO

跳过传统 SFT 阶段，用 LLM Judge 对训练中每步动作打分（过程奖励）和最终结果打分（outcome 奖励），数学任务 priming 效果显著超越 SFT 和 GRPO。
> 相关链接：论文摘要

LoPT 实现首个严格无损并行分词：速度提升 4–5×，输出与串行完全一致

新分词算法 LoPT 支持 32 进程并行，不牺牲任何 token 匹配精度，已在多个开源 tokenizer 中验证 100% 输出一致性。
> 相关链接：技术报告

产品与应用落地

Microsoft Copilot Cowork 正式 GA：企业级长周期 Agent 工作流上线

支持多模型切换、跨会话记忆、预算管控和 MCP 接入，已面向全球客户开放，重点用于客服、IT 支持和销售助理等长流程场景。
> 相关链接：官方公告

Databricks 推出 Unity AI Gateway：统一管控 Agent 预算、护栏与 MCP 权限

作为 Lakehouse 平台核心组件，Gateway 支持按团队/项目设置推理预算上限、内容安全策略，并集成 MCP（Model Control Protocol）认证体系。
> 相关链接：Summit 演讲摘要

行业与公司动态

SpaceX 以全股票方式收购 Cursor，估值 600 亿美元

双方已联合训练新模型，将集成进 Cursor 和 Grok Build，交易完成后 Cursor 保持独立运营，但技术路线深度绑定 SpaceX AI 战略。
> 相关链接：SpaceX 官方确认｜Cursor 确认声明

Cohere 加速英国布局：员工扩至三倍，主打‘主权 AI’获政府背书

伦敦团队规模扩大三倍，与英政府合作推进本地化部署方案，强调数据不出境、模型可控、符合 UK GDPR，被纳入国家 AI 基础设施计划。
> 相关链接：官方新闻稿

政策、治理与安全

美国限制 Anthropic 前沿模型出口：UK 请求豁免被拒，触发开源替代讨论

美方拒绝向英国提供 Anthropic 最新模型的出口许可；多家机构指出，此类管制正推动企业转向 GLM-5.2 等 MIT 许可开源模型，规避地缘风险。
> 相关链接：政策分析｜开源替代呼吁

Anthropic 发布 Claude Code 经济学报告：专家仅比中级用户高 7% 成功率

分析显示，软件工程师在编码任务上成功率仅比中级用户高 7 个百分点；平均任务价值 4 个月内增长 27%，但职业间差异极小。
> 相关链接：研究报告