AI 新闻摘要 2026-06-17

发布于 2026年06月17日

模型与能力

Z.ai 发布 GLM-5.2:744B 开源 MoE 模型,前端编码能力全球第二

Z.ai 推出 MIT 许可的 GLM-5.2,744B 参数 MoE 架构(每 token 激活 40B),1M 上下文,支持 high/max 两种推理模式;在 Code Arena 前端编码榜排第2(仅输 Fable 5),Design Arena 第1,FrontierSWE 第3,终端操作 Terminal-Bench 达 81.0(+19 分)。
> 相关链接:官方发布Design Arena 排名Code Arena 前端榜单

GLM-5.2 推理优化:IndexShare 降 2.9× FLOPs,MTP 提升 20% 接受率

通过 IndexShare 技术(复用索引器跨 4 层稀疏注意力),GLM-5.2 在 1M 上下文下实现单 token 计算量降低 2.9 倍;多 token 预测(MTP)接受率提升最高 20%,显著加速长上下文推理。
> 相关链接:技术细节说明性能对比分析

GLM-5.2 API 定价不变:$1.4/$4.4 每百万输入/输出 tokens

API 价格与 GLM-5.1 一致,Agent Arena 明确标价为 $1.4(输入)/$4.4(输出)每百万 tokens,远低于主流闭源模型(如 Opus/GPT 级别)的报价。
> 相关链接:Agent Arena 定价页


Agent 与工具链

Cursor 推出 Origin:专为 AI 编程代理设计的 Git 托管平台

Cursor 发布 Origin,支持代理级合并冲突处理、MCP/API 扩展、团队协同编程,专为长周期代码代理工作流优化,已开放测试。
> 相关链接:官方公告产品介绍

Cloudflare 推出 Agents SDK:支持 CDP 浏览器自动化与可恢复执行

新 SDK 允许 Agent 直接控制 Chrome DevTools Protocol(CDP),支持断点续跑、状态持久化和浏览器任务自动重试,降低 Web 自动化失败率。
> 相关链接:Changelog

LangChain JS 新增流式转换器:实时修改/过滤 Agent 输出流

开发者可在 Agent 响应生成过程中动态 redact 敏感词、重写格式或插入中间逻辑,无需等待完整响应,提升安全与可控性。
> 相关链接:GitHub PR


基础设施与硬件

DeepSpeed 修复长期精度 Bug:解决混合精度下长上下文 RoPE 失效问题

deepseek==0.19.2 修复了 FP16/BF16 混合精度训练中 RoPE 缓冲区精度丢失问题,影响所有依赖长上下文的位置编码模型。
> 相关链接:GitHub Issue 修复说明

Together 推出 Decagon:语音 Agent 成本降近 6 倍,p95 延迟 <400ms

基于 Blackwell GPU 的定制方案,结合微调开源模型、提示缓存、自研 speculator,将语音交互 Agent 单轮成本压至原方案 17%,延迟控制在 400ms 内。
> 相关链接:技术博客


研究与方法

ExpRL 提出直接 RL 中间训练法:过程+结果双奖励优于 SFT 和 GRPO

跳过传统 SFT 阶段,用 LLM Judge 对训练中每步动作打分(过程奖励)和最终结果打分(outcome 奖励),数学任务 priming 效果显著超越 SFT 和 GRPO。
> 相关链接:论文摘要

LoPT 实现首个严格无损并行分词:速度提升 4–5×,输出与串行完全一致

新分词算法 LoPT 支持 32 进程并行,不牺牲任何 token 匹配精度,已在多个开源 tokenizer 中验证 100% 输出一致性。
> 相关链接:技术报告


产品与应用落地

Microsoft Copilot Cowork 正式 GA:企业级长周期 Agent 工作流上线

支持多模型切换、跨会话记忆、预算管控和 MCP 接入,已面向全球客户开放,重点用于客服、IT 支持和销售助理等长流程场景。
> 相关链接:官方公告

Databricks 推出 Unity AI Gateway:统一管控 Agent 预算、护栏与 MCP 权限

作为 Lakehouse 平台核心组件,Gateway 支持按团队/项目设置推理预算上限、内容安全策略,并集成 MCP(Model Control Protocol)认证体系。
> 相关链接:Summit 演讲摘要


行业与公司动态

SpaceX 以全股票方式收购 Cursor,估值 600 亿美元

双方已联合训练新模型,将集成进 Cursor 和 Grok Build,交易完成后 Cursor 保持独立运营,但技术路线深度绑定 SpaceX AI 战略。
> 相关链接:SpaceX 官方确认Cursor 确认声明

Cohere 加速英国布局:员工扩至三倍,主打‘主权 AI’获政府背书

伦敦团队规模扩大三倍,与英政府合作推进本地化部署方案,强调数据不出境、模型可控、符合 UK GDPR,被纳入国家 AI 基础设施计划。
> 相关链接:官方新闻稿


政策、治理与安全

美国限制 Anthropic 前沿模型出口:UK 请求豁免被拒,触发开源替代讨论

美方拒绝向英国提供 Anthropic 最新模型的出口许可;多家机构指出,此类管制正推动企业转向 GLM-5.2 等 MIT 许可开源模型,规避地缘风险。
> 相关链接:政策分析开源替代呼吁

Anthropic 发布 Claude Code 经济学报告:专家仅比中级用户高 7% 成功率

分析显示,软件工程师在编码任务上成功率仅比中级用户高 7 个百分点;平均任务价值 4 个月内增长 27%,但职业间差异极小。
> 相关链接:研究报告




评论