AI 新闻摘要 2026-04-28

发布于 2026年04月30日

行业与公司动态

OpenAI 解除 Azure 独占,即将上线 AWS

微软仍是主云,但 OpenAI 可跨云分发产品,协议延至 2032 年。AWS 确认几周内上线 Bedrock,旧版 AGI 独占条款失效。
> 相关链接:Sam 宣布AWS 确认

GitHub Copilot 6 月起改用用量计费

因 Agent 工作流消耗更多运行时,GitHub 宣布 6 月 1 日起转向用量计费。开发者需关注成本变化。
> 相关链接:官方公告

Codex 用量倍数曝光,5.5 快版消耗更高

GPT-5.5 fast 消耗是 5.4 的 1.25 倍。Sam 认为 20 美元档仍有价值。
> 相关链接:用量数据


模型与能力

GPT-5.5 评测数据出炉,互有胜负

WeirdML 67.1% 优于 5.4,但落后 Opus 4.7。LMSYS 代码榜第 9,数学第 3。
> 相关链接:社区评测

小米开源 MiMo-V2.5,1M 上下文

MIT 协议,Pro 版约 42B 激活参数,主打复杂 Agent 与代码。vLLM 已支持推理。
> 相关链接:发布信息

Kimi K2.6 登顶 OpenRouter 周榜

主打代码与长程 Agent,支持 300 并发子 Agent 协调 4000 步骤。
> 相关链接:榜单信息

中国模型集体转向 Agent 与长上下文

Qwen 3.6 Flash、DeepSeek V4/Flash、GLM-5.1 纷纷促销或更新。
> 相关链接:Qwen 更新


产品与应用落地

GPT-Image-2 集成 Codex,边写代码边生成

支持教育、信息图及创意场景,低幻觉多模态推理能力强。作为 Codex 技能可迭代生成。
> 相关链接:应用案例


Agent 与工具链

OpenAI 开源 Symphony 编排层

连接 issue 追踪器到 Codex Agent,实现问题→Agent→PR→人工审查流程。
> 相关链接:开源发布

Sakana 发布 7B Conductor 调度模型

用 RL 训练,专门调度其他大模型。LiveCodeBench 得分 83.9%。
> 相关链接:论文发布

Gemma 4 实现纯本地浏览器 Agent

基于 WebGPU,支持原生工具调用管理标签页与总结页面。无需云端。
> 相关链接:演示

Devin 推出终端本地版 Agent

可在本地 Shell 运行,必要时移交云端处理。
> 相关链接:产品更新

Hermes Agent 仓库热度超 Claude Code

原生视觉支持成为默认选项。
> 相关链接:热度对比


基础设施与硬件

Google TPU v8 拆分训练与推理芯片

分为 8t(训练)和 8i(推理),推理性价比提升 80%。
> 相关链接:架构分析

vLLM 更新支持 DeepSeek V4 与 FP8

0.20.0 版本加入 FP8 KV 缓存优化,长上下文检索准确率从 13% 提升至 89%。
> 相关链接:版本发布


研究与方法

Agent 评测转向开放世界任务

新研究关注不可自动验证的工作、持续学习与记忆存储。
> 相关链接:观点文章

成本感知评测成为第一梯队指标

研究发现 Agent 编码消耗 token 是聊天的 1000 倍,经济性成关键考量。
> 相关链接:研究

LlamaIndex 发布 ParseBench 文档基准

新增 2k 验证企业文档页面,专门评测解析 Agent 能力。
> 相关链接:基准发布




评论