Agent 与工具链 OpenAI 开源 Agents SDK 架构 OpenAI 将 Agent 编排框架开源,计算与存储分离。支持第三方沙箱执行,不再绑定 OpenAI 基础设施,方便复用 Codex 风格 Agent。 > 相关链接:官方发布|
模型与能力 Claude Opus 4.7 正式发布 Anthropic 上线最强模型 Opus 4.7,主打长任务、代码和指令遵循。平台与 App 已立即可用,API 同步开放。 > 相关链接:正式发布|上线状态</
模型与能力 **Moonshot 发布 Kimi K2.6 开源模型 1T 参数 MoE(32B 激活),256K 上下文,支持 INT4 量化。SWE-Bench Pro 58.6 分,支持 4000+ 工具调用和 12 小时长运行。vLLM、OpenRouter 首日支持。 > 相关链接:发布线
模型与能力 OpenAI 发布 GPT-Image-2,文字渲染大升级 正式上线 API 和 ChatGPT,分思考和非思考版本。文字细节和一致性很强,Arena 榜单全类别第一。Figma、Canva 等已集成。传闻 Sora 团队为此解散。 > 相关链接:发布信息|
模型与能力 Qwen3.6-27B 开源:小模型超越大模型 阿里发布 Qwen3.6-27B,Apache 2.0 开源。编码能力超越更大的 397B 模型,SWE-bench Verified 得分 77.2。支持思考/非思考模式及多模态,vLLM、Ollama 已首日支持。 > 相关链接:官方发
行业与公司动态 OpenAI 解除 Azure 独占,即将上线 AWS 微软仍是主云,但 OpenAI 可跨云分发产品,协议延至 2032 年。AWS 确认几周内上线 Bedrock,旧版 AGI 独占条款失效。 > 相关链接:Sam 宣布|AWS 确认 GitHub Copilot 6 月起改用用
基础设施与硬件 vLLM 0.20 发布:主打显存与 MoE 效率 vLLM 更新 v0.20,支持 2-bit KV cache 使容量翻 4 倍,重启 FA4 支持 MLA。端到端延迟降低 2.1%,简化了 DeepSeek V4 在 Blackwell 上的部署。 > 相关链接:vLLM 发布
基础设施与硬件 CPU 算力需求被低估,可能出现短缺 Intel CEO 指出 CPU 更新周期遇上 AI 代理需求,预算全砸 GPU 导致 CPU 维护不足。Noam Brown 和 Sam Altman 也认为推理算力是战略资源,未来可能面临 CPU 短缺。 > 相关链接:Intel CEO 财
模型与能力 OpenAI 上线 GPT-5.5:更强代理能力与 1M 上下文 OpenAI 发布 GPT-5.5,API 价格$5/$30每百万 token,Pro 版$30/$180。支持 1M 上下文,终端基准测试 82.7%,SWE-Bench Pro 58.6%。token 效率比 5.4
#### **模型与能力** ##### **DeepSeek V4 发布:100 万上下文与 MIT 开源** DeepSeek 发布 V4 Pro 和 Flash 模型,支持 100 万 token 上下文,采用 MIT 许可。Pro 版性能接近 Opus 4.5,Flash 版价格极低。技术报