AI 新闻摘要 2026-05-14

Agent 与工具链 Cline 开源全新 SDK,打造可复用编码 Agent 底层 Cline 发布完全重构的开源 SDK,附带 CLI/TUI、Agent 团队、定时任务和连接器,让开发者能基于它构建自定义编码 Agent,定位为可复用的编程助手基础框架。 > 相关链接:Cline SDK 发布

coolplus
发布于 2026年05月17日

AI 新闻摘要 2026-05-13

模型与能力 多项前沿基准发布:数学、医学、编程和语音评测再升级 Soohak发布了由64位数学家从头编写的439道研究级数学题,难度超过奥赛;SophontAI的Medmarks v1.0将医学基准从20个扩到30个、模型从46个扩到61个;ProgramBench第一个任务被GPT-5.5 hig

coolplus
发布于 2026年05月17日

AI 新闻摘要 2026-05-12

模型与能力 Thinking Machines 发布交互模型 TML-Interaction-Small 这家公司推出了 276B 参数(12B 激活)的 MoE 模型,专门为实时语音和视频交互设计。它能同时听、看、说、思考,200ms 内做出反应,还支持打断和主动提醒(比如“你开始驼背了”),在多

coolplus
发布于 2026年05月13日

AI 新闻摘要 2026-05-09

模型与能力 OpenAI 两周内连发 GPT-5.5 系列模型 OpenAI 在两周内密集发布了 gpt-image-2、GPT-5.5、5.5 Pro、5.5 Instant、GPT-Realtime-2 以及网络安全版 GPT-5.5 Cyber。DHH 和 gdb 称赞其高效简洁,Arena

coolplus
发布于 2026年05月11日

AI 新闻摘要 2026-05-06

行业与公司动态 模型厂扎堆搞服务公司:Anthropic 与 OpenAI 新动作 Anthropic 联合黑石等成立合资公司(融资 15 亿),OpenAI 成立 The Deployment Company(融资 40 亿)。两家都发现光卖模型不够,得下场帮企业做落地部署和定制,赚最后一公里的服

coolplus
发布于 2026年05月06日

AI 新闻摘要 2026-05-04

模型与能力 Grok 4.3 发布:便宜了但幻觉多了 xAI 发布 Grok 4.3,输入降价 40% 输出降价 60%,智能指数升 4 点到 53。GDPval 任务表现强,但非幻觉准确率降了 8 个点,可靠性受质疑。 > 相关链接:基准分析|

coolplus
发布于 2026年05月05日

AI 新闻摘要 2026-05-02

📰 AI 新闻摘要 2026-05-02 模型与能力 Grok 4.3 发布:降价明显,但幻觉增加 xAI 发布 Grok 4.3,输入降价 40%,输出降价 60%。智能指数升至 53,代理任务能力增强,但非幻觉准确率下降 8 个点。社区评价两极,有人觉得进步快,有人担心可靠性。 DeepSee

coolplus
发布于 2026年05月02日

AI 新闻摘要 2026-04-16

Agent 与工具链 OpenAI 开源 Agents SDK 架构 OpenAI 将 Agent 编排框架开源,计算与存储分离。支持第三方沙箱执行,不再绑定 OpenAI 基础设施,方便复用 Codex 风格 Agent。 > 相关链接:官方发布|

coolplus
发布于 2026年04月30日

AI 新闻摘要 2026-04-17

模型与能力 Claude Opus 4.7 正式发布 Anthropic 上线最强模型 Opus 4.7,主打长任务、代码和指令遵循。平台与 App 已立即可用,API 同步开放。 > 相关链接:正式发布|上线状态</

coolplus
发布于 2026年04月30日

AI 新闻摘要 2026-04-21

模型与能力 **Moonshot 发布 Kimi K2.6 开源模型 1T 参数 MoE(32B 激活),256K 上下文,支持 INT4 量化。SWE-Bench Pro 58.6 分,支持 4000+ 工具调用和 12 小时长运行。vLLM、OpenRouter 首日支持。 > 相关链接:发布线

coolplus
发布于 2026年04月30日