模型与能力
DeepSeek V4 发布:100 万上下文与 MIT 开源
DeepSeek 发布 V4 Pro 和 Flash 模型,支持 100 万 token 上下文,采用 MIT 许可。Pro 版性能接近 Opus 4.5,Flash 版价格极低。技术报告获高度评价,兼容华为昇腾芯片。
相关链接:发布信息|技术报告|评测汇总
Qwen 3.6 27B 本地表现强劲
Qwen 3.6 27B 在本地设备上表现优异,代理任务指标持平 Sonnet 4.6。用户反馈 27B 版本比 35B 编码更准确,适合本地部署。
相关链接:性能评测|社区讨论
GPT-5.5 全面接入 API 与工具
OpenAI 将 GPT-5.5 推送到 API 及 Cursor 等生态,上下文增至 100 万。编码效率提升,Token 用量减少,用户反馈代码质量更高。
相关链接:官方发布|Cursor 集成
Agent 与工具链
Hugging Face 推出 ML Intern
HF 发布开源 CLI 工具 ML Intern,能自动 research 论文、写代码及运行实验,支持最多 300 步迭代,提升开发效率。
相关链接:工具介绍
Hermes Agent 更新 v0.11
Hermes 发布新版本,重写 React 界面,支持更多推理提供商及图像后端,快速适配 DeepSeek V4 和 GPT-5.5。
相关链接:更新日志
Cursor 支持多任务子代理
Cursor 新增多任务异步子代理及多根工作区功能,进一步优化复杂开发场景下的工作流管理。
相关链接:功能发布
基础设施与硬件
Meta 扩容 AWS Graviton 核心
Meta 宣布增加数千万 AWS Graviton 核心,用于扩展 Meta AI 及代理系统,以支持数十亿用户规模。
相关链接:官方公告
NVIDIA Blackwell 首日支持 V4
NVIDIA 宣布 Blackwell Ultra 上 V4 Pro 可实现 150+ TPS 交互速度,并发布 vLLM 性能基准,优化推理效率。
相关链接:性能基准
DeepSeek 开源 DeepEP V2
DeepSeek 发布 DeepEP V2 和 TileKernels,优化模型并行化技术,声称可实现线性扩展,提升训练与推理效率。
相关链接:开源项目
研究与方法
Token 选择蒸馏新论文
新研究显示仅用 50% Token 训练可达到全量效果,内存减少 47%,聚焦置信度低的 Token 效果更佳。
相关链接:论文解读
MIT 提出 Hyperloop 架构
MIT 研究混合循环与普通 Transformer 块,参数减少 50% 但在多规模基准上表现优于常规 Transformer。
相关链接:研究详情
Google 发布 MesaNet 与机器人研究
Google Research 推出 MesaNet 优化内存序列层,并展示机器人 3D 推理及诚实性推理演示。
相关链接:ICLR 演示
行业与公司动态
谷歌拟投资 400 亿美元给 Anthropic
据报道谷歌计划向 Anthropic 投资高达 400 亿美元,引发对其算力承诺及市场格局变化的讨论。
相关链接:媒体报道
ComfyUI 融资 3000 万美元
ComfyUI 完成 3000 万美元融资,估值 5 亿美元,将继续保持核心开源及本地定位。
相关链接:融资新闻
Cohere 联手 Aleph Alpha
Cohere 与 Aleph Alpha 宣布加拿大与德国主权 AI 合作,聚焦企业级隐私与安全需求。
相关链接:合作公告
Mechanize 融资 910 万美元
自动化公司 Mechanize 宣布融资 910 万美元,投后估值 5 亿美元,专注工作流自动化。
相关链接:融资详情
政策、治理与安全
OpenAI 设立生物安全赏金
OpenAI 针对 GPT-5.5 推出生物漏洞赏金计划,鼓励发现模型在生物安全领域的潜在风险。
相关链接:安全计划
Anthropic 测试模型谈判能力
Anthropic 启动 Project Deal,让 Claude 代表员工进行谈判,探讨模型质量不对称及政策挑战。
相关链接:项目介绍
产品与应用落地
Kling 支持原生 4K 输出
Kling 宣布支持原生 4K 视频生成,并举办 2.5 万美元短片比赛,推动高质量视频内容创作。
相关链接:产品更新
GPT Image 2 工作流优化
社区展示 GPT Image 2 结合 Seedance 2 的高保真图转视频流程,支持 2K/4K 图像生成。
相关链接:工作流展示