行业与公司动态
Midjourney 宣布进军医疗硬件:推出全身体检超声CT扫描仪及配套水疗中心
Midjourney 发布原型级‘Midjourney Scanner’——全球首个水浸式全身体检超声CT设备,宣称分辨率可达0.5mm;同步宣布在旧金山联合广场建首家‘Midjourney Spa’(2027年底开业),含9–10台扫描仪,定位为健康数据采集实验室而非纯医疗机构。
> 相关链接:Latent Space 技术解析|Midjourney 官方技术说明
Noam Shazeer 加入 OpenAI,离开 Google
Transformer、T5 和 Switch Transformer 共同作者 Noam Shazeer 正式加入 OpenAI。Sam Altman称其为‘OpenAI创立以来最想合作的人之一’。业内视其为2026年最重要AI人才流动事件。
> 相关链接:Noam Shazeer 原推文|Sam Altman 庆祝推文
模型与能力
GLM-5.2 成首个突破 Terminal-Bench 2.1 80% 分数的开源权重模型
智谱 GLM-5.2 在 Terminal-Bench 2.1 上得分81.0,首次超越80%门槛,领先所有其他开源模型(如Qwen、Llama 3.1),但略低于闭源模型Claude Opus(85.0)和GPT-5.5(84.0)。
> 相关链接:Reddit 原帖
VibeThinker-3B 小模型性能逼近 Gemini 3 Pro 等大模型
30亿参数的 VibeThinker-3B 在推理任务上达到 DeepSeek V3.2、GLM-5 和 Gemini 3 Pro 同档水平,主打可验证推理能力,适合资源受限场景。
> 相关链接:PapersWithCode 趋势榜
Agent 与工具链
GitHub Copilot Auto 模式启用动态模型路由机制
Copilot 现在会根据代码复杂度、调试难度、推理深度等实时选择最适配模型,不再固定用单一模型,提升响应质量与效率。
> 相关链接:官方博客与论文
PreAct 提出‘可回放状态机’代理架构
新方法将成功 Agent 运行编译成带防护的状态机,重复执行时无需调用大模型,回放速度提升8.5–13倍,降低推理开销。
> 相关链接:DAIR AI 推文
基础设施与硬件
Fal 发布 Kling 3.0 Turbo:支持 4K 全分辨率生成与 15 秒长视频
Kling 视频生成升级:生成更快、成本更低、唇形同步更好、运动更稳定;‘Omni’模式强化提示与参考图一致性,支持多镜头分镜工作流。
> 相关链接:Fal 官方公告
Xenova 展示 WebGPU 上 Gemma 4 达 255 tok/s 浏览器推理
基于已关停的 Fable 5 项目,Xenova 实现 Gemma 4 在浏览器端通过 WebGPU 达到 255 token/秒,验证了轻量级 Agent 内核优化对端侧推理的显著加速潜力。
> 相关链接:Xenova 演示发布
研究与方法
John Schulman 解析 PPO 在 LLM 时代复兴的三大原因
PPO 回归主因不是原论文设想的策略梯度稳定性,而是重要性采样比修正数值误差、异步训练缓解延迟、前向噪声增强鲁棒性,以及裁剪隐式调控熵。
> 相关链接:Schulman 技术分析
LLM-as-Environment-Engineer:用失败自动重构训练环境
新RL范式让策略模型利用自身失败案例,动态重设计下一轮训练环境(如MAPF-FrozenLake),实现闭环自进化训练。
> 相关链接:DAIR AI 推文
产品与应用落地
Kimi Code Web 恢复上线,开发者可重新接入
月之暗面 Kimi 编程助手网页版(Kimi Code Web)已恢复服务,此前短暂下线后重新开放使用。
> 相关链接:生态简报
政策、治理与安全
Midjourney 扫描仪暂未获 FDA 批准,首阶段聚焦‘身体成分分析’
Midjourney 明确表示当前设备尚未通过FDA认证,初期仅瞄准监管路径较短的‘身体成分分析’类非诊断用途;疾病筛查、诊断及治疗功能均属远期目标。
> 相关链接:Latent Space 风险分析