AI 新闻摘要 2026-06-18

行业与公司动态

Midjourney 宣布进军医疗硬件：推出全身体检超声CT扫描仪及配套水疗中心

Midjourney 发布原型级‘Midjourney Scanner’——全球首个水浸式全身体检超声CT设备，宣称分辨率可达0.5mm；同步宣布在旧金山联合广场建首家‘Midjourney Spa’（2027年底开业），含9–10台扫描仪，定位为健康数据采集实验室而非纯医疗机构。
> 相关链接：Latent Space 技术解析｜Midjourney 官方技术说明

Noam Shazeer 加入 OpenAI，离开 Google

Transformer、T5 和 Switch Transformer 共同作者 Noam Shazeer 正式加入 OpenAI。Sam Altman称其为‘OpenAI创立以来最想合作的人之一’。业内视其为2026年最重要AI人才流动事件。
> 相关链接：Noam Shazeer 原推文｜Sam Altman 庆祝推文

模型与能力

GLM-5.2 成首个突破 Terminal-Bench 2.1 80% 分数的开源权重模型

智谱 GLM-5.2 在 Terminal-Bench 2.1 上得分81.0，首次超越80%门槛，领先所有其他开源模型（如Qwen、Llama 3.1），但略低于闭源模型Claude Opus（85.0）和GPT-5.5（84.0）。
> 相关链接：Reddit 原帖

VibeThinker-3B 小模型性能逼近 Gemini 3 Pro 等大模型

30亿参数的 VibeThinker-3B 在推理任务上达到 DeepSeek V3.2、GLM-5 和 Gemini 3 Pro 同档水平，主打可验证推理能力，适合资源受限场景。
> 相关链接：PapersWithCode 趋势榜

Agent 与工具链

GitHub Copilot Auto 模式启用动态模型路由机制

Copilot 现在会根据代码复杂度、调试难度、推理深度等实时选择最适配模型，不再固定用单一模型，提升响应质量与效率。
> 相关链接：官方博客与论文

PreAct 提出‘可回放状态机’代理架构

新方法将成功 Agent 运行编译成带防护的状态机，重复执行时无需调用大模型，回放速度提升8.5–13倍，降低推理开销。
> 相关链接：DAIR AI 推文

基础设施与硬件

Fal 发布 Kling 3.0 Turbo：支持 4K 全分辨率生成与 15 秒长视频

Kling 视频生成升级：生成更快、成本更低、唇形同步更好、运动更稳定；‘Omni’模式强化提示与参考图一致性，支持多镜头分镜工作流。
> 相关链接：Fal 官方公告

Xenova 展示 WebGPU 上 Gemma 4 达 255 tok/s 浏览器推理

基于已关停的 Fable 5 项目，Xenova 实现 Gemma 4 在浏览器端通过 WebGPU 达到 255 token/秒，验证了轻量级 Agent 内核优化对端侧推理的显著加速潜力。
> 相关链接：Xenova 演示发布

研究与方法

John Schulman 解析 PPO 在 LLM 时代复兴的三大原因

PPO 回归主因不是原论文设想的策略梯度稳定性，而是重要性采样比修正数值误差、异步训练缓解延迟、前向噪声增强鲁棒性，以及裁剪隐式调控熵。
> 相关链接：Schulman 技术分析

LLM-as-Environment-Engineer：用失败自动重构训练环境

新RL范式让策略模型利用自身失败案例，动态重设计下一轮训练环境（如MAPF-FrozenLake），实现闭环自进化训练。
> 相关链接：DAIR AI 推文

产品与应用落地

Kimi Code Web 恢复上线，开发者可重新接入

月之暗面 Kimi 编程助手网页版（Kimi Code Web）已恢复服务，此前短暂下线后重新开放使用。
> 相关链接：生态简报

政策、治理与安全

Midjourney 扫描仪暂未获 FDA 批准，首阶段聚焦‘身体成分分析’

Midjourney 明确表示当前设备尚未通过FDA认证，初期仅瞄准监管路径较短的‘身体成分分析’类非诊断用途；疾病筛查、诊断及治疗功能均属远期目标。
> 相关链接：Latent Space 风险分析