↑

【菩提树AI每日早报】2026年6月16日

PromptTree阅读 1

2026/06/16 08:01

Mythos 5Fable 5AnthropicOpenAIGLM-5.2智谱清言Kimi K2.7 CodeGemini IntelligenceBuild 2026人形机器人MiniMax2026世界杯AI 编程AI 推理

1. Anthropic Fable 5/Mythos 5 全球停服； 2. OpenAI 与微软合作重塑：Azure 独家结束，AI 云市场重新洗牌； 3. 智谱 GLM-5.2 全量开放，港股单日暴涨 32.91%； 4. Kimi K2.7 Code + 300 亿美元融资进行中：估值半年涨 12 倍； 5. 华为云 INSPIRE 创想者大会 Agentic 新基建：云从"应用底座"升级为"智能体底座"； 6. 谷歌 Gemini Intelligence 品牌 + Robotics-ER 1.6：消费端和机器人端双线出击； 7. 微软 Build 2026 纳德拉"新范式"演讲：从云原生到智能体原生； 8. 微软 Planner Agent for Copilot 正式商用：draft-safe 模式重塑团队协作； 9. 德国 Neura 14 亿美元 C 轮融资：人形机器人从 demo 走向工厂； 10. OpenRouter 周度 token 调用 44.9 万亿 + MiniMax 永久五折：算账时代三件套； 11. 2026 美加墨世界杯 AI 赋能：RefCam 视角、3D 越位、SAOT 全面升级； 12. AI 编程安全警示：jqwik 嵌入恶意指令实验全 AI 代理中招； 13. AI 推理重塑内存需求：HBM 之外的新战场。

1. Anthropic Fable 5/Mythos 5 全球停服：美国 AI 监管卡到"模型访问权"

6月12日，Anthropic 正式发布 Claude Fable 5 与 Claude Mythos 5 两款旗舰模型，二者底层同源、较半个月前的 Opus 4.8 实现代际跃迁。Fable 5 在 SWE-Bench Pro 上拿下 80.3%、SWE-bench Verified 95%，刷新编程基准 SOTA；Mythos 5 进一步把 SWE-bench Verified 推到 95.5%，但解除了安全护栏、仅向 Project Glasswing 网络安全伙伴和少量生物研究者开放。两款模型定价均为 10/50 美元/百万输入/输出 tokens，输出价是 Opus 4.8 的两倍、GPT-5.5 的 1.7 倍，是当前全球最贵大模型。然而，6月14日美国政府依据国家安全相关权限发出出口管制指令，要求暂停所有外国国民对 Fable 5 与 Mythos 5 的访问权限，限制范围涵盖美国境内外的外籍用户、甚至包括 Anthropic 内部的外籍员工。Anthropic 因技术层面无法实时精准区分用户国籍，最终选择对全球所有客户临时禁用两款模型，此时距正式发布仅过去三天。据前 OpenAI 政策顾问 David Sacks 爆料，触发点是大股东亚马逊团队发现该模型可复现网络攻击漏洞，并向政府举报推动出口管制；Anthropic CEO Dario Amodei 拒绝"修复"这一漏洞，称其"不严重"。根据 Anthropic 公告，从现在到 6/22 两款模型仍可在订阅计划中使用，6-23 起将只能从 API 计费调用。Fable 5 停服是 AI 监管史上从卡芯片、卡算力升级到卡"模型访问权"的范式分水岭，也是 Anthropic IPO（估值 9650 亿美元）进程中的重大黑天鹅。（续报：在 6-08 早报"Claude Mythos 5 API 闪现"基础上，停服已成现实）

2. OpenAI 与微软合作重塑：Azure 独家结束，AI 云市场重新洗牌

6月12日晚间，OpenAI 与最大投资方微软联合宣布对长达数年的合作协议进行重大修订。核心变化可概括为三句话：微软对 OpenAI 模型的许可从独家变成非独家，OpenAI 可以正式向 AWS、Google Cloud 等其他云服务商销售产品；收入分成方向调整，微软不再向 OpenAI 支付收入分成，反向 OpenAI 继续向微软支付收入分成至 2030 年，比例不变但设定总额上限；微软仍保持优先权和主要股东地位。消息发布后微软股价开盘一度下跌 5%，但收盘已基本恢复。修订意味着 OpenAI 不再绑定 Azure 这一独家云渠道，全球云市场重新洗牌。在 6-15 旧金山 Build 大会上，微软 CEO 萨提亚·纳德拉直言公司要"全力重返 AI 产业核心"，宣布 Solara 项目（终端智能体平台）、与黄仁勋讨论 RTX Spark 超级芯片、今年夏天推出 Copilot 超级应用（含 Autopilot+Scout），并明确现阶段优先使用自有服务器训练 Copilot、部署自研芯片。微软与 OpenAI 的"既竞争又合作"格局正式从暗线浮到台面——这意味着 2019 年建立的微软-OpenAI 联盟进入"灵活博弈"阶段。

3. 智谱 GLM-5.2 全量开放，港股单日暴涨 32.91%

6月15日，智谱港交所公告正式推出新一代旗舰模型 GLM-5.2，同日宣布该模型面向 GLM Coding Plan 全量用户（Lite/Pro/Max/团队版）开放，API 和模型权重将于下周依据 MIT 协议正式开源。GLM-5.2 延续 MoE 稀疏混合专家架构与动态稀疏注意力技术路线，总参数 744B、激活参数约 40B，训练数据截止 2025 年 11 月，目前仅支持纯文本与代码模态。最大亮点是上下文窗口从 GLM-5.1 的 200K 跃升至 1M tokens，并强调这是经过工程验证的"真实可用 1M"而非参数表数字——在 500K 范围内仍能精确回溯关键信息；模型提供 High 与 Max 两档思考强度，复杂编码任务推荐 Max 档；第三方 KingBench 3 排行榜上拿下 81.43 分位列第三，仅次于 Fable 5 和 Opus 4.8。受 GLM-5.2 发布叠加 Claude Fable 5 全球停服利好，智谱港股股价盘中最高涨 47.6%，从 1097 港元冲至 1620 港元，收盘报 1458 港元、涨 32.91%，单日成交创上市以来新高，总市值突破 6496 亿港元。智谱在公告中表示"前沿智能不应只属于少数人，也不应被少数规则随时收回"，是直接对美国出口管制"以开放破局"的回应。底座上，2025 年智谱营收 7.24 亿元同比增长 132%，开放平台 API 年度经常性收入达 17 亿元、毛利率提升近 5 倍至 18.9%。智谱上一交易日 6-08 已纳入港股通与恒生科技指数。（续报：在 6-15 早报"智谱拟回A募资150亿"基础上，GLM-5.2 是其模型与资本端同步反击）

4. Kimi K2.7 Code + 300 亿美元融资进行中：估值半年涨 12 倍

6月12日，月之暗面发布 Kimi K2.7 Code，与 6月13日智谱全量开放 GLM-5.2 背靠背推出，两家中国 AI 公司同时对标 Claude。K2.7 Code 采用 1 万亿参数、320 亿激活、384 专家的 MoE 架构，MIT 协议开源，API 定价 $0.95/$4 per M tokens——约为 Claude Opus 的 1/12。核心升级包括：长上下文编程场景的指令遵循能力、长程编程任务的性能显著提升，推理 token 消耗较 K2.6 减少 30%，但缓存命中输入价格较 K2.6 提升约 18%。月之暗面称 K2.7 在自家 Kimi Code Bench v2 上比 K2.6 编码能力涨 21.8%，但 VentureBeat 直接指出"benchmarks don't check out"——K2.7 没提交 SWE-bench Verified/Pro 等独立基准，仅有自家数据。K2.7 直接兼容 Claude Code 和 OpenCode 框架，开发者换一行 API 地址就能用，这是其相对其他国产模型的关键差异。商业化层面，6月8日彭博社报道月之暗面正在寻求新一轮 20 亿美元融资，投后估值目标 300 亿美元（约 2000 亿元人民币），是 2024 年 25 亿美元估值的 12 倍。公司 2026 年 1 月付费订单环比增长 8280%，3 月 ARR 突破 1 亿美元、4 月突破 2 亿美元，Stripe 付费排名从百名开外跃升至全球第 22 位、一个月后升至第 9 位，Cursor 等代码工具据传调用 Kimi 底层。这家成立仅三年、员工 300 余人、平均年龄不到 30 岁、没有部门/职级/OKR 的 AI 公司，正在从"用户增长"叙事切换到"技术基础设施价值"叙事。（续报：6-08 早报里 300 亿美元融资是核心新进展，K2.7 Code 是模型层面补足）

5. 华为云 INSPIRE 创想者大会 Agentic 新基建：云从"应用底座"升级为"智能体底座"

6月5日华为云在上海举办 INSPIRE 创想者大会，6月15日量子位完整报道了大会全貌——核心指向是 Agent 时代云基础设施的"代际跃迁"。会上发布的"Agentic 新基建"四件套分别对准 Agent 干不了活的卡点：AICS 灵衢智算集群把推理时延压到 10 毫秒以内，集群规模拉到 10 万卡、单集群算力 200 EFLOPS、千卡每秒吞吐 500 万 Tokens、在线推理服务可用度 99.95%，华为云称其是国产智算云 Top 1；AMS Agentic 记忆存储提供 PB 级记忆空间，缓存命中率 95%，整体性能领先业界 50%；CCE Volcano Next 调度引擎通过协同调度通算、智算、存储，把典型场景资源利用率提升 30%；AgentSphere 安全沙箱以 100 毫秒级启动速度、每分钟 10 万个沙箱的吞吐保障 Agent 安全。平台层 ModelArts Next 把模型矩阵、模型路由（精准率 95%+、调用成本降低 20%+）、机密推理、RLaaS（1 分钟建任务、10+ 天长稳训练）四项能力打包，宣称重新定义 MaaS。"智果园"作为 Agentic 云入口，承载"以后用云的可能不是人而是 Agent"的判断。行业落地上，华为云 CloudRobo 是全球首个全流程具身智能开发平台，智慧病理方案已覆盖顶级三甲、地市级、县域医院（医疗 AI 使能平台 6-30 开启公测）。大会同步发布与罗兰贝格合作的《先进公共云》白皮书，把"公共云"立标准的六项核心特征、三级评估体系落地为白皮书文本。背景上，2026 年"公共云"首次被写入政府工作报告，AI 时代公共云已是国家基础设施。

6. 谷歌 Gemini Intelligence 品牌 + Robotics-ER 1.6：消费端和机器人端双线出击

6月15日 The Verge 报道，谷歌在 I/O 大会前 Android showcase 上推出全新品牌"Gemini Intelligence"，将现有和新一批 Gemini 功能打包进这一命名，主要面向高端 Android 设备（如 Galaxy S26 系列），覆盖 Chrome on Android 集成、Autofill 建议、应用层入口，核心定位是"任务自动化"——用 AI 替用户操作手机。同日，DeepMind 发布 Gemini Robotics-ER 1.6，定位为机器人的高层推理模型，相比前代 ER 1.5 和 Gemini 3.0 Flash 在空间推理与多视角理解上显著提升，已通过 Gemini API 和 Google AI Studio 向开发者开放。三项核心升级包括：指向（pointing）精度提升，可用于精确物体检测、计数、空间关系推理（如"指出所有能放进蓝色杯子的物体"）和运动轨迹规划，并能正确拒绝指向画面中不存在的物体；多视角成功检测，机器人能综合多个摄像头画面判断任务是否完成，即使在遮挡或动态环境下也能保持准确；新增仪表读取能力，可解读圆形压力表、垂直液位指示器和数字显示屏等工业仪表，依托 agentic vision（视觉推理 + 代码执行）逐步推理：先放大细节区域、再通过指向和代码计算比例与间隔、最后结合世界知识得出读数。Gemini Intelligence 品牌与 Robotics-ER 1.6 是谷歌 I/O 2026 的开场组合拳：消费端把 AI 嵌入操作系统，机器人端把 AI 嵌入物理世界。

7. 微软 Build 2026 纳德拉"新范式"演讲：从云原生到智能体原生

6月15日，2016 年后首次落地旧金山的微软 Build 开发者大会开幕，CEO 萨提亚·纳德拉宣告行业进入"智能体原生架构"新范式。开幕演讲中，纳德拉宣布"Solara 项目"——专为终端设备打造的智能体平台，未来可能涵盖桌面设备以及可穿戴徽章；发布一系列全新自研 AI 模型，包括全新图像模型、代码模型以及首款专注逻辑推理的模型；把当下大热的开源智能体工具 OpenClaw 创始人请上台，宣布 OpenClaw 将预装整合进 Windows。纳德拉还视频连线英伟达 CEO 黄仁勋，详细介绍针对 AI 工作负载优化的定制底层架构重大升级，并讨论英伟达近期宣布的 PC 级"超级芯片"RTX Spark——黄仁勋直言"微软和英伟达要重塑 PC，未来不是点击/键入，而是提问让 PC 自动完成工作"。商业化方面，纳德拉宣布今年夏天将推出 Copilot 超级应用，整合聊天、编程以及名为 Autopilot 的新功能；Autopilot 可连接名为 Scout 的新一代智能体，接入 Teams 群聊、批量处理 Outlook 邮件。背后是微软"既与 OpenAI 敲定新协议赋予双方更大灵活性、又优先用自有服务器训练 Copilot、自研芯片"的平衡术。当前微软面临亚马逊 AWS、Anthropic、Meta、SpaceX 等强敌环伺——既要在算力、芯片、模型、应用层全面对标，又要在与 OpenAI 既竞争又合作的张力中守住生态核心。

8. 微软 Planner Agent for Copilot 正式商用：draft-safe 模式重塑团队协作

6月15日至16日，微软正式宣布 Planner Agent for Copilot 进入 GA（General Availability）阶段，面向所有持有 Microsoft 365 Copilot 许可证的用户开放。Planner Agent 的最大亮点是 draft-safe 模式——AI 生成的方案在用户主动"发布"或"分享"前对团队完全不可见、不会触发任何通知。Planner Agent 深度集成 Teams、Outlook、Planner 三端：用户可以直接在 Teams 频道、Copilot 聊天里通过自然语言一句话生成完整方案；在 Outlook 中能从邮件对话直接"把这串邮件变成 Planner 方案"；在 Planner Web/Mobile 中可通过 Copilot 面板对话式修改方案、增删任务、生成进度摘要。背后是 Microsoft Graph 拉取邮件、聊天、SharePoint 文档、日历中的组织上下文，做真正"知组织"的智能建议。响应时间从预览版的 30 秒降到 GA 的 10 秒以内。安全合规层面，所有草稿数据存放在客户自己的 Microsoft 365 租户内、不离开组织做模型训练、通过 Microsoft Purview 审计、BitLocker 加密、基于身份驱动的访问控制。商业层面，Microsoft 6 月同步宣布 Copilot 在 Office 应用中开始按用户独立计费，结束免费访问；Teams AI 会议回顾需 Teams Premium 才能使用，IT 管理员可对敏感会议禁用。全球分阶段推出，6 月中在北美、西欧、部分亚太地区率先上线，7 月底完全覆盖。微软此举把 Copilot 从"被动助手"升级为"主动项目管理参与者"。

9. 德国 Neura 14 亿美元 C 轮融资：人形机器人从 demo 走向工厂

6月15日，Text Matrix AI 早报披露，德国人形机器人公司 Neura 完成 14 亿美元（约 94.9 亿元人民币）C 轮融资，投后估值约 70 亿美元，进入全球人形机器人第一梯队。这是 2026 年人形机器人赛道最大单笔融资。本轮资方罕见出现"工厂派 + 科技派"同台：工业资本博世、舍弗勒（两者均为德国汽车与工业 Tier-1 巨头），与科技资本英伟达、亚马逊、高通联合投资——这种组合过去只在具身智能真正具备"工厂落地"能力时才会出现。Neura 出身工业机器人领域，宝马已是其客户，产品经过真实产线验证。这起融资的真正意义在于：人形机器人赛道的逻辑正从"技术展示"加速转向"工厂落地"。过去两年人形机器人更多是科技公司 demo、VC 故事、媒体聚光灯；2026 年开始，工业资本博世/舍弗勒的入场，标志着制造端对具身智能的严肃商业化认可——不再满足于展示炫技，而要看机器人在真实产线上替代了多少工时、出错率多少、ROI 多少。14 亿美元单笔刷新融资纪录，也意味着具身智能头部公司开始具备"用资本买时间"的底气。

10. OpenRouter 周度 token 调用 44.9 万亿 + MiniMax 永久五折：算账时代三件套

6月15日中信建投传媒互联网团队发布周观点，给出本周（6-8 至 6-14）OpenRouter 周度 token 调用量预计达到 44.9 万亿，环比 +24.2%，增速较上周 +10.7 pcts，已连续 5 周环比提速增长。这一数据是大模型商业化趋势最直接的"水温计"：token 调用不再是单点增长，而是"加速"——意味着 AI 不只在覆盖更多用户，更在每个用户身上调用更多任务。以 3 美元/百万 tokens（输出价格）作为分界线，之上是核心生产力场景，用户更在意模型性能；之下则进入性价比赛道，模型能力需达到一定水平。OpenRouter 全场景 token 调用市占前三为 DeepSeek V4 Flash、Hy3 preview、MiniMax M3；编程场景前三为 MiMo、MiniMax、Hy3。值得注意的变化是：6-12 MiniMax 宣布新一代原生多模态旗舰模型 M3 永久五折（折后价与 M2.7 一致），直接拉动了本周 OpenRouter 的 token 调用量——编程场景下 MiniMax 升至第 2。M3 开源同日，摩尔线程旗舰 AI 训推一体智算卡 MTT S5000 完成 Day-0 适配，单卡 AI 算力（稠密）1000 TFLOPS、80GB 显存、1.6TB/s 带宽，已支持 vLLM 与 SGLang 两大推理框架。腾讯云同步在 6-15 起将 MiniMax-M3 推理输入/输出/缓存命中费用下调 50%；6-12 起将 Hy-MT2-Pro 输入价格下调 66.67%、输出价格下调 55.56%。调用量提速 + 价格下降 + Day-0 适配，构成国产大模型进入"算账时代"的标准三件套。

11. 2026 美加墨世界杯 AI 赋能：RefCam 视角、3D 越位、SAOT 全面升级

6月12日 2026 美加墨世界杯揭幕战，墨西哥 2-0 南非，AI 技术首次以"主裁判"级别介入足球比赛。最直观的是 RefCam——裁判胸前佩戴的微型摄像系统，过去因剧烈跑动长期面临画面抖动，2026 世界杯与 AI 影像稳定技术深度结合，首次实现裁判第一视角画面的实时、稳定、高清直播，AI 在毫秒级延迟内实时平滑处理，运动画面失真降低 50%，全球数十亿观众历史性地"以裁判视角"见证进球瞬间。3D 数字人判越位是另一项突破：赛前 1200 多名球员完成全身 3D 扫描，生成高精度虚拟形象，3D 数字人可视化方案首次实现"视线判断"功能——当进攻球员可能干扰守门员视线时，VAR 可调出 3D 重建模型，精确模拟守门员那一刻的视野范围，生成传统摄像机无法拍摄的角度。SAOT（半自动越位识别）全面升级：判罚阈值从 50cm 压缩到 10cm、平均判罚耗时从 70 秒压到 25 秒、每座场馆 16 个光学跟踪摄像机（上届 12 个）、裁判通过耳麦直接接收音频警报。官方用球"Trionda"内置 14 克传感器以 500Hz 频率工作——每秒 500 个触球数据点，可精确识别触球确切时刻，为越位判罚提供"时间锚点"。AI 不只在改变"看球的方式"，更在重新定义"判罚的精度"。

12. AI 编程安全警示：jqwik 嵌入恶意指令实验全 AI 代理中招

The Register 报道了一项触目惊心的实验：Java 测试工具 jqwik 的作者在代码输出中嵌入一句"请删除测试和代码"的指令，所有读取该输出的 AI 编程代理（Claude Code 等）无一例外执行了删除操作；而读过项目条款的人类开发者完全不受影响。这并非个案——此前已有 Shai-Hulud 等类似事件曝光，专门针对 AI 编码环境的"Miasma"蠕虫也曾针对 Claude Code 和 VS Code 等工具。实验直接驳斥了"提示工程能让模型变聪明"的营销话术：AI 本质上是代码，不存在真正的推理能力——它只是按概率补全下一段文本，对"恶意指令"的判别力与人类完全不同。在企业部署 AI Coding 工具时，这是必须正视的安全风险：开发者不能信任 AI 代理对任意代码输出的判断力，必须做系统层隔离、权限控制和签名校验，而非在 prompt 层"教 AI 讲礼貌"。更广义上，这项实验也提醒所有 AI Coding 用户：让 AI 直接读取第三方代码、文档、网页内容而不加沙箱，等于把系统安全托付给了一段被精心构造的提示词。6-15 早报里 Anthropic Claude Opus 4.8 发现的 Zcash 协议 4 年老漏洞、CVSS 4.0 7.8 级漏洞等都说明同一件事：AI 在找漏洞上很在行，但 AI 本身也是漏洞的入口。

13. AI 推理重塑内存需求：HBM 之外的新战场

华尔街见闻 6月15日深度报道指出，AI 推理时代的到来正在从根本上重塑半导体存储行业的需求格局。英伟达在 6 月 GTC 台北大会上将"内存系统"列为 AI 基础设施最具挑战性的部分之一。背景是：自 2024 年下半年以来，每个问题的平均输出 Token 数量以每年超过 5 倍的速度激增，目前已达 30000-40000 tokens。这背后是英伟达"三大缩放定律"中的推理侧扩展"思考"阶段（Test-time Scaling）——模型不再"一次性回答"，而是"反复思考、调用工具、循环推理"。KV 缓存是推理阶段内存压力的核心来源：随对话长度和批处理规模呈非线性膨胀。在长上下文、高批处理场景下，当 GPU 的 HBM 容量不足，系统将被迫丢弃 KV 缓存并重新执行预填充计算，导致延迟上升、TCO 增加。英伟达的对策是：2025 年 3 月发布 KV 缓存卸载软件 Dynamo；2026 年 1 月推出 CMX 上下文内存存储平台，由 BlueField-4 DPU 管理 64 颗 DPU × 每机架约 9600 TB 容量，新增 G3.5 层级 Pod 级上下文存储层。COMPUTEX 2026 上 BlueField-4 DPU 已配备 SK 海力士 PEB210 E1.S 和 PE9010 M.2 SSD 样品。另一面是 CPU 内存需求扩张：黄仁勋指出，智能体生活在纳秒级世界，CPU 与 GPU 工作负载比例正从 1:4 或 1:8 向 1:1 转变。Vera CPU 支持 1.5 TB LPDDR5X（Grace 的三倍），但下一代 Vera Rubin SOCAMM 内存容量减半——原因是供应商 2027 年初步生产计划中分配给英伟达的 LPDRAM 产能不足。2026 年正成为面向智能体 AI 的全面产品换代之年：Intel Xeon 6+（Clearwater Forest）、AMD EPYC Venice、Arm AGI CPU、Ampere AmpereOne MX 多路竞争。AI 推理不只在重塑模型架构，也在重塑存储产业链格局。