↑

【菩提树AI每日早报】2026年6月12日

PromptTree阅读 2

2026/06/12 08:39

DeepMindDiffusionGemmaAI浏览器Tabbit美团MusaCoder摩尔线程Claude Fable 5AnthropicAgent集群月之暗面Kimi

1. 谷歌DeepMind开源DiffusionGemma：26B MoE文本扩散模型单卡4090可跑，速度较自回归提升4倍； 2. 美团光年之外AI浏览器Tabbit V1.0正式上线； 3. 摩尔线程开源MusaCoder代码大模型：业内首个基于国产GPU算力底座完成全链路训练与验证； 4. Anthropic Claude Fable 5正式发布并向公众开放：Mythos级别首次降级，API定价降50%，新增多Agent并发与持久记忆； 5. Kimi宣布通过"Agent集群"同时调度300个子Agent：长任务执行迈入多Agent协作时代。

1. 谷歌DeepMind开源DiffusionGemma：26B MoE文本扩散模型单卡4090可跑，速度较自回归提升4倍

谷歌DeepMind于6月11日凌晨正式开源DiffusionGemma，这款基于文本扩散（text diffusion）架构的大语言模型是Gemma 4家族的新成员，整体参数规模为260亿的混合专家（MoE）模型，但推理时仅激活38亿参数，采用Apache 2.0协议在Hugging Face开放下载。

DiffusionGemma彻底改变了传统大模型的逐Token生成方式，借鉴Stable Diffusion去噪思路，可一次性并行生成256个Token的完整文本块，借助双向注意力机制让每个Token同时看到上下文，从而支持行内编辑、代码补全、复杂Markdown格式化等非线性场景。实测数据显示，该模型在单张H100 GPU上可实现每秒1000+ Token的生成速度，在消费级RTX 5090上可达每秒700+ Token，在DGX Station上更飙升至每秒2000+ Token，相较同参数规模的自回归Gemma 4 26B A4B提速近4倍。量化后模型可在18GB显存内运行，意味着4090单卡就能本地部署。综合性能方面，DiffusionGemma在LiveCodeBench、BigCodeBench、HumanEval上分别取得30.9%、45.4%、89.6%的成绩，整体与Gemini 2.0 Flash-Lite旗鼓相当，AIME 2025数学推理得分23.3%，但在科学推理等高难度综合测试中仍逊于自回归版本。谷歌CEO皮猜将其比喻为"赛马"，强调这是对下一代模型形态的一次实验性探索，业界认为此举有望挑战自回归模型的主流地位，NVIDIA从RTX到H100全线为DiffusionGemma提供支持，vLLM、MLX、Unsloth、NeMo等推理框架已同步适配，llama.cpp适配也在路上。

2. 美团光年之外AI浏览器Tabbit V1.0正式上线，100天研发落地，Token消耗量爆发式增长

美团旗下光年之外团队的AI浏览器Tabbit V1.0于6月11日上线，此时距离项目启动仅过去100天。Tabbit的形态经历了从"地址栏"到"搜索框"再到"对话框"直至"智能体"的四阶段跨越，已接入多家大模型供应方作为底座能力。产品负责人刘炯在发布会现场介绍，5月份数据显示单用户月均Token消耗量已达853万，表明用户正持续高频地将Tabbit应用于重型任务处理和复杂工作流中。Tabbit的快速落地折射出大厂内部"AI Native应用"竞赛已进入新阶段——以浏览器、操作系统为入口，争夺用户在Agent时代的第一触点。同期发布的还有"小U同学3.0"，作为OS级AI助手能够跨软件跨应用操控电脑，标志着端侧AI Agent开始打破应用孤岛，向操作系统底层渗透。

3. 摩尔线程开源MusaCoder代码大模型：业内首个基于国产GPU算力底座完成全链路训练与验证

摩尔线程于6月11日正式开源MusaCoder代码大模型，包含9B和27B两个参数版本，是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型。此次开源意味着国产GPU不再仅是"能造出来"的问题，更迈过了"有没有人用"的生态门槛。MusaCoder的训练全流程在摩尔线程自研GPU上完成，验证了国产算力在代码大模型这一高负载任务上的可用性，是国产AI算力闭环的重要里程碑。从行业角度看，代码大模型对训练和推理算力的要求均处于第一梯队，MusaCoder的端到端落地意味着国产GPU的CUDA替代路径具备了真实可用的开发者生态样本，为后续更大参数规模的模型迁移提供了工程参考。

4. Anthropic Claude Fable 5正式发布并向公众开放：Mythos级别首次降级，API定价降50%，新增多Agent并发与持久记忆

Anthropic于6月9日通过The Information记者Alex Heath等渠道披露了其Claude 5系列公共版本"Claude Fable"的发布计划，6月10日正式向公众推出该模型，6月11-12日中文媒体广泛跟进。Fable 5是Anthropic首次将Mythos级别模型降级后向公众开放，在长链复杂多轮任务处理上表现突出，编程能力进一步增强，宾夕法尼亚大学沃顿商学院教授Ethan Mollick分享了早期使用体验。商业层面，API定价较Mythos版本下调50%，并新增多Agent并发与持久记忆能力，企业级部署成本显著降低。Anthropic同步宣布向美国SEC秘密提交S-1注册文件草案，最新一轮估值约9650亿美元，与OpenAI 8520亿美元估值形成第一梯队双雄格局，传闻最快于今年秋季登陆美股市场。

5. Kimi宣布通过"Agent集群"同时调度300个子Agent：长任务执行迈入多Agent协作时代

月之暗面旗下Kimi于6月11日宣布技术升级，Kimi平台已能通过"Agent集群"机制同时调度300个子Agent协作完成复杂长任务。这一突破意味着AI Agent从"单兵作战"迈入"集群作战"阶段，在研究型任务、多源数据分析、跨工具工作流等场景下，效率相较单Agent执行有望提升数倍。结合同期美团Tabbit、Anthropic Claude Fable 5的多Agent并发能力、OpenAI内部对Agentic Workflow的持续投入，2026年6月已成为多Agent协作的密集爆发期。Kimi的300子Agent同框调度，被业内视为"智能体互联网"雏形的重要信号，预示着下一代AI产品的核心竞争力将从单一模型的智力上限，转向多Agent协同的工程化能力。