【菩提树AI每日早报】2026年6月12日

PromptTree|阅读 2
2026/06/12 08:39
DeepMindDiffusionGemmaAI浏览器Tabbit美团MusaCoder摩尔线程Claude Fable 5AnthropicAgent集群月之暗面Kimi
1. 谷歌DeepMind开源DiffusionGemma:26B MoE文本扩散模型单卡4090可跑,速度较自回归提升4倍; 2. 美团光年之外AI浏览器Tabbit V1.0正式上线; 3. 摩尔线程开源MusaCoder代码大模型:业内首个基于国产GPU算力底座完成全链路训练与验证; 4. Anthropic Claude Fable 5正式发布并向公众开放:Mythos级别首次降级,API定价降50%,新增多Agent并发与持久记忆; 5. Kimi宣布通过"Agent集群"同时调度300个子Agent:长任务执行迈入多Agent协作时代。

1. 谷歌DeepMind开源DiffusionGemma:26B MoE文本扩散模型单卡4090可跑,速度较自回归提升4倍

谷歌DeepMind于6月11日凌晨正式开源DiffusionGemma,这款基于文本扩散(text diffusion)架构的大语言模型是Gemma 4家族的新成员,整体参数规模为260亿的混合专家(MoE)模型,但推理时仅激活38亿参数,采用Apache 2.0协议在Hugging Face开放下载。

DiffusionGemma彻底改变了传统大模型的逐Token生成方式,借鉴Stable Diffusion去噪思路,可一次性并行生成256个Token的完整文本块,借助双向注意力机制让每个Token同时看到上下文,从而支持行内编辑、代码补全、复杂Markdown格式化等非线性场景。实测数据显示,该模型在单张H100 GPU上可实现每秒1000+ Token的生成速度,在消费级RTX 5090上可达每秒700+ Token,在DGX Station上更飙升至每秒2000+ Token,相较同参数规模的自回归Gemma 4 26B A4B提速近4倍。量化后模型可在18GB显存内运行,意味着4090单卡就能本地部署。综合性能方面,DiffusionGemma在LiveCodeBench、BigCodeBench、HumanEval上分别取得30.9%、45.4%、89.6%的成绩,整体与Gemini 2.0 Flash-Lite旗鼓相当,AIME 2025数学推理得分23.3%,但在科学推理等高难度综合测试中仍逊于自回归版本。谷歌CEO皮猜将其比喻为"赛马",强调这是对下一代模型形态的一次实验性探索,业界认为此举有望挑战自回归模型的主流地位,NVIDIA从RTX到H100全线为DiffusionGemma提供支持,vLLM、MLX、Unsloth、NeMo等推理框架已同步适配,llama.cpp适配也在路上。

2. 美团光年之外AI浏览器Tabbit V1.0正式上线,100天研发落地,Token消耗量爆发式增长

ScreenShot_2026-06-12_085441_512.png

美团旗下光年之外团队的AI浏览器Tabbit V1.0于6月11日上线,此时距离项目启动仅过去100天。Tabbit的形态经历了从"地址栏"到"搜索框"再到"对话框"直至"智能体"的四阶段跨越,已接入多家大模型供应方作为底座能力。产品负责人刘炯在发布会现场介绍,5月份数据显示单用户月均Token消耗量已达853万,表明用户正持续高频地将Tabbit应用于重型任务处理和复杂工作流中。Tabbit的快速落地折射出大厂内部"AI Native应用"竞赛已进入新阶段——以浏览器、操作系统为入口,争夺用户在Agent时代的第一触点。同期发布的还有"小U同学3.0",作为OS级AI助手能够跨软件跨应用操控电脑,标志着端侧AI Agent开始打破应用孤岛,向操作系统底层渗透。

3. 摩尔线程开源MusaCoder代码大模型:业内首个基于国产GPU算力底座完成全链路训练与验证

摩尔线程于6月11日正式开源MusaCoder代码大模型,包含9B和27B两个参数版本,是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型。此次开源意味着国产GPU不再仅是"能造出来"的问题,更迈过了"有没有人用"的生态门槛。MusaCoder的训练全流程在摩尔线程自研GPU上完成,验证了国产算力在代码大模型这一高负载任务上的可用性,是国产AI算力闭环的重要里程碑。从行业角度看,代码大模型对训练和推理算力的要求均处于第一梯队,MusaCoder的端到端落地意味着国产GPU的CUDA替代路径具备了真实可用的开发者生态样本,为后续更大参数规模的模型迁移提供了工程参考。

4. Anthropic Claude Fable 5正式发布并向公众开放:Mythos级别首次降级,API定价降50%,新增多Agent并发与持久记忆

e4f2549b490ee22166fb99027211b98c.jpg

Anthropic于6月9日通过The Information记者Alex Heath等渠道披露了其Claude 5系列公共版本"Claude Fable"的发布计划,6月10日正式向公众推出该模型,6月11-12日中文媒体广泛跟进。Fable 5是Anthropic首次将Mythos级别模型降级后向公众开放,在长链复杂多轮任务处理上表现突出,编程能力进一步增强,宾夕法尼亚大学沃顿商学院教授Ethan Mollick分享了早期使用体验。商业层面,API定价较Mythos版本下调50%,并新增多Agent并发与持久记忆能力,企业级部署成本显著降低。Anthropic同步宣布向美国SEC秘密提交S-1注册文件草案,最新一轮估值约9650亿美元,与OpenAI 8520亿美元估值形成第一梯队双雄格局,传闻最快于今年秋季登陆美股市场。

5. Kimi宣布通过"Agent集群"同时调度300个子Agent:长任务执行迈入多Agent协作时代

ScreenShot_2026-06-12_091347_179.png

月之暗面旗下Kimi于6月11日宣布技术升级,Kimi平台已能通过"Agent集群"机制同时调度300个子Agent协作完成复杂长任务。这一突破意味着AI Agent从"单兵作战"迈入"集群作战"阶段,在研究型任务、多源数据分析、跨工具工作流等场景下,效率相较单Agent执行有望提升数倍。结合同期美团Tabbit、Anthropic Claude Fable 5的多Agent并发能力、OpenAI内部对Agentic Workflow的持续投入,2026年6月已成为多Agent协作的密集爆发期。Kimi的300子Agent同框调度,被业内视为"智能体互联网"雏形的重要信号,预示着下一代AI产品的核心竞争力将从单一模型的智力上限,转向多Agent协同的工程化能力。