谷歌DeepMind于6月11日凌晨正式开源DiffusionGemma,这款基于文本扩散(text diffusion)架构的大语言模型是Gemma 4家族的新成员,整体参数规模为260亿的混合专家(MoE)模型,但推理时仅激活38亿参数,采用Apache 2.0协议在Hugging Face开放下载。
DiffusionGemma彻底改变了传统大模型的逐Token生成方式,借鉴Stable Diffusion去噪思路,可一次性并行生成256个Token的完整文本块,借助双向注意力机制让每个Token同时看到上下文,从而支持行内编辑、代码补全、复杂Markdown格式化等非线性场景。实测数据显示,该模型在单张H100 GPU上可实现每秒1000+ Token的生成速度,在消费级RTX 5090上可达每秒700+ Token,在DGX Station上更飙升至每秒2000+ Token,相较同参数规模的自回归Gemma 4 26B A4B提速近4倍。量化后模型可在18GB显存内运行,意味着4090单卡就能本地部署。综合性能方面,DiffusionGemma在LiveCodeBench、BigCodeBench、HumanEval上分别取得30.9%、45.4%、89.6%的成绩,整体与Gemini 2.0 Flash-Lite旗鼓相当,AIME 2025数学推理得分23.3%,但在科学推理等高难度综合测试中仍逊于自回归版本。谷歌CEO皮猜将其比喻为"赛马",强调这是对下一代模型形态的一次实验性探索,业界认为此举有望挑战自回归模型的主流地位,NVIDIA从RTX到H100全线为DiffusionGemma提供支持,vLLM、MLX、Unsloth、NeMo等推理框架已同步适配,llama.cpp适配也在路上。
![]()
美团旗下光年之外团队的AI浏览器Tabbit V1.0于6月11日上线,此时距离项目启动仅过去100天。Tabbit的形态经历了从"地址栏"到"搜索框"再到"对话框"直至"智能体"的四阶段跨越,已接入多家大模型供应方作为底座能力。产品负责人刘炯在发布会现场介绍,5月份数据显示单用户月均Token消耗量已达853万,表明用户正持续高频地将Tabbit应用于重型任务处理和复杂工作流中。Tabbit的快速落地折射出大厂内部"AI Native应用"竞赛已进入新阶段——以浏览器、操作系统为入口,争夺用户在Agent时代的第一触点。同期发布的还有"小U同学3.0",作为OS级AI助手能够跨软件跨应用操控电脑,标志着端侧AI Agent开始打破应用孤岛,向操作系统底层渗透。
摩尔线程于6月11日正式开源MusaCoder代码大模型,包含9B和27B两个参数版本,是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型。此次开源意味着国产GPU不再仅是"能造出来"的问题,更迈过了"有没有人用"的生态门槛。MusaCoder的训练全流程在摩尔线程自研GPU上完成,验证了国产算力在代码大模型这一高负载任务上的可用性,是国产AI算力闭环的重要里程碑。从行业角度看,代码大模型对训练和推理算力的要求均处于第一梯队,MusaCoder的端到端落地意味着国产GPU的CUDA替代路径具备了真实可用的开发者生态样本,为后续更大参数规模的模型迁移提供了工程参考。
![]()
Anthropic于6月9日通过The Information记者Alex Heath等渠道披露了其Claude 5系列公共版本"Claude Fable"的发布计划,6月10日正式向公众推出该模型,6月11-12日中文媒体广泛跟进。Fable 5是Anthropic首次将Mythos级别模型降级后向公众开放,在长链复杂多轮任务处理上表现突出,编程能力进一步增强,宾夕法尼亚大学沃顿商学院教授Ethan Mollick分享了早期使用体验。商业层面,API定价较Mythos版本下调50%,并新增多Agent并发与持久记忆能力,企业级部署成本显著降低。Anthropic同步宣布向美国SEC秘密提交S-1注册文件草案,最新一轮估值约9650亿美元,与OpenAI 8520亿美元估值形成第一梯队双雄格局,传闻最快于今年秋季登陆美股市场。
![]()
月之暗面旗下Kimi于6月11日宣布技术升级,Kimi平台已能通过"Agent集群"机制同时调度300个子Agent协作完成复杂长任务。这一突破意味着AI Agent从"单兵作战"迈入"集群作战"阶段,在研究型任务、多源数据分析、跨工具工作流等场景下,效率相较单Agent执行有望提升数倍。结合同期美团Tabbit、Anthropic Claude Fable 5的多Agent并发能力、OpenAI内部对Agentic Workflow的持续投入,2026年6月已成为多Agent协作的密集爆发期。Kimi的300子Agent同框调度,被业内视为"智能体互联网"雏形的重要信号,预示着下一代AI产品的核心竞争力将从单一模型的智力上限,转向多Agent协同的工程化能力。