【菩提树AI每日早报】2026年6月25日

PromptTree|阅读 2
2026/06/25 08:23
OpenAI博通AI推理芯片Jalapeño火山引擎豆包2.1AnthropicClaude Tag高通MetaModularGemini 3.5世界经济论坛达沃斯论坛MirendilAI美的智能体
1. OpenAI与博通联合发布首款定制AI推理芯片Jalapeño; 2. 豆包大模型2.1发布,编程/Agent/VLM三大方向生产级质变; 3. Anthropic推出Claude Tag,企业Slack协作AI新范式获Karpathy力挺; 4. 高通投资者日:全面转型AI数据中心,Meta签多代CPU大单、39亿美元收购Modular; 5. 谷歌Gemini 3.5 Pro发布时间推迟至7月,长文本与智能体能力升级; 6. 2026夏季达沃斯在大连举办:AI与机器人成核心议题,相关议程超30个; 7. MirendilAI融资2亿美元打造"可构建系统的系统",估值100亿美元; 8. 美的智能体工厂出海方案发布:13个智能体覆盖25场景; 9. OpenRouter周度Token调用创新高,国产大模型Token出海加速。

点击收听语音版

1. OpenAI与博通联合发布首款定制AI推理芯片Jalapeño

当地时间6月24日,OpenAI与半导体巨头博通联合发布首款定制AI推理芯片Jalapeño。这是一款专为大语言模型推理设计的专用集成电路(ASIC),从最初设计到完成流片仅用9个月时间,创造了AI芯片从立项到流片的最快行业纪录。

分工上,OpenAI负责底层架构设计,博通负责硅片实现与网络硬件,加拿大电子制造服务商Celestica负责板卡与机架系统的集成。开发过程中,OpenAI甚至采用自家AI模型加速芯片设计本身。

Jalapeño芯片工程样片已以量产目标频率和功耗,在实验室中跑通了GPT5.3、Codex和Spark等核心工作负载;早期测试显示,其每瓦性能将优于当前最先进水平,详细技术报告将在未来几个月内发布。

架构上,Jalapeño通过优化数据流动、均衡配置计算/内存/网络资源,使实际利用率更接近理论峰值性能。

OpenAI总裁格雷格·布罗克曼表示,Jalapeño是OpenAI长期全栈基础设施战略的一部分。博通CEO陈福阳则称这是跨越数代路线图的开端,将助力微软及其他合作伙伴自2026年起部署千兆瓦级数据中心。该芯片计划2026年底前实现首次规模化部署。从战略意义看,Jalapeño的发布意味着OpenAI正式打破纯软件与算法的局限,与谷歌TPU、Anthropic+AWS/谷歌阵营形成三足鼎立的算力格局。

2. 字节豆包大模型2.1发布,编程/Agent/VLM三大方向生产级质变

6月23日,2026夏季火山引擎FORCE原动力大会在北京举办,集中发布豆包大模型2.1以及视频、图像、音频等多款新模型。豆包2.1 Pro在Coding(编程)、Agent(智能体)、VLM(视觉语言模型)三大核心方向实现能力跃升。

火山引擎总裁谭待现场展示了模型的核心能力:在芯片设计RTL测试中,豆包2.1 Pro连续运行近18小时、经历9轮迭代,跑通仿真、测试、综合检查等完整工程流程;模型可同时调度500余个智能Agent在3D虚拟城市场景中协作,生成超百栋建筑。

评测显示,豆包2.1 Pro在Terminal Bench 2.1、SWE-Pro、SciCode等代码评测中进入第一梯队;在OSWorld、MobileWorld、MMMU-Pro等Agent与多模态评测中位居全球前列。

火山引擎披露,截至今年6月,豆包大模型日均Token调用量已突破180万亿,过去一年增长超10倍;超110万企业使用火山方舟服务,年Token调用量超1万亿的企业已达200家。豆包2.1 Pro定价为输入6元/百万Tokens、输出30元/百万Tokens,综合使用成本较Claude Opus 4.6降低近80%;同时上线Doubao-Seed-Evolving版本,将以每月2至4次的频率快速迭代。火山引擎以49.5%的市占率位居中国公有云MaaS市场第一。同日首次亮相的Seedance 2.5视频生成模型,预计7月正式上线,可一次性融合最多50种不同类型素材,生成长达30秒视频,将在工业制造、自动驾驶和机器人训练领域落地。

3. Anthropic推出Claude Tag,企业Slack协作AI新范式获Karpathy力挺

当地时间6月23日,Anthropic正式发布Claude Tag,将其定位为Claude Code的进化版本,是面向企业团队协作的"AI虚拟团队成员"。Claude Tag率先在Salesforce旗下Slack平台上线,配置对频道的访问权限后,团队任意用户只需在Slack中@Claude,即可委派任务。Claude Tag会读取频道上下文、调用已授权工具、拆解任务并异步推进,甚至能主动监控频道动态、跟进搁置线程、在条件满足时主动通知。该能力由Claude Opus 4.8模型驱动,目前以beta形式面向Claude Enterprise和Team客户开放,将取代现有Claude in Slack应用。

最具说服力的是,Anthropic产品团队65%的代码已由Claude Tag内部版本生成,应用场景从工程延伸至产品指标追踪、客服工单、复杂Bug根因定位等。

前特斯拉AI总监、刚加入Anthropic的安德烈·卡帕西(Andrej Karpathy)在X平台盛赞:Claude Tag代表LLM用户界面的第三次重大重构,第一次是ChatGPT式的对话框,第二次是Claude Code式的命令行Agent,第三次则是嵌入式AI队友。

三家头部厂商正在押注不同的Agent未来:OpenAI走Workspace Agents无代码路线,谷歌把Gemini长进Workspace全家桶,Anthropic则押注"嵌入式队友",强调安全叙事与企业系统连接。

4. 高通投资者日:全面转型AI数据中心,Meta签多代CPU大单、39亿美元收购Modular

当地时间6月24日,高通在纽约举行2026投资者日活动,正式发布面向AI数据中心的Dragonfly产品家族,并宣布与Meta达成覆盖多个产品世代的战略合作协议,Meta CEO扎克伯格亲自确认高通将成为Meta未来的数据中心CPU供应商。同时披露微软Azure将部署其高带宽计算(HBC)芯片,搭载AI250加速器的第一代HBC平台将于2027年中开始商业采样。Dragonfly C1000数据中心CPU将于2028年中正式推出,Meta成为首批部署客户。

此外,高通还推出AI300新一代AI加速器及PAM4/光互联解决方案,构建CPU+AI加速器+网络的完整产品矩阵;预计数据中心业务2027财年贡献数十亿美元收入。

硬件扩张之外,高通本周稍早宣布以约39亿美元全股票交易收购AI软件公司Modular,补齐AI软件生态短板。Modular拥有Mojo编程语言、MAX推理平台、AI编译器技术及模型优化工具链,前身由前谷歌工程师创立,市场普遍视此次收购为高通复制英伟达CUDA生态护城河的关键举措。

从智能手机芯片龙头到AI基础设施竞争者,2026投资者日标志着高通正式向AI数据中心时代全面转型。

5. 谷歌Gemini 3.5 Pro发布时间推迟至7月,长文本与智能体能力升级

谷歌下一代前沿AI模型Gemini 3.5 Pro的发布时间已从原计划的6月推迟至7月。

知情人士透露,谷歌推迟上线是为了留出更多时间收集早期测试用户反馈并对模型进行优化调整。Gemini 3.5 Pro在5月I/O开发者大会上预热发布时,CEO桑达尔·皮查伊称其将于"次月"上线,但当时便表示模型尚未完全就绪。已有部分用户可通过谷歌Antigravity平台及LMArena提前体验该模型,谷歌还将近期推出的Flash 3.5模型的用户反馈融入Gemini 3.5 Pro,其中包括对Flash版本token消耗过快的改进。

全新的Gemini 3.5 Pro预计在长文本任务与驱动智能体两大方向实现性能提升。

尽管去年Gemini 3的表现超出预期,但Anthropic与OpenAI在代码生成领域持续领跑谷歌,而代码开发已成为当代AI首个主流企业落地场景。

Gemini 3.5 Pro推迟发布,反映出大模型厂商在竞争白热化阶段对模型质量与稳定性的优先级调整。

6. 2026夏季达沃斯在大连举办:AI与机器人成核心议题,相关议程超30个

6月23日至25日,世界经济论坛第十七届新领军者年会(2026夏季达沃斯论坛)在辽宁大连举办,主题为"规模化创新"。来自90多个国家和地区的1700余名嘉宾参会,人工智能与机器人相关议程超过30个,覆盖金融、艺术、服务等多领域。

首场公开分论坛"AI无处不在,却非一蹴而就"座无虚席,中国移动首席科学家冯俊兰、清华大学苏世民书院院长薛澜、万宝盛华集团CEO约纳斯·普里辛格等嘉宾就AI规模化落地的硬件建设、监管规则、全球合作展开讨论。国际能源署(IEA)预测,全球数据中心年耗电量将从2024年的约415太瓦时增长至2030年的约945太瓦时;宁德时代董事长曾毓群提出,AI规模化发展需依托清洁能源体系。

达沃斯期间,智平方创始人兼CEO郭彦东发布全球首个类脑具身智能系统NeuroVLA,借鉴人脑工作机制让机器人具备记忆、学习与自主进化能力,可通过更少数据完成决策;追觅科技CEO俞浩在"机器人走进千家万户"专题讨论中提出,新一代科技企业需解决核心技术、丰富场景、商业化闭环三大关键问题。美的集团同期在泰国发布"智能体工厂出海解决方案",整合72个AI应用及13大智能体在25个场景的落地成果,赋能越南、埃及、巴西等制造基地。

世界经济论坛同步公布《2026年十大新兴技术》报告,量子模拟药物发现、万物互联电网等列入其中。

7. MirendilAI融资2亿美元打造"可构建系统的系统",估值100亿美元

6月24日,人工智能初创企业Mirendil以100亿美元估值完成2亿美元融资,募集资金将用于打造可自主加速AI研发的"可构建系统的系统"。本轮融资由安德森·霍洛维茨基金(a16z)与凯鹏华盈(Kleiner Perkins)领投,英伟达(NVIDIA)参与投资。

Mirendil的20人创始团队全部来自Anthropic、xAI、DeepMind及OpenAI等头部AI实验室,具备从前沿模型研发到工程化落地的完整经验。Mirendil聚焦"自加速AI研发"这一前沿方向,其核心理念是让AI系统不仅能完成人类定义的研发任务,还能自主识别研发瓶颈、提出改进方案并执行迭代,最终构建一个能够自我进化、持续提升研发效率的AI研发闭环。

100亿美元估值对于一家20人规模、刚完成首轮融资的初创公司而言,反映出一线资本对"AI加速AI"这一方向的强烈看好。本轮投资方阵容兼具顶级风投与产业资本:a16z是硅谷最具影响力的AI早期投资机构,Kleiner Perkins是硅谷老牌风投的代表,英伟达的参与则代表着AI算力供应商对潜在颠覆性技术路径的战略卡位。

在大模型公司估值持续抬升的当下,Mirendil的出现意味着AI产业的投资热点正从模型层向研发自动化、模型自我迭代等更深层的基础设施方向延伸。

8. 美的智能体工厂出海方案发布:13个智能体覆盖25场景

6月22日,美的集团在泰国正式发布"智能体工厂出海解决方案",将其国内已跑通的智能体工厂模式系统化输出至越南、埃及、巴西等多个海外制造基地。

方案整合72个AI应用及13大智能体在25个核心业务场景的落地成果,可拆解为12个模块快速复制。

该方案的核心验证来自美的家用空调泰国工厂,该工厂占地约45个标准足球场,是美的在海外规模最大的空调生产基地之一。

工厂内部署"AI大脑"与13个智能体,覆盖25个核心业务场景,在智能体调度下实现从备料到出货的全链条协同,2025年年产能突破500万套,超过多数中等国家的全年空调需求。

智能体工厂的核心架构是"工厂大脑+多智能体"协同:全厂数据实时汇总,AI大脑结合订单要求、产线负荷、物料情况做全局最优决策,向生产调度、物流配送、工艺优化、质量检测等智能体下发指令,智能体具备感知、推理、自主决策和自我迭代能力。

以广州南沙美的空调工厂为例,3月空调生产旺季月度产能达110万至120万套,厂房面积未扩充,秘诀在于通过"工厂大脑"将分散的自动化孤岛串联为协同智能网络,异常造成的产线损失时间从每月约700小时压缩至100至180小时。广东省已提出到2026年底建设200家以上智能工厂和智能体工厂,美的的出海方案是中企AI能力从"产品出海"到"产能出海"再到"生态出海"新阶段的代表案例。

9. OpenRouter周度Token调用创新高,国产大模型Token出海加速

据最新统计,OpenRouter平台本周Token调用量持续攀升,连续保持高增速,反映出全球开发者对前沿大模型API的旺盛需求。

在全场景调用排名中,DeepSeek V4 Flash、Hy3 preview与某国产旗舰模型位列前三;编程场景下,MiMo、某国产模型、Hy3进入前三。

国产大模型在全球API调用市场的份额持续提升,DeepSeek V4系列、豆包2.1 Pro、Kimi K2.7、智谱GLM-5.2等通过极致性价比与开源策略,在国际开发者社区的影响力不断扩大。

Token调用数据的持续走高,与近期大模型在编程、Agent、长上下文、视频生成等方向的能力突破密切相关。

豆包2.1 Pro综合使用成本较Claude Opus 4.6降低近80%,GLM-5.2以MIT协议开源、训练推理未依赖海外算力,Kimi K2.7以Claude Opus约1/12的定价提供接近的代码能力——国产大模型正凭借"高质量+低成本+可定制"的组合优势,在全球大模型API市场占据越来越重要的位置。