点击收听语音版
6月22日,由Transformer发明者之一Llion Jones等共同创立的日本AI企业Sakana AI正式发布旗舰级编排模型Fugu。Fugu的核心卖点在于"无需承担出口管制风险的前沿能力"——它本身不直接生成答案,而是通过预训练语言模型作为骨干,动态调度全球最顶尖的大语言模型池(包括GPT-5.5、Claude Opus 4.8、Gemini 3.1 Pro等)来完成复杂的多步骤任务。
Fugu会基于隐藏状态为池中每个工作模型输出logits,并行运行一个轻量级选择头与基础模型语言模型头,根据任务特性自适应分配子模型。在最严格的SWE-Bench Pro和Terminal Bench 2.1基准测试中,Fugu-Ultra相较次优模型提升幅度达到5%–6%,达到当前最优水平;这一幅度与Claude从Opus升级到Fable的大版本提升相当。在科学推理任务中,Fugu的表现甚至超过了Mythos Preview和Fable 5。Fugu及其旗舰版Fugu-Ultra均通过OpenAI兼容API提供服务,其中Fugu-Ultra可协调更深入的专家智能体池,应用于AI研究、网络安全分析和专利调查等高要求工作。
这一发布距离Anthropic Fable 5和Mythos 5因美国出口管制全球下线仅过去10天,被业界视为对"模型霸权"和"出口管制"双重压力的最直接对冲方案。
6月22日端午假期后首个交易日,港股AI大模型龙头智谱开盘即涨超13%,盘中一度冲高至2980港元/股,最高涨幅超过42%,最终收报2410港元/股,单日涨幅15.09%,总市值正式突破1.07万亿港元,成为港股历史上首家市值站上万亿门槛的AI大模型公司。
上市不到半年,智谱总市值从上市时的528亿港元一路飙升至当前的万亿规模,累计涨幅超过1900%。
本轮暴涨的催化剂是6月17日开源的GLM-5.2模型——这款744B总参数、40B激活的MoE架构大模型在Code Arena盲测中登顶全球可用模型第一,在Design Arena网页设计评测中以Elo 1360分超过Claude Fable 5,在FrontierSWE真实软件工程任务评测中与Claude Opus 4.8的差距收窄至1个百分点。
马斯克在X平台与智谱创始人唐杰的一段对话——马斯克预测中国将在2027年一季度追上顶尖水平,唐杰回应"不需要那么久"——进一步点燃市场情绪。
瑞银分析师认为,智谱估值溢价的底层逻辑是"全球模型厂商上市标的稀缺+尚未进入解禁期+较低流动性"。
不过市场也关注到,智谱7月8日将有2568.16万股解禁,解禁市值约269.14亿港元,叠加2025年47.18亿元净亏损的现实,万亿市值能否撑住将进入实战检验期。
6月21日,OpenAI计划发布GPT-5.6系列的消息得到进一步确认,多位Pro订阅用户已在X平台反馈可访问GPT-5.6 Pro版本。
GPT-5.6系列将包含mini、标准版、Pro三个版本,核心升级包括:上下文窗口从100万token扩展至150万token,并新增三项Agent能力——视觉复刻代码(直接看截图生成UI)、SVG 3D对象生成、Playwright浏览器自动化(让AI直接操控浏览器完成网页操作)。
在实测中,GPT-5.6 Pro将复杂项目任务的耗时从小时级压缩到20–40分钟,前端与Web开发的认知深度显著增强。该系列定价预计仅为Claude Fable 5的三分之一,延续了OpenAI一贯的降价策略。OpenAI此次预计将放弃传统发布会形式,采用静默灰度测试上线,整体发布窗口锁定在6月22日至28日。
此次发布是GPT-5.5之后的又一次大版本升级,时间节点恰好卡在OpenAI 6月8日秘密提交S-1招股书、9月正式上市的窗口期,被业界视为为IPO节奏铺路的重要产品背书。
面对开源社区GLM-5.2等的紧逼,Anthropic急需一张新牌稳住基本盘。6月22日,名为"claude-sonnet-5"的域名已在Anthropic合作伙伴的网站上现身,内部代号为"Fennec"的下一代主力模型最快将在下周正式发布。
Fennec主打编程能力与100万token上下文窗口,重点强化推理速度与性价比,预计在编程性能、速度、性价比三方面将同时优于当前的Opus和Fable系列。
同日,爆料人Andrew Curran进一步透露,距第一代Mythos发布仅两个月,代号可能为Mythos 5.1或6的全新版本已在内部完成训练。
这意味着,在Fable 5和Mythos 5因美国出口管制而被迫对外国用户全面下线的背景下,Anthropic反而进入了疯狂的迭代加速期,意图通过新模型重新夺回市场主导权。
值得关注的是,6月22日Fable已重新出现在Anthropic安卓移动端应用的模型选择器中——虽然目前仅限编码场景使用,但这是Fable回归的明确信号。
从战略上看,Anthropic正在用"高端被管制+中端加大投入"的双轨策略应对当前的监管危机。
6月22日,港股"AGI第一股"云知声正式发布通用大语言模型U2,参数规模3000亿,采用快慢思考融合MoE架构,声称以十分之一参数量实现了万亿级参数模型的性能。
U2在LLM Stats榜单中排名第8,在长文本理解权威评测LongBench-V2中以54.4%的准确率超越Claude Opus 4.7,售价仅1.9元。
云知声将U2定位为"为执行而生的原生智能体大模型",可自主拆解并完成超过100步的复杂真实工作流,跳出参数竞赛模式。从技术路线看,U2的核心创新在于融合快思考(快速响应)与慢思考(深度推理)的双系统架构,模型能够根据任务复杂度自动切换思考模式,在保证响应速度的同时处理需要多步规划的长链路任务。
云知声此次定价策略延续了国产大模型从DeepSeek V4到智谱GLM-5.2一贯的"质优价廉"路线,1.9元的售价在主流商用大模型中处于极低水位,有望在中小开发者和企业用户中迅速铺开。
6月21日,特斯拉CEO埃隆·马斯克在X平台回复用户提问时首次明确表示,由xAI开发的AI助手Grok将通过自然语言语音指令直接对接FSD(全自动驾驶)规划层,该功能预计"大约3个月左右"上线,目标窗口锁定在2026年9月前后。这意味着特斯拉车主未来可通过语音直接向车辆下达驾驶指令,无需再依赖触摸屏或方向盘按键操作。
Grok语音控制FSD将实现三大核心功能:
这是Grok首次直接参与车辆控制层,对系统安全性和可靠性提出更高要求。
如果Grok能在约定期限内完成FSD适配,特斯拉将成为全球首个实现"全语音自动驾驶交互"的量产车企。
同日,马斯克将X平台昵称改为"groklon rust"配合Grok语音模式正式上线造势,Grok语音模式已覆盖所有iOS用户及Android平台的SuperGrok订阅者,提供11种声音(含2种18+模式)和"Storyteller""Unhinged"等个性化角色。
6月22日,第四届中国国际供应链促进博览会(链博会)在北京中国国际展览中心启幕,会期6天。
本届链博会首次将"数字科技链"升级为"数智科技链"并设立人工智能专区,按照"数据与感知—算力与算法—应用与解决方案"全链条进行展陈。共有676家参展商参与,其中外资企业占比36.5%,世界500强及行业龙头企业占比超过65%,超过160项首发、首展、首秀成果集中亮相。英伟达、英特尔、高通、阿里巴巴等中外科技领军企业均参展。
在先进制造链展区,西门子展台的"AI驱动赋能应用"展区集中呈现了多款工业AI智能体方案,其中"楼宇深度运维助手"以大模型和自然语言交互为核心,支持楼宇状态监测、数据分析和智能预测,实现楼宇系统无人化、自主化智能运维;中国中化"未来智造"板块呈现了人形机器人的完整材料解决方案图谱,有机硅仿真皮肤材料、超高性能纤维(强度可达钢丝10倍)等人形机器人核心材料悉数亮相。
本届链博会还展示了北京具身智能"悟界·RoboBrain"大模型、戴纳科技"AI+黑灯实验室"(每天最高可完成2000个样本、1万多个实验的检测)、灵心巧手(最轻的灵巧手仅370克但能提起50公斤重物)等代表性成果。
6月21日,字节跳动Seed团队提出的SpatialTree框架被计算机视觉顶级会议CVPR 2026正式收录。SpatialTree通过构建层次化的空间语义树结构,旨在将视觉、语言与几何信息进行统一编码,以解决当前多模态大模型在空间理解、3D场景推理、跨视角定位等方向上的核心瓶颈。
该框架是字节跳动在空间智能方向上的重要布局,标志中国团队在大模型空间智能领域进入国际第一梯队。同期,字节还披露了Seed团队在视频生成、代码大模型方向的最新进展,CVPR 2026将于6月下旬在美国西雅图召开。
从产业意义上看,空间智能是具身智能、自动驾驶、AR/VR等前沿场景的核心技术底座——只有让AI真正理解三维空间结构,才能让机器人在真实世界中执行任务、让自动驾驶系统理解复杂路况、让AR眼镜在真实空间内正确叠加虚拟信息。
SpatialTree的入选意味着字节跳动正在从应用层向底层空间感知技术延伸,是其AGI布局的又一关键拼图。
6月22日,世界模型国际权威榜单WorldArena更新排名,中国科学院工业人工智能研究所徐凯研究员带领物理智能团队(The PAI Lab)自研的世界模型PAIWorld以72.31的总分登顶榜首。
WorldArena是针对具身世界模型的全方位评价体系,涵盖视觉质量、运动质量、内容一致性、物理遵循、三维准确性及可控性六大维度,汇聚了来自李飞飞领衔的WorldLab、谷歌、英伟达、斯坦福大学、智元机器人、北京人形机器人创新中心、高通、小米等几乎所有全球头部世界模型的同台竞技。
PAIWorld在Motion Smoothness(运动平滑性)指标上以95.41分名列前茅,在Trajectory Accuracy(轨迹准确性)单项上大幅领先第二名7.4分。
技术亮点方面,PAIWorld以"几何先验驱动+多视角时空联合建模"为核心设计思路,包括三维几何先验注入、几何旋转位置编码(Geo-RPE)、多视角注意力机制等创新。在多物体交互场景和铰链交互场景中,PAIWorld展现出精准的预测能力和准确的物理理解能力,标志着中国科学院在具身世界模型这一前沿赛道上达到国际领先水平。
6月22日,Figure AI公布Q2最新数据:公司机器人数量已达约740台,正式超过公司员工人数(650人)。配合产线提速24倍、新一代成本下降九成的进展,Figure AI被业内视为具身智能首个跨过量产拐点的标志性企业。
同日,工信部和国资委联合启动人形机器人实景实训计划,2026年底目标完成百个高价值场景验证和万台级规模落地,具身智能从示范展示走向常态化部署阶段。
从行业整体看,2026年上半年具身智能领域融资额已超过460亿元,达到2024年全年的3.36倍,其中过半资金投向具身大脑(VLA模型)。全国具身智能相关企业突破万家,2025年新增企业增长37%。人形机器人正从实验室Demo走向工厂产线,Figure AI、特斯拉Optimus、宇树、智元、星海图等头部企业的产线扩张速度明显加快。
资本市场对这一拐点信号反应积极,"物理AI第一股"上市首日高开302%,反映出资方对具身智能商业化前景的强烈信心。
6月18日,Adobe正式将AI助手全面集成到Creative Cloud套件中,Photoshop、Premiere、Illustrator、InDesign和Frame.io均已配备专属AI聊天机器人,即日起开启公开测试。每个应用拥有专属的AI Assistant,可帮助用户完成编辑、设计等任务;同步推出Firefly AI重新设计的AI工作室,支持"持久上下文、可复用资产和有序工作流";Firefly新版本进入私有测试阶段。
Adobe此次全栈AI化标志着专业创意软件正式进入"AI原生"时代。在此之前,Figma、Canva等设计工具已经先后引入AI能力,但Adobe作为全球最大专业创意软件厂商的全栈跟进,意味着设计、视频、出版等创意行业的工作流正在被AI系统性重塑。
从产业影响看,专业创意软件厂商的AI化与AI原生工具(如Midjourney、Sora)的崛起形成两股并行的力量——前者将AI嵌入既有工作流,后者从零开始构建AI优先的产品形态。两条路径都在加速创意行业的AI渗透,设计师的角色将从"执行者"逐步转向"创意决策者和AI协作管理者"。
6月22日,成立仅10个月的国产AI for Computing初创公司智子芯元正式官宣完成数千万元天使+轮融资,由鼎峰科创(武岳峰创投)、英诺科创基金、首程资本领投,老股东同创伟业等机构超额追投。
距离该公司拿到数千万元天使轮融资不到两个月,两轮累计融资近亿。智子芯元通过"大模型+运筹优化+算法自动发现"的技术范式,打造能够全面掌控复杂计算系统的智能体,将横跨软硬件各层级的复杂度从人类工程师手中全面接管。
核心产品KernelCAT(Kernel Computation Automation Toolkit)自动化计算加速平台,能把用户的自然语言需求转化为可执行、验证与交付的优化流程。在KernelBench基准测试中,智子芯元的Kerminal智能体取得SOTA成绩,正确率、平均加速比与几何平均加速比三项核心指标均位居榜首。
典型案例显示,reshape_and_cache_kernel_flash算子从vLLM CUDA版本迁移到昇腾后,性能从14us优化到2.58us,提升5.4倍;DSDP分子盲对接模型完成CUDA生态向鲲鹏平台的迁移适配后,推理性能提升138倍。在国产算力生态中,智子芯元承担起了"国产算力精装修商"的角色,是AI芯片厂商、大模型厂商、云厂商、AIDC和政企私有化客户之间不可或缺的关键中间层。
北京智源人工智能研究院发布具身智能大模型"悟界·RoboBrain",能够适配机器人等实体设备,让机器人自主识别环境、学习操作、完成复杂任务,并通过语音交互实现自然沟通。
智源院长王仲远表示,人工智能正从大语言模型到多模态模型,再到面向真实物理世界的世界模型演进;从对话工具逐渐成长为能够执行任务、参与科研的智能体。
这是北京从"会聊天"到"会干活"、从知识服务到任务执行、从数字空间走向物理世界全链条加速成形的缩影。
截至目前,北京已布局10余家世界一流新型研发机构,培育一批具身智能领军企业,落地全国首个"AI+黑灯实验室",累计备案上线大模型241款,数量居全国首位。
在政策层面,2025年北京率先发布科学智能专项政策和具身智能行动计划,2026年发布《高端科学仪器创新发展行动计划》,推进"AI+"赋能仪器创新。
从应用层面看,戴纳科技"AI+黑灯实验室"每天最高可完成2000个样本、1万多个实验的检测任务;灵心巧手最轻的灵巧手仅370克但能提起50公斤重物,月产千台;罗森博特与积水潭医院联合研发的智能化骨科手术机器人已在全国50余家三甲医院落地,完成千余例临床手术。北京的AI产业格局正从虚拟走向实体,具身智能成为最关键的战略落点。
6月22日Pew Research发布最新民调显示,49%的美国人至少偶尔使用AI聊天机器人(较2024年的33%上升16个百分点),但63%的受访者认为AI技术发展速度过快。这一数据反映AI普及与公众信任之间的鸿沟正在持续扩大。
同日,欧洲传来与之形成对照的政策信号:挪威政府宣布全面禁止小学生在校使用生成式AI,成为欧洲在AI教育治理方面的最新案例。挪威此举与其邻国丹麦、瑞典的渐进式管理形成鲜明对比,被业界视为欧洲AI教育治理"最严一刀"。
从全球AI教育治理图谱看,挪威是"全面禁止派",中国多地出台中小学AI使用指引区分课堂辅助与作弊边界,欧洲多国采取"严格规范派",美国则呈现"地方自治+联邦观望"的多样化态势。
教育领域的AI治理分歧,本质上是"如何让学生既能用上AI工具提升学习效率,又能避免认知依赖、学术诚信风险"这一核心问题的不同回答。在AI失业焦虑持续蔓延、AI工具渗透率不断攀升的双重背景下,如何在教育系统中为学生建立"问题定义、批判判断、跨领域整合"等不可被AI替代的核心能力,已成为各国教育政策的共同考题。