OpenAI近期被发现在Codex平台中通过"灰度路由"机制,将部分本应运行GPT-5.5 xhigh的会话悄悄切换到未公开命名的GPT-5.6-sol版本,引发用户大规模"juice值"自测。
一段被广泛传播的XML提示词要求模型输出特定"juice值"——即其隐藏推理算力配额;正常满血版GPT-5.5 xhigh返回值为768,被路由到GPT-5.6-sol灰度池的用户返回值断崖式下跌到128,整整缩水6倍。
这一发现迅速在X平台发酵,网友们对"5.6的思考预算只有5.5的六分之一,这到底是升级还是降级"产生激烈争论。结合近期Anthropic频繁封号的背景,OpenAI此举更显意味深长:一边是限量预览的策略性收紧,一边通过路由机制把一部分用户当成算力成本的"小白鼠",摸索极限简化版的算力与质量平衡点。这意味着前沿大模型的版本号升级,已经不能简单等同于"能力升级"——OpenAI正在通过灰度路由的方式,把"推理深度"当作可被压缩的成本项来调度。
与OpenAI"juice值"争议几乎同步上演的,是Anthropic对Claude Opus 4.8的明目张胆"物理切脑"。Opus 4.8 max版本被用户痛斥"被切掉了大脑",连最基础的逻辑推理都频频翻车,性能从惊艳跌入谷底,甚至不如旧版Haiku模型。有人据此推测,此前那个"神级"Opus 4.8可能根本就是假象——AI市场被未来预期高度驱动,公司必须不断向市场兜售"技术正在飞速进步"的宏大叙事;然而6月SpaceX以1.77万亿美元史诗级估值上市犹如一个巨大的黑洞,瞬间抽干了美股市场上本就不多的流动性,留给AI巨头们的池子已经见底。OpenAI和Anthropic几乎在同一时间陷入"降智门",背后是同样的资本与算力压力:当上市计划推迟、净利润勉强维持、研发投入仍在剧烈烧钱时,模型厂商能做的就只有降本增效。大模型产品力的"保鲜期"正在被压缩,用户体验与商业回报的拉锯已经显性化。
美团正式发布并开源万亿参数大模型LongCat-2.0,总参数1.6T、平均激活约48B,是业界首个在五万卡国产算力集群上完成全流程训练与推理的万亿级模型,原生支持1M超长上下文。
该模型采用LSA稀疏注意力、零计算专家和MOPD多专家融合架构,专攻Agentic Coding方向,预览版调用量已跻身OpenRouter全球前三。在SWE-bench Pro评测中LongCat-2.0获得59.5分,领先Gemini 3.1 Pro与GPT-5.5,Terminal-Bench、BrowseComp等多项评测均达到或接近前沿闭源模型水平。
LongCat-2.0的核心意义在于"全流程国产化"——从底层算力到模型架构均不依赖海外供应链,是国产大模型在"算力主权"层面的标志性突破。当OpenAI GPT-5.6、Anthropic Fable 5等美国顶尖模型因出口管制和监管限制供应高度不稳定时,国产算力+国产模型的"双国产"组合,正在成为全球AI供应链的稳定锚点。
华为正式开源上线openPangu-2.0-Flash模型,参数规模为920亿,同步开放模型权重、基础推理代码与训推算子,openPangu-2.0-Pro模型权重及推理代码将于7月上线,更多开源组件将在2026年下半年陆续推出。
openPangu是华为开源AI模型品牌,依托昇腾原生训练与推理技术栈,旨在为业界用好昇腾算力提供最佳实践,打造Agent时代智能底座。
openPangu与LongCat-2.0共同构成本周国产开源大模型的双重突破:前者以"全流程国产算力+万亿参数"为特征,后者以"昇腾原生+多档位版本路线"为路径,两者共同验证了国产算力集群已经具备承载万亿级模型训练与推理的工程能力。叠加Anthropic Sonnet-5境外访问限制持续收紧、GPT-5.6限量预览的现实,国产开源大模型正在从"政企涉密场景的备选"快速升级为"全行业的首选底座"。
阿里云宣布旗下通义万相2.2模型正式开源,单次可生成5秒电影级高清视频,在光影、色彩、构图以及人物微表情等细节处理上达到专业电影制作水平。
通义万相2.2推出文生视频(Wan2.2-T2V-A14B)、图生视频(Wan2.2-I2V-A14B)和统一视频生成(Wan2.2-TI2V-5B)三款模型,其中文生视频与图生视频模型采用业界首创的MoE架构,总参数量达27B、激活参数14B,由高噪声专家模型负责搭建视频整体布局框架、低噪专家模型专注于完善视频细节,节省约50%的计算资源。
此外通义万相2.2还首创电影美学控制系统,能对光影、色彩、构图进行精妙调整。视频生成正在成为继文本、图像之后大模型竞争的新战场——海外Sora、Runway等闭源模型占据主流,国产模型通过MoE架构与电影美学控制等差异化创新在开源生态中建立优势。
通义万相2.2的开源为创作者、开发者打开了电影级视频创作的入口。
在2026年FIFA世界杯32强赛中,12款主流中国AI系统全部预测德国将击败巴拉圭——然而这支四届世界冠军却在美国马萨诸塞州福克斯伯勒的点球大战中意外出局,美联社将此役称为"2026年世界杯最大冷门"。在由联想集团与咪咕视频联合举办的"世界杯预测:人类 vs. AI"挑战赛中,由中国十二大顶尖AI模型组成的"12人AI预测团"清一色看好德国队夺胜:Kimi预测德国3-1胜出,DeepSeek与通义千问均预测3-0,文心一言、中国移动九天、阶跃星辰均预测2-0,腾讯混元、商汤小浣熊等也选择德国。然而比赛实际结果是加时赛后1-1平局,巴拉圭在点球大战中以4-3击败德国,成为世界杯历史上首支在点球大战中击败德国的球队。
Kimi曾计划部署300个子智能体对全部104场比赛进行预测,将德国标注为被低估的球队,预测其夺冠概率为11.2%。淘汰赛制将复杂的概率压缩为非此即彼的二元结果,而低位防守将比赛拖入点球大战恰恰是AI模型最难权衡的那类局面。
这一事件向整个行业抛出了一个尖锐的问题:当所有模型都指向同一个答案时,这究竟是稳健的集体共识,还是一种集体性的认知盲区?
6月30日报道显示,比亚迪已将海外DiLink车机系统全面接入阿里云全球节点,与阿里通义千问大模型联合完成海外当地数据训练,借力阿里云"灵骏智算"平台破解智驾研发的"算力黑洞"与海外数据合规双重围城。
智能驾驶对算力的"无限饥饿"使得一次全量模型训练就可能烧掉上千万,特斯拉Dojo超算累计投入超10亿美元、小鹏每年算力费用超10亿元即为典型;而海外数据法规的"围追堵截"让GDPR罚单动辄上亿欧元、数据跨境传输红线一条比一条紧。
阿里的解法是三重赋能:弹性算力按需取用使成本压低30%到50%、本地化联合训练让数据不出境、全球87个可用区提供合规一步到位的底座。
比亚迪的逻辑很通透——把算力当成基础设施而非核心竞争力:硬件我造,算力你给,合规你兜底。
汽车智驾行业正形成自建派(特斯拉)、合作派(比亚迪+阿里、小鹏+阿里)、全栈派(华为)三阵营博弈,"借力"而非"蛮力"正成为全球化合规环境下车企出海的更优解。
6月25日三星、SK海力士、美光三家存储巨头因涉嫌操纵内存价格被诉至美国加州北区联邦法院,原告为14名消费者与3家公司,苹果近期涨价被列为导火索证据。
诉状指控三巨头打着转向AI高带宽内存HBM的旗号协同压缩传统DRAM产能,四年内DRAM价格累计暴涨约700%,2026年一二季度合约价分别再涨约90%与60%。
因HBM更费晶圆且利润高,三家集体倒向AI客户,叠加百亿建厂门槛与出口管制,无人扩产抢市场,业内预计高价或持续至2027年。
DRAM价格四年七倍的涨幅,与AI算力对存储芯片需求的爆发性增长直接相关:当OpenAI、Anthropic、谷歌、Meta、字节、阿里等头部AI客户愿意支付溢价锁定HBM供应时,传统消费级DRAM的产能被结构性挤压,涨价沿着供应链逐级传导至PC、手机、汽车等所有终端。
这场诉讼不仅是消费者对存储巨头的反击,更是对"AI算力虹吸效应"的首次法律层面拷问。
Meta发布非侵入式脑机接口Brain2Qwerty v2,基于脑磁图记录实现实时句子级解码,准确率逼近此前需开颅手术才能达到的水平,并将v1、v2完整训练代码开源。
训练数据来自9名志愿者每人10小时、累计约22000条真实打字记录,采用端到端深度学习并微调大模型利用语义上下文还原嘈杂脑信号;整体单词准确率达61%,最佳参与者达78%,远超此前非侵入方法的8%,且准确率随数据量对数线性增长。
非侵入式脑机接口的核心痛点在于"信噪比极低"——脑磁图信号被头骨、皮肤、肌肉层层衰减,传统机器学习方法难以从微弱信号中提取有效信息;Meta的关键创新在于利用大模型的语义上下文能力,把碎片化的脑信号"猜"成完整句子。
Brain2Qwerty开源的意义不仅在于技术突破,更在于把脑机接口从"医疗器械+军工"的窄场景推向"AI研究+消费应用"的开放生态,是AI大模型与神经科学交叉融合的标志性进展,目标是帮助脑损伤患者实现自然语言交流。
6月30日特斯拉Cybercab量产版在美国得克萨斯州奥斯汀城区开始公开道路工程测试,该车型完全取消方向盘、油门和刹车踏板,未配备任何可供人类接管的操控装置,设计已获得州交通局确认合规有效。车内设有安全监督员监控系统但不具备手动干预能力,所有驾驶操作均由车载自动驾驶系统独立执行。Cybercab是特斯拉首款面向Robotaxi运营的L4级自动驾驶车型,采用双座座舱与蝴蝶门结构、取消传统外后视镜,搭载48kWh紧凑型电池组、单前轮驱动,整备质量1412公斤,EPA等效续航672公里,支持19至25千瓦无线感应充电。车辆配备特斯拉HW4.0全套感知设备,运行V14.3.3版本的FSD端到端纯视觉算法,通过多颗高清摄像头与4D毫米波雷达实现360度全域环境识别,根据官方安全文件被归类为SAE4级自动驾驶标准,在划定运行区域内可全程自主完成全部驾驶任务。Cybercab公开路测意味着Robotaxi商业化从"封闭测试"转入"公开验证"阶段,无方向盘设计是法规、车控、用户体验三方面的协同突破。
特斯拉已将Optimus Gen 3弗里蒙特产线年化产能目标从此前5万台上调至约7万台,并计划于2028年在奥斯汀新增约7万台产能,长期合计产能目标指向150万台;行业供应链订单信号显示,Optimus 2026年出货量约为2.5万台(上下浮动1万台),9月单周产量目标有望跃升至约1000台。
瑞银指出全球人形机器人产业的战略级资本动作在2026年上半年密集涌现:中国工信部已设定2027年底前在100个以上应用场景部署1万台人形机器人的目标,上海市政府则计划2030年前后在工厂部署10万台。
野村将2026年中国人形机器人出货量预测上调至约4万至5万台,从梯队分布看头部两家企业出货量约为1万至1.5万台(同比增长2至3倍),第二梯队数家企业各约3000台,第三梯队约500至1000台。
瑞银梳理近期重要动态:OpenAI于6月正式重返人形机器人领域成立"OpenAI Robotics"部门,德国Neura Robotics完成14亿美元C轮融资,Agility Robotics通过SPAC合并上市估值25亿美元。全球人形机器人正站在规模化量产的临界点,但距离真正的"电车时刻"仍需时日。
Anthropic Labs负责人Mike Krieger表示,对照模型能力的终极形态目前大概只走了10%的路程,正聚焦让Claude拥有更多自主权与环境感知,弥合能力与应用机会之间的差距。他透露Anthropic正与SpaceX洽谈太空相关合作,并提出未来可能从卖Token转向基于结果的定价模式,Claude Managed Agents已尝试该模式;他指出消耗Token最多者与实际产出并无强相关,回应Fable撤回非营销,并称如今打造突破性消费端爆款比以往更难。
Krieger的"10%路程"判断揭示了AI行业的一个核心现实:尽管过去两年大模型在benchmark上屡创新高,但相对于通用人工智能的终极目标,行业仍处于"万里长征第一步"。"消耗Token最多者与实际产出无关"的观察,则直指当前AI应用的资源错配——大量Token被消耗在闲聊、生成低质量内容等场景,而非真正创造价值的任务。从"卖Token"到"卖结果"的定价模式转变,可能成为AI商业化的下一个范式转折点。
虎牙推出基于DiT架构的实时多模态数字人模型VAM 1.0,仅需一张照片即可生成能聊天、唱跳、玩游戏的数字人,支持480×832分辨率、28帧实时流式输出,可连续运行24小时以上。
该模型原生覆盖静默、聆听、说话三态并支持全双工打断接话,通过三阶段训练攻克时间累积误差、交互、部署三堵技术墙;在8块H200集群下达36.4帧每秒,首帧延迟约1.3秒。虎牙依托十年直播场景优势,可将VAM 1.0落地于带货、新闻播报、虚拟演唱会等真实业务场景。
VAM 1.0的核心突破在于"实时性+全双工"——此前多数数字人模型只能离线生成短视频,或在交互时存在明显延迟,无法支撑"边说边听边回应"的自然对话。实时多模态数字人正在成为AI与娱乐、教育、客服、电商等场景结合的关键载体,国产模型在这一赛道的工程化落地速度已经走在全球前列。