半导体研究机构SemiAnalysis 6月29日爆料,Lepton AI创始人兼CEO、阿里云前副总裁、英伟达系统软件副总裁贾扬清已从英伟达离职。
距离2025年4月黄仁勋以约7亿美元收购这家仅有20人的团队,刚刚过去一年零两个月。SemiAnalysis将这一变化称为"令人震惊"。
英伟达在GPU云软件栈上的总投入接近20亿美元——12亿美元收购的Run:ai加上7亿美元收购的Lepton,黄仁勋的构想是在AWS、Azure等云厂商之上再建一层属于英伟达的软件平台。贾扬清正是这个计划最核心的执行者。
离职的核心矛盾是开源承诺的背弃:英伟达收购时曾承诺2026年开源Lepton核心软件平台,但最终否决了这一计划。作为Caffe、PyTorch、ONNX等开源AI框架的奠基人,贾扬清深耕开源生态数十年,开源承诺的落空构成根本性的价值观冲突。另一个直接导火索是DGX Lepton运营效果不及预期——2025年中期已基本停止对外运营,从完整的云平台降格为GPU工作负载调度器;品牌改叫DGX Cloud Lepton对接25家以上云合作伙伴,阵仗不小但产品未起。
贾扬清的职业路径几乎就是一部深度学习开源史:清华大学本硕、UC Berkeley博士,博士期间写下Caffe、GoogLeNet/Inception架构共同作者、Google Brain早期TensorFlow参与者、Facebook主导PyTorch 1.0和ONNX、阿里技术副总裁。本月初他以顾问身份加入Hyperbolic Labs——一家做去中心化GPU算力市场的公司,业务方向与其在英伟达负责的DGX Lepton高度重合,几近无缝切换。贾扬清的离职释放了一个强烈信号:GPU硬件垄断无法简单延伸至软件层,英伟达作为硬件霸主向上层软件扩张遇到的阻力比制造GPU更大。
马斯克6月28日在X平台宣布Grok 4.5已在SpaceX和特斯拉内部开启Beta私测,宣称"早期评估显示其性能已接近甚至可能超越Anthropic旗舰Claude Opus"。Grok 4.5基于1.5万亿参数的V9基础模型打造,相比此前Grok 4.3的0.5T参数,一个月内参数规模膨胀了3倍;为强化代码生成能力,xAI在补充训练中特别加入了AI编程工具Cursor的数据。配套的"Grok Build"测试基准也在持续完善,强化学习仍在显著优化模型。
Grok 4.3已于6月15日上线亚马逊Bedrock,加上此前接通的Azure、Oracle和Databricks,主要企业云平台基本铺完。
Grok 4.5另一大亮点是即将与特斯拉FSD深度整合:Grok语音控制FSD功能预计三个月内上线,驾驶员用自然语言即可操控FSD系统的全部行驶逻辑,变道、停车、调整行驶策略无需手动拨杆或点击屏幕。
马斯克放话 更激进的计划——paceX托管全部算力,在2026年剩余时间里每月发布一个"完全从零开始训练"的全新大模型,而非简单迭代;即将于8月发布的V9版本将达到2T参数,Grok 5变体最终将达到10T参数。
从Caffe时代的范式循环到xAI的"火箭工程节奏",马斯克把Grok的迭代速度从季度拉到了月度级。从内部闭环看:SpaceX提供算力、特斯拉提供工业数据、xAI训练模型、再反哺两家公司,这套自循环是OpenAI和Anthropic都复制不了的。但质疑同样存在:SpaceX一边将大量算力出租给Anthropic、谷歌等公司,一边Grok自身团队动荡且用户量下滑,资源分配的合理性存疑;目前所有性能数据均来自xAI内部或马斯克单方面表态,独立第三方机构或公开基准测试的成绩尚未出炉。
6月28日下午,上海智元机器人"精灵G2"在上海临港量产下线,这是智元量产的第1.5万台通用具身机器人,距离第1万台机器人下线仅过去不到三个月。智元3个月完成5000台增量,速度比前1万台的量产阶段明显加快。
智元机器人是国内具身智能赛道头部公司,"精灵"系列是面向工业与商用服务场景的通用人形机器人产品线,本次下线的G2是产品迭代到第二代。具身智能正在从"能不能造出来"快速过渡到"能不能批量造出来"——1万台到1.5万台只用了3个月,意味着供应链、产线节拍、关键零部件的良率与一致性都已经跑通。
智元还同一天宣布拿下两项全球纪录(具体内容官方尚未披露)。从行业逻辑看,2026年具身智能正经历"百机秀、千机产、万台下"的产能跃迁:单台硬件成本快速下行、通用任务能力快速上行、真实部署场景快速扩展,三者形成正反馈。
智元选择"通用具身机器人"作为产品定位,与海外特斯拉Optimus、Figure等头部玩家方向一致,但中国玩家的量产节奏明显更激进。1.5万台不只是产量数字,而是中国具身智能产业链"从样机到商品"的关键拐点。
AI独角兽月之暗面(Moonshot AI)创始人杨植麟6月29日通过官方公众号发布融资事宜严正声明,明确三项核心原则:所有融资活动仅由公司直接负责,未授权任何第三方机构;老股转让必须经公司内部批准;新股融资以实际到账为确认依据,未锁定任何额度。声明直指近期市场上出现的多起假借公司名义的欺诈行为,涉及金额或超千万元。2026年以来月之暗面客服团队累计接到127起关于虚假融资的咨询,其中32起涉及疑似财产损失,单笔金额从5万元到200万元不等,部分欺诈机构通过"内部份额转让""Pre-IPO绿色通道"等名义吸引投资者,甚至伪造创始人签名文件。
月之暗面成立于2023年初,核心产品AI助手Kimi累计用户超5000万,截至2026年6月累计融资超40亿美元,投后估值突破300亿美元,背后集结阿里、红杉资本、腾讯投资等15家顶级投资机构。
AI赛道融资规模在2026年同比增长78%达1200亿元,伴随而来的是欺诈案件数量翻倍——清科研究中心数据显示,2026年上半年AI领域金融欺诈案件涉案金额超30亿元,其中80%涉及第三方中介机构违规操作。
声明发布正值市场传闻公司正在进行新一轮20亿美元融资的敏感节点,杨植麟在内部邮件中强调:"资本是助力而非束缚,我们绝不允许任何人假借公司名义损害投资者利益。"月之暗面此次声明不仅是对自身品牌的保护,也是对整个AI融资市场乱象的警示。
6月29日,被誉为"最像特斯拉"的通用智能机器人公司智平方宣布完成一系列新融资,融资总额近50亿元人民币(约7亿美元),估值飙升至超200亿元,成为粤港澳大湾区首个估值突破200亿元的具身智能企业。同日,成立仅一年的无界动力发布全球首个"长时序双向物理因果链"隐空间世界模型MWA™,在由斯坦福大学等顶尖机构联合发起的RoboCasa GR1 TableTop榜单中以75.2%的平均任务成功率拿下全球第一,超过英伟达GR00T-N1.6等主流模型2.4个百分点。
无界动力坚持"隐空间世界模型+强化学习"技术路线,已完成超2亿美元天使轮,Pre-A轮近2亿美元接近尾声,红杉中国、线性资本、京东关联基金等头部机构重仓;CEO张玉峰此前在地平线担任智驾一号位,主导与大众集团24亿欧元业务合作,联合创始人兼CTO夏中谱是端到端模型量产关键人物。
智平方则补齐产业链另一极——从算法到量产的商业化全周期能力。具身智能赛道的淘汰赛已经开始:Demo阶段结束,行业开始看更硬的指标——机器人能不能真干活、真交付。无界动力的回答指向更底层命题,比起教机器人学会更多任务,更重要的是让它理解物理世界本身的规律;MWA™的核心是首创时序Chunk级逆向动力学建模机制,能在动作执行与环境变化的长周期博弈推演中直接输出连续多步动作组。
当前国内具身智能估值突破200亿元仅用一年时间,资本正向"技术+量产+商业化"三位一体的硬核团队集中。
华尔街见闻6月29日消息,DeepSeek V4版本正式定档7月中旬发布,配套的"峰谷API定价"机制同步落地。这是DeepSeek继DSpark推理加速框架开源(联合北大发布)之后的又一关键动作——在6月29日早报中已报道DSpark使V4-Flash单用户生成速度提升60%至85%、V4-Pro提升57%至78%。峰谷API定价是DeepSeek在企业级市场的关键基础设施创新:通过分时段差异化定价,将企业非关键任务引导到算力空闲时段(通常为夜间或非工作日),既降低企业API调用成本,又提升DeepSeek自身算力利用率,模型方与企业方实现双赢。
从产业逻辑看,DeepSeek在7月中旬的版本选择具有重要战略意义:V4作为"前GPT-5.6时代的国产旗舰",定价机制直接对标OpenAI API标准价格;峰谷定价则是国产大模型首次在商业化机制层面主动创新,而不只是单纯卷价格。
DSpark+V4+峰谷定价的组合拳,标志着DeepSeek正从"技术领先"向"商业化领先"全面转型——推理速度有工程级优势、模型能力有基准测试背书、商业化机制有差异化设计,国产开源模型正在从"单点突破"向"系统化竞争"演进。
韩国政府6月29日公布未来十年总规模1350万亿韩元(折合8800亿美元)的产业投资计划,重点布局芯片、机器人与人工智能三大领域,应对全球存储芯片需求暴涨、AI基建大规模扩张的行业趋势。据韩联社报道,全球两大存储芯片巨头三星电子、SK海力士的母公司三星集团、SK集团将合计投入800万亿韩元(折合5180亿美元),在韩国西南部投建四座存储芯片晶圆厂。这一规模相当于韩国2025年GDP的38%,堪称"国家资本主义"级别的产业动员。计划的核心背景是AI算力对存储芯片的需求结构性爆发:HBM3、HBM4等高带宽内存成为AI训练芯片标配,三星、SK海力士组成的HBM双寡头在AI算力供应链中占据绝对话语权;四座新晶圆厂投产后将直接对接英伟达、AMD、谷歌、Meta、OpenAI、Anthropic等全球AI头部客户的HBM长协需求。计划同时也意味着韩国正在将AI/芯片/机器人作为国家战略产业——三星的存储与晶圆制造、SK海力士的HBM与现代汽车的机器人布局共同构成韩国AI基建版图。从地缘竞争角度看,韩国是少数能在AI芯片与机器人产业链上同时具备"上游制造能力"和"下游应用场景"的国家,8800亿美元投资规模如果按计划落地,将进一步巩固韩国在全球AI供应链中的关键节点地位。
负责苹果Vision Pro与智能眼镜业务的高管保罗·米德即将离职加盟OpenAI。这位副总裁将于下周正式离开苹果,加入OpenAI硬件事业部,负责旗下新一代智能硬件产品线研发。
Vision Pro是苹果2024年推出的空间计算设备,被视为苹果CEO库克任期内的旗舰硬件项目之一;智能眼镜业务则是苹果在AR赛道面向消费市场的关键布局。
Vision Pro业务在2025-2026年面临销量低于预期、产能调整、团队重组等多重压力,保罗·米德的离职被业界视为苹果硬件战略调整的信号之一。OpenAI同时聘任前优步印度及南亚区总裁普拉布吉特·辛格担任印度区首任董事总经理,他将于今年9月入职,全面负责OpenAI在印度的用户增长、企业商业化、商务合作、合规对接与本地运营工作。
印度是全球互联网用户基数最大、增速最快的市场之一,但OpenAI在印度的本地化运营、企业级渗透与监管对接明显落后于竞争对手。两项人事变动背后是OpenAI向"AI+硬件+全球化"三线并进的战略转型——硬件部门扩张承接AI原生硬件的探索(智能音箱、AI眼镜、家庭机器人等可能方向),印度区首任总经理则补齐全球化运营的关键拼图。
美国国家公路交通安全管理局(NHTSA)于6月26日提议废除所有车辆必须配备刹车踏板的法规,该政策仅适用于自动驾驶汽车,将为特斯拉、Wayve、Zoox、Cruise等自动驾驶企业扫清监管障碍。
传统乘用车和商用车的刹车踏板强制配置要求源于驾驶安全冗余设计——驾驶者需要能够随时接管车辆。但对于L4/L5级自动驾驶车辆,车辆控制权完全交给AI系统,传统的人机冗余设计反而成为限制:取消刹车踏板可以释放车内空间、降低生产成本、简化自动驾驶系统与人工接管之间的状态切换逻辑。
NHTSA此次提议是自动驾驶监管从"驾驶者中心"向"车辆智能中心"转变的标志性政策。同日,加州上线AI失业追踪系统,依托失业保险申领数据监测人工智能技术引发的失业潮相关迹象,是全球首个专门追踪AI对就业冲击的政府级数据系统。
这两项政策一上一下、一松一紧,构成美国AI监管的"双轨框架":一边为AI产业松绑(自动驾驶监管改革、出口管制选择性放宽),一边为AI社会冲击建立预警机制(AI失业追踪系统、出口管制)——这与之前报道的Raise US基金一道,形成美国应对AI技术冲击的"产业+社会"双轨政策矩阵。
阿里云6月30日发布通义千问Qwen 3.6 27B模型,支持在消费级硬件上高效本地部署。该模型综合性能逼近商用接口级别,能在单张RTX 4090或同等算力的消费级显卡上实现完整推理,有效保障数据隐私与自主可控。
Qwen 3.6 27B的发布标志着阿里"开源+本地化"路线进入新阶段:之前Qwen系列的开源模型多以72B、110B等大参数为主,企业本地化部署成本较高;27B这个参数级别是性能与硬件门槛的最佳平衡点——既能保持足够的智能密度,又能让中小企业的本地AI部署成为可能。
从商业逻辑看,Qwen 3.6 27B直接对标Meta的Llama 3.1 8B、70B系列、智谱GLM-5.2的32B版本、月之暗面Kimi系列等中尺寸开源模型,但更强调"消费级硬件可跑"这一特性。
叠加Coinbase 6月28日披露的将智谱GLM 5.2与月之暗面Kimi 2.7设为公司默认模型、AI支出砍半等标志性事件,Qwen 3.6 27B的发布进一步巩固中国开源模型在全球中小尺寸赛道的话语权。
中小尺寸开源模型+消费级硬件本地化部署,将是2026年下半年企业AI基建的核心方向之一。
AI评测平台Arena商业化上线八个月,年化营收达1亿美元,完成1.5亿美元A轮融资。Arena的核心模式是依托众包数据提供模型优化服务——平台为AI开发者提供"盲测竞技场",让用户对不同模型的输出进行投票比较,沉淀的众包偏好数据成为模型迭代的关键反馈信号。在大模型能力趋同、传统基准测试区分度下降的背景下,Arena这类基于真实用户偏好的评测平台价值快速上升。
AI头部公司(OpenAI、Anthropic、谷歌、Meta、阿里、字节等)都将Arena的排名作为模型迭代的重要参考。1亿美元年化营收意味着Arena已经走出"评测工具"的单一属性,向"AI基础设施评估服务商"演化:基于众包数据的模型诊断、用户偏好分析、竞品对比、企业AI选型咨询等高附加值业务成为新的增长点。
从赛道逻辑看,AI评测行业正在快速分化:传统的MMLU、HumanEval、GPQA等基准测试由于题目泄露、训练污染等问题区分度持续下降;Arena的众包偏好数据、MirrorCode等真实任务型基准、智源FlagEval等中文场景基准正在填补空白。AI基础设施评估成为继模型层、芯片层之后的又一个独立赛道。
Anthropic Claude大模型正式登陆微软Azure云并适配英伟达GB300 GPU。该部署方案显著提升推理性能与能效,降低企业算力成本,构建安全智能体操作系统,加速AI技术在各行业落地。
Anthropic、微软、英伟达三方联盟的核心逻辑是"模型+云+芯片"全栈协同:Anthropic提供顶级模型能力,微软Azure提供企业级云服务,英伟达GB300 GPU提供底层算力支持,三方共同瓜分企业级AI市场的高附加值部分。
在此之前,Anthropic Claude主要通过Amazon Bedrock和Google Cloud提供服务,Azure的加入意味着Anthropic完成了"三朵云全覆盖",也成为少数能同时与AWS、Azure、Google Cloud三大云厂商深度合作的AI公司。
GB300是英伟达下一代Blackwell架构产品,相比H100在推理性能、能效比、显存容量等关键指标上都有显著提升,Claude在GB300上的部署将释放更强的Agent能力和长上下文处理能力。
从产业影响看,三方联盟对Cohere、AI21、Mistral等中型模型公司形成进一步挤压——头部模型+三大云+最强芯片的组合在企业市场的护城河越来越深,企业级AI市场正在加速向"全栈寡头"集中。
OpenAI针对Codex额度异常快速消耗设立专项组排查,系反滥用系统误判,公司正重置额度修复系统。Codex是OpenAI的AI编程工具产品线,定位是面向开发者的代码生成、代码审查、Bug修复等任务。Codex额度异常消耗的背后是AI编程工具普及正面临算力承载与成本管控的双重挑战:一方面,AI编程工具的Token消耗量远高于普通对话应用——一次复杂代码生成任务可能消耗数百万Token,单次企业级代码审查任务的算力成本可达数百美元;另一方面,AI编程工具的滥用场景(脚本刷量、自动化代理、恶意爬取等)也在快速增加,反滥用系统的误判率提升。
从行业数据看,AI编程工具正在成为Token消耗最快的应用场景之一:Cursor、Claude Code、Codex等头部产品的周度Token消耗量已经超过多数SaaS产品的年度消耗量;本月Anthropic开发者Hugh Williams用Claude Code主导开发的Zettair搜索引擎全程代码由AI生成且索引超百万文章,是AI编程工具普及的标志性案例。Codex额度异常事件折射出一个更广泛的产业问题:AI编程工具的商业模式正在从"按订阅收费"向"按Token消耗收费"快速迁移,订阅制在Token消耗指数级增长下面临可持续性挑战,未来"高级订阅+Token上限"或"纯Token计量"可能成为AI编程工具的主流定价模式。
6月29日彭博社披露的Anthropic致参议院银行委员会的信函显示,Anthropic指控阿里巴巴关联方使用约2.5万个虚假账号,与Claude展开了近2880万次对话,公司将其定性为"工业级的蒸馏攻击",并直接挂上"国家安全"标签。这并非Anthropic首次对华指控:去年DeepSeek R1发布后,其CEO达里奥就在博文中埋下暗讽;今年2月公司直接点名DeepSeek、月之暗面、MiniMax三家;如今阿里成为最新目标,《纽约时报》已经在猜测下一个是否轮到智谱。
从技术角度看,蒸馏本身是2015年诺奖得主Hinton提出的基础训练技术,全行业普遍使用:英伟达Nemotron系列公开训练数据中大量使用中国开源模型,DeepSeek R1在论文中明确写道基于Qwen蒸馏出4个不同尺寸的模型并以MIT协议开源。
Anthropic选择不公开信函、不走司法程序、不进行商业沟通,而是直接寄信给议员,把一桩商业纠纷包装成"技术层面的国家安全威胁",其操作耐人寻味。
从背景看,Anthropic今年2月与五角大楼在AI军事用途红线问题上谈崩,2亿美元国防合同被OpenAI接盘,5月再次被排除在五角大楼8家涉密AI合同之外;6月初又递出IPO申请,Series H估值9650亿美元,目标是上市时破万亿——在监管关系紧绷、IPO估值待兑现的节骨眼上,"中国AI公司大规模窃取美国AI能力"的叙事对华盛顿的指向意义非常明确。
信函曝光仅两周后,参议员Bill Hagerty和Andy Kim已在推进国防法案修正案,拟对"不当获取美国AI模型输出"的实体实施制裁,Anthropic递交"投名状"到推动立意的转化效率,正是这家公司希望看到的成效。