6月29日,DeepSeek通过开发者邮件及官方平台官宣,V4正式版定于7月中旬上线,同时推出行业首创的API峰谷分时定价模式,以市场化价格杠杆优化算力资源配置。新规明确北京时间每日9:00-12:00、14:00-18:00为高峰时段,调用价格为日常均价2倍,其余时段价格保持不变,并非整体涨价。
定价细则方面,V4 Pro高峰时段缓存命中输入0.05元/百万Tokens、未命中输入6元/百万Tokens、输出12元/百万Tokens;V4 Flash对应价格分别为0.04元、2元、4元/百万Tokens。模型配置上,V4全系列标配100万超长上下文窗口,旗舰版V4-Pro参数达1.6万亿,轻量版V4-Flash参数2840亿,推理开销更低、适配场景更广。该峰谷定价模式对标电力行业调价逻辑,或将成为国内大模型行业定价新趋势,开发者任务编排能力将成为降本核心竞争力。
7月1日,北京市科委、中关村管委会发布《北京市加快推进人工智能赋能科学研究实施方案(2026-2028年)》,为国内首个地方AI for Science系统化落地方案。
![]()
方案提出2028年建成全球科学智能创新中枢,核心打造“自主实验室”新型科研载体,构建“计算指导实验、实验反馈计算”的干湿闭环科研模式。同时将搭建全链条科研智能体平台,覆盖文献调研、实验设计、数据分析等全流程,聚焦高能物理、材料科学、医疗健康等六大核心领域,配套创新券、专项债等扶持政策,布局国家人工智能学院与国际学术品牌。
6月30日,工信部等八部门联合印发工业互联网高质量发展实施意见,明确加速工业大模型与工业智能体落地推广。数据显示,国内工业企业大模型应用渗透率从2024年9.6%飙升至2025年底47.5%,产业化落地速度大幅提升。政策提出2030年建成5万张工业5G专网,推动算力设施一体化规划。目前已有柳钢智能炼钢、东风汽车质检、兴发化工无人车间、龙旗科技机器人流水线等大量落地案例,叠加北京工业AI配套规划,工业大模型正式从概念试点转为工厂基础设施。
6月30日,优必选在深圳召开2026全球发布会,发布“人机共生”战略及优世界U1系列三款全尺寸超仿生人形机器人,涵盖半身版U1 Lite、高配全身版U1 Pro、高动态全身版U1 Ultra。官方披露,U1系列全渠道累计订单突破13361台,是目前全球唯一具备规模化量产能力的全尺寸超仿生人形机器人,计划2026年完成交付。
伴随行业利好落地,7月1日A股人形机器人板块集体爆发,华民股份、拓斯达等超30只个股涨停或涨超10%,行业正式从概念炒作进入供应链兑现阶段。国内优必选、宇树、智元等头部企业稳步推进量产,供应链实现从进口替代到自主引领的转型。同时英伟达加码国内具身智能赛道,在北上深开放核心技术岗位,聚焦物理AI机器人研发,进一步助推国内人形机器人产业升级。
7月1日凌晨,Anthropic重磅发布中端旗舰模型Claude Sonnet 5,定位为品牌史上智能体能力最强的Sonnet系列模型,实现对自家旗舰Opus 4.8的性能反超与价格碾压。核心评测中,Sonnet 5在GDPval-AA v2知识工作基准以1618分超越Opus 4.8的1615分,编程、终端操作、计算机使用、推理能力等核心指标大幅迭代,多项数据逼近旗舰水平。定价极具优势,8月31日前促销价输入2美元/百万Token、输出10美元/百万Token,仅为Opus 4.8定价的40%。该模型已开放全套餐用户使用,成为免费及基础付费版默认模型,适配多步骤复杂任务,是Anthropic冲刺9650亿估值IPO的核心增长产品。同时模型未做高危网络安全训练,漏洞利用成功率为0.0%,默认安全防护偏向常规场景。
政策层面,6月30日美国商务部正式解除对Claude Fable 5、Mythos 5的出口管制,7月1日起两大模型全球全量恢复访问,覆盖Claude全系列官方平台,后续将登陆AWS、谷歌云、微软云等第三方平台。官方针对模型越狱漏洞迭代全新安全分类器,拦截成功率超99%,异常请求自动回落至Opus 4.8处理,仅少量常规任务存在误判情况。Anthropic还联合亚马逊、微软、谷歌制定越狱风险评估行业标准,走出“整改解封”的监管商业化平衡路径。
商业化落地方面,6月30日Anthropic联合微软、英伟达达成深度合作,Claude全系列模型正式入驻Microsoft Foundry与Azure云,搭载英伟达Blackwell Ultra GB300顶级算力,三方战略合作正式商用落地。同期上线科研专属工作台Claude Science,支持3D蛋白、化学结构等科学对象原生渲染,开放50个科研扶持项目,单项目最高3万美元算力补贴,并将Claude桌面端拓展至Linux平台,全面强化编码与智能体一体化能力。
据The Information报道,OpenAI研发全新推理优化方案,可将模型推理成本削减50%以上,已全面应用于访客版ChatGPT,配合GPT-5.6系列有限预览的监管要求,形成“低成本优化+渐进式放量”的商业化策略。
硬件层面,OpenAI 6月30日连发两款自研生态产品:一是与Work Louder联名推出Codex Micro可编程宏键盘,适配编程场景自定义操作,7月15日正式发售;二是联合博通发布Jalapeño专用AI推理ASIC芯片,仅9个月完成架构设计与流片,每瓦性能优于主流商用GPU,推理成本降低50%,计划2026年底规模化部署。叠加底层软件优化降本技术,OpenAI构建软硬一体降本体系,缓解高端模型算力短缺与商业化成本压力。
谷歌正式发布Nano Banana 2 Lite(Gemini Omni Flash图像版本),主打高速、低成本生成能力,与Pro、Flash-Lite版本形成完整梯度,补齐Gemini图像模型性价比赛道,覆盖高端创作与大规模量产生成全场景。同步上线Gemini Spark macOS客户端,支持远程任务调度与自定义MCP功能,完善终端生态布局。
但谷歌遭遇史上严重AI核心人才流失危机,多名顶级科学家密集离职:Transformer核心作者Noam Shazeer离开谷歌重返OpenAI,AlphaFold主导者、诺奖得主John Jumper,以及Gemini预训练、编程方向核心研究员Jonas Adler、Alexander Pritzel集体跳槽Anthropic,覆盖模型架构、科学研究、预训练、编程四大核心领域。人才流失直接导致Alphabet市值两日蒸发数千亿,Gemini 3.5 Pro版本迭代延期,Spark产品成为谷歌稳住市场的核心抓手。
AI推理芯片初创企业Etched官宣累计完成8亿美元融资,签约订单总金额超10亿美元。公司深耕Transformer架构专用ASIC赛道,通过硬件固化Transformer核心架构,舍弃通用GPU冗余灵活性,极致提升推理效率。
该赛道当前呈现明显分化趋势:英伟达调整Rubin Ultra芯片方案,从极致性能转向工程落地可行性;而Etched、Groq等新锐企业深耕专用推理芯片,其中Groq此前以200亿美元规模向英伟达授权技术。在行业整体降本、大模型放量的背景下,AI算力赛道正式分化为“通用GPU”和“专用ASIC/FPGA推理芯片”两大独立竞争体系。
6月30日,特斯拉Cybercab量产版在美国奥斯汀开启公开道路工程测试,全车取消方向盘、油门、刹车等人工操控装置,获当地交通局合规认证,属于SAE4级自动驾驶车型。该车型从概念首发到上路测试仅耗时20个月,搭载HW4.0全套感知设备与V14.3.3纯视觉FSD算法,配备48kWh电池组,续航672公里,支持无线快充。目前已有34台车辆投入测试,开放付费搭乘服务,单次 收费4.2美元。
同时特斯拉启动老硬件车型适配升级,向HW3硬件车型推送FSD V14 Lite版本,通过知识蒸馏技术将HW4高端模型能力迁移至轻量化模型,新增自动泊车、自主驶离车位等实用功能。此次技术迭代实现“新车无人商业化+老车能力延寿”双路径落地,带动特斯拉市值上涨2.13%。目前该升级暂未明确适配中国HW3车型,国内350万辆相关车辆用户升级权益待定。