硅基流动 SiliconFlow

硅基流动(SiliconFlow)专注于提供高效能、低成本的多品类 AI 模型服务,助力开发者和企业聚焦产品创新。

硅基流动SiliconFlow大模型 API 服务AI 云服务平台人工通用智能 (AGI)
0 更新于 2026-06-17 09:55

声明:文档由AI生成,仅作参考,最终功能和计费标准以官方为准。

一、产品概述

硅基流动(SiliconFlow)由硅基流动企业于2023年8月创立,是专注AI推理基础设施的第三方MaaS(模型即服务)平台,以自研推理引擎与异构算力调度系统为核心,面向开发者、政企客户提供聚合多类开源大模型的标准化推理API、弹性GPU算力及私有化算力运营解决方案,定位为一站式AI Token工厂。

ScreenShot_2026-06-17_095426_060.png

二、产品特色

  1. 全品类模型生态覆盖,平台已上线160余款开源AI模型,覆盖文本对话、代码生成、机器翻译、文生图、多模态生成等任务,包含DeepSeek、通义千问Qwen、GLM、SDXL、腾讯混元等主流系列模型,单款模型最高支持32K上下文长度。
  2. 自研高性能推理引擎,内置PD分离、KV缓存优化、专家并行、流水并行等底层加速技术,降低推理延迟、提升Token吞吐效率;稠密大模型可实现当日适配上线,MoE架构模型适配周期缩短至1-2天。
  3. 全异构算力兼容,原生适配英伟达GPU、华为昇腾、沐曦、摩尔线程、AMD等海内外芯片,支持国产算力深度优化,满足主权AI与国产化部署需求。
  4. 统一弹性算力调度体系,搭载新一代弹性GPU调度引擎,支持跨地域算力协同、自助式模型部署、算力弹性扩缩容,可将裸金属算力集群一键转化为标准化推理服务集群。
  5. 多交付模式支撑,提供公有云在线API调用、企业私有化部署、智算中心联合运营三类交付形态,适配个人开发者、互联网团队、央企、地方智算中心等不同客户场景。
  6. 规模化高可靠服务能力,平台累计服务超千万个人用户、万余家企业客户,日均Token生成量突破万亿,跻身2025年中国公有云MaaS市场份额前四,为行业第一梯队创业厂商。
  7. 标准化开放接入能力,统一API调用协议,兼容主流开发框架与第三方工具链,单密钥可调用平台内全部模型,配套完整开发者文档、快速启动示例与接口调试工具。

三、收费标准

官方网站未公示统一完整标准化计费表格、固定套餐、会员定价明细,仅披露部分限时免费模型权益,完整按量计费单价、充值档位、长期套餐、企业定制资费等详情请以官方控制台及最新公告为准。

  1. 计费基础模式:产品采用Token按量计费模式,区分输入Token、输出Token分别计价,不同模型单价存在差异化;平台设置模型免费调用额度,部分翻译、轻量文本模型开放限时全免费调用权限。
  2. 弹性GPU算力计费:自助部署GPU实例按算力时长计费,支持按需启停弹性释放资源,企业客户可申请定制算力包与阶梯折扣。
  3. 私有化部署收费:面向政企、智算中心客户提供定制化报价,包含软件授权、算力纳管、运维服务、专属技术支持等分项收费模块。
  4. 特殊权益说明:部分开源轻量模型、专项评测模型设置长期免费调用额度,限时上线新模型会开放阶段性零成本试用通道。

四、常见问题

Q:硅基流动与传统公有云厂商MaaS产品有什么区别?

A:硅基流动属于第三方中立AI推理基础设施服务商,不自研闭源大模型,核心优势聚焦异构算力适配、推理引擎深度优化、规模化压降Token调用成本;传统云厂商MaaS以自有闭源模型为核心,算力资源仅依托自有云集群,国产芯片适配、第三方开源模型批量上线效率相对有限。

Q:平台支持哪些类型客户接入使用?

A:覆盖三类主体:个人独立开发者、中小型AI应用开发团队;能源、金融、交通、通信领域央企及地方政企单位;智算中心、算力服务商、头部大模型企业,可分别使用公有云API、弹性自助GPU、私有化联合运营三种方案。

Q:国产昇腾等芯片能否流畅运行70B以上大模型?

A:平台已完成国产芯片全链路优化,72B稠密大模型可在昇腾算力上当日完成适配部署,MoE架构大模型最快1-2天完成上线,推理吞吐、延迟指标可对标同规格海外GPU运行效果。

Q:模型API是否提供统一接口,切换模型需要修改大量代码吗?

A:平台提供标准化统一API协议,参数格式、请求返回结构统一,切换不同模型仅需修改接口内模型名称字段,无需重构业务调用代码,兼容LlamaIndex等主流开发框架。

Q:私有化部署需要配套专属算力集群吗?

A:支持两种方案,一是客户自有裸金属算力集群纳管部署,二是联合共建智算中心,硅基流动提供推理引擎、调度系统、运维管控平台,无需强制采购平台配套算力硬件。

Q:免费模型额度是否存在调用速度限制?

A:限时免费模型、免费额度内调用会配置基础并发与限流策略,高并发、生产级稳定业务建议充值按量计费或采购弹性GPU实例,解除限流约束。