声明:文档由AI生成,仅作参考,最终功能和计费标准以官方为准。
一、产品概述
硅基流动(SiliconFlow)由硅基流动企业于2023年8月创立,是专注AI推理基础设施的第三方MaaS(模型即服务)平台,以自研推理引擎与异构算力调度系统为核心,面向开发者、政企客户提供聚合多类开源大模型的标准化推理API、弹性GPU算力及私有化算力运营解决方案,定位为一站式AI Token工厂。

二、产品特色
- 全品类模型生态覆盖,平台已上线160余款开源AI模型,覆盖文本对话、代码生成、机器翻译、文生图、多模态生成等任务,包含DeepSeek、通义千问Qwen、GLM、SDXL、腾讯混元等主流系列模型,单款模型最高支持32K上下文长度。
- 自研高性能推理引擎,内置PD分离、KV缓存优化、专家并行、流水并行等底层加速技术,降低推理延迟、提升Token吞吐效率;稠密大模型可实现当日适配上线,MoE架构模型适配周期缩短至1-2天。
- 全异构算力兼容,原生适配英伟达GPU、华为昇腾、沐曦、摩尔线程、AMD等海内外芯片,支持国产算力深度优化,满足主权AI与国产化部署需求。
- 统一弹性算力调度体系,搭载新一代弹性GPU调度引擎,支持跨地域算力协同、自助式模型部署、算力弹性扩缩容,可将裸金属算力集群一键转化为标准化推理服务集群。
- 多交付模式支撑,提供公有云在线API调用、企业私有化部署、智算中心联合运营三类交付形态,适配个人开发者、互联网团队、央企、地方智算中心等不同客户场景。
- 规模化高可靠服务能力,平台累计服务超千万个人用户、万余家企业客户,日均Token生成量突破万亿,跻身2025年中国公有云MaaS市场份额前四,为行业第一梯队创业厂商。
- 标准化开放接入能力,统一API调用协议,兼容主流开发框架与第三方工具链,单密钥可调用平台内全部模型,配套完整开发者文档、快速启动示例与接口调试工具。
三、收费标准
官方网站未公示统一完整标准化计费表格、固定套餐、会员定价明细,仅披露部分限时免费模型权益,完整按量计费单价、充值档位、长期套餐、企业定制资费等详情请以官方控制台及最新公告为准。
- 计费基础模式:产品采用Token按量计费模式,区分输入Token、输出Token分别计价,不同模型单价存在差异化;平台设置模型免费调用额度,部分翻译、轻量文本模型开放限时全免费调用权限。
- 弹性GPU算力计费:自助部署GPU实例按算力时长计费,支持按需启停弹性释放资源,企业客户可申请定制算力包与阶梯折扣。
- 私有化部署收费:面向政企、智算中心客户提供定制化报价,包含软件授权、算力纳管、运维服务、专属技术支持等分项收费模块。
- 特殊权益说明:部分开源轻量模型、专项评测模型设置长期免费调用额度,限时上线新模型会开放阶段性零成本试用通道。
四、常见问题
Q:硅基流动与传统公有云厂商MaaS产品有什么区别?
A:硅基流动属于第三方中立AI推理基础设施服务商,不自研闭源大模型,核心优势聚焦异构算力适配、推理引擎深度优化、规模化压降Token调用成本;传统云厂商MaaS以自有闭源模型为核心,算力资源仅依托自有云集群,国产芯片适配、第三方开源模型批量上线效率相对有限。
Q:平台支持哪些类型客户接入使用?
A:覆盖三类主体:个人独立开发者、中小型AI应用开发团队;能源、金融、交通、通信领域央企及地方政企单位;智算中心、算力服务商、头部大模型企业,可分别使用公有云API、弹性自助GPU、私有化联合运营三种方案。
Q:国产昇腾等芯片能否流畅运行70B以上大模型?
A:平台已完成国产芯片全链路优化,72B稠密大模型可在昇腾算力上当日完成适配部署,MoE架构大模型最快1-2天完成上线,推理吞吐、延迟指标可对标同规格海外GPU运行效果。
Q:模型API是否提供统一接口,切换模型需要修改大量代码吗?
A:平台提供标准化统一API协议,参数格式、请求返回结构统一,切换不同模型仅需修改接口内模型名称字段,无需重构业务调用代码,兼容LlamaIndex等主流开发框架。
Q:私有化部署需要配套专属算力集群吗?
A:支持两种方案,一是客户自有裸金属算力集群纳管部署,二是联合共建智算中心,硅基流动提供推理引擎、调度系统、运维管控平台,无需强制采购平台配套算力硬件。
Q:免费模型额度是否存在调用速度限制?
A:限时免费模型、免费额度内调用会配置基础并发与限流策略,高并发、生产级稳定业务建议充值按量计费或采购弹性GPU实例,解除限流约束。