↑

硅基流动 SiliconFlow

硅基流动（SiliconFlow）专注于提供高效能、低成本的多品类 AI 模型服务，助力开发者和企业聚焦产品创新。

硅基流动SiliconFlow大模型 API 服务AI 云服务平台人工通用智能 (AGI)

0 更新于 2026-06-17 09:55

声明：文档由AI生成，仅作参考，最终功能和计费标准以官方为准。

一、产品概述

硅基流动（SiliconFlow）由硅基流动企业于2023年8月创立，是专注AI推理基础设施的第三方MaaS（模型即服务）平台，以自研推理引擎与异构算力调度系统为核心，面向开发者、政企客户提供聚合多类开源大模型的标准化推理API、弹性GPU算力及私有化算力运营解决方案，定位为一站式AI Token工厂。

二、产品特色

全品类模型生态覆盖，平台已上线160余款开源AI模型，覆盖文本对话、代码生成、机器翻译、文生图、多模态生成等任务，包含DeepSeek、通义千问Qwen、GLM、SDXL、腾讯混元等主流系列模型，单款模型最高支持32K上下文长度。
自研高性能推理引擎，内置PD分离、KV缓存优化、专家并行、流水并行等底层加速技术，降低推理延迟、提升Token吞吐效率；稠密大模型可实现当日适配上线，MoE架构模型适配周期缩短至1-2天。
全异构算力兼容，原生适配英伟达GPU、华为昇腾、沐曦、摩尔线程、AMD等海内外芯片，支持国产算力深度优化，满足主权AI与国产化部署需求。
统一弹性算力调度体系，搭载新一代弹性GPU调度引擎，支持跨地域算力协同、自助式模型部署、算力弹性扩缩容，可将裸金属算力集群一键转化为标准化推理服务集群。
多交付模式支撑，提供公有云在线API调用、企业私有化部署、智算中心联合运营三类交付形态，适配个人开发者、互联网团队、央企、地方智算中心等不同客户场景。
规模化高可靠服务能力，平台累计服务超千万个人用户、万余家企业客户，日均Token生成量突破万亿，跻身2025年中国公有云MaaS市场份额前四，为行业第一梯队创业厂商。
标准化开放接入能力，统一API调用协议，兼容主流开发框架与第三方工具链，单密钥可调用平台内全部模型，配套完整开发者文档、快速启动示例与接口调试工具。

三、收费标准

官方网站未公示统一完整标准化计费表格、固定套餐、会员定价明细，仅披露部分限时免费模型权益，完整按量计费单价、充值档位、长期套餐、企业定制资费等详情请以官方控制台及最新公告为准。

计费基础模式：产品采用Token按量计费模式，区分输入Token、输出Token分别计价，不同模型单价存在差异化；平台设置模型免费调用额度，部分翻译、轻量文本模型开放限时全免费调用权限。
弹性GPU算力计费：自助部署GPU实例按算力时长计费，支持按需启停弹性释放资源，企业客户可申请定制算力包与阶梯折扣。
私有化部署收费：面向政企、智算中心客户提供定制化报价，包含软件授权、算力纳管、运维服务、专属技术支持等分项收费模块。
特殊权益说明：部分开源轻量模型、专项评测模型设置长期免费调用额度，限时上线新模型会开放阶段性零成本试用通道。

四、常见问题

Q：硅基流动与传统公有云厂商MaaS产品有什么区别？

A：硅基流动属于第三方中立AI推理基础设施服务商，不自研闭源大模型，核心优势聚焦异构算力适配、推理引擎深度优化、规模化压降Token调用成本；传统云厂商MaaS以自有闭源模型为核心，算力资源仅依托自有云集群，国产芯片适配、第三方开源模型批量上线效率相对有限。

Q：平台支持哪些类型客户接入使用？

A：覆盖三类主体：个人独立开发者、中小型AI应用开发团队；能源、金融、交通、通信领域央企及地方政企单位；智算中心、算力服务商、头部大模型企业，可分别使用公有云API、弹性自助GPU、私有化联合运营三种方案。

Q：国产昇腾等芯片能否流畅运行70B以上大模型？

A：平台已完成国产芯片全链路优化，72B稠密大模型可在昇腾算力上当日完成适配部署，MoE架构大模型最快1-2天完成上线，推理吞吐、延迟指标可对标同规格海外GPU运行效果。

Q：模型API是否提供统一接口，切换模型需要修改大量代码吗？

A：平台提供标准化统一API协议，参数格式、请求返回结构统一，切换不同模型仅需修改接口内模型名称字段，无需重构业务调用代码，兼容LlamaIndex等主流开发框架。

Q：私有化部署需要配套专属算力集群吗？

A：支持两种方案，一是客户自有裸金属算力集群纳管部署，二是联合共建智算中心，硅基流动提供推理引擎、调度系统、运维管控平台，无需强制采购平台配套算力硬件。

Q：免费模型额度是否存在调用速度限制？

A：限时免费模型、免费额度内调用会配置基础并发与限流策略，高并发、生产级稳定业务建议充值按量计费或采购弹性GPU实例，解除限流约束。