↑

KIMI API开放平台

KIMIAPI开放平台

3访问 2 次更新于 2026-03-20 09:19

声明：文档由AI生成，仅作参考，最终功能和计费标准以官方为准。

一、产品概述

KIMI API开放平台是北京月之暗面科技有限公司研发的以生成式人工智能服务为核心的API服务平台，为开发者提供大模型推理API接口，支持多类大模型的文本、多模态等推理能力调用，适用于开发各类基于大模型的产品及服务。

二、产品特色

提供多系列大模型接口，包含多模态模型kimi-k2.5、生成模型kimi-k2、生成模型Moonshot-v1，覆盖不同场景需求
kimi-k2.5为原生多模态架构，同时支持视觉与文本输入，具备思考与非思考模式、对话与Agent任务处理能力，支持长思考与深度推理
kimi-k2为MoE架构基础模型，总参数1T、激活参数32B，具备超强代码和Agent能力，部分版本为高速版，输出速度可达每秒60-100 tokens
Moonshot-v1系列模型分不同上下文长度版本，同时提供视觉预览版本，可理解图片内容并输出文本，适用于不同长度文本生成场景
支持自动上下文缓存、ToolCalls、JSON Mode、Partial Mode、联网搜索等功能，部分模型支持深度推理与多步工具调用
提供Chat Completions核心接口，同时支持文件内容抽取/存储等配套接口，文件相关接口可实现文本、图片、PDF等格式的内容解析
速率限制多维度管控，支持并发、RPM（每分钟请求数）、TPM（每分钟Token数）、TPD（每天Token数）维度的限制规则

三、收费标准

基础计费规则
- 计费单元：以Token为基本计费单元，Token代表常见的字符序列，普通中文文本中1个Token约相当于1.5-2个汉字，实际Token数量可通过计算Token API获取。
- 计费逻辑：Chat Completion接口对Input和Output均按量计费，若将文件抽取内容作为Input传输给模型，该部分内容同样按量计费。
- 免费政策：文件相关接口（文件内容抽取/文件存储）限时免费，仅上传并抽取文档不会产生该接口本身的费用。
- 补充规则：速率限制基于请求中max_tokens参数计算，计费则基于实际请求Token数量+实际生成Token数量计算；Token计费中1M=1,000,000。
各系列模型计费标准

多模态模型kimi-k2.5

模型名称	计费单位	输入价格（缓存命中）	输入价格（缓存未命中）	输出价格	模型上下文长度
kimi-k2.5	1M tokens	￥0.70	￥4.00	￥21.00	262,144 tokens

生成模型kimi-k2

模型名称	计费单位	输入价格（缓存命中）	输入价格（缓存未命中）	输出价格	模型上下文长度
kimi-k2-0905-preview	1M tokens	￥1.00	￥4.00	￥16.00	262,144 tokens
kimi-k2-0711-preview	1M tokens	￥1.00	￥4.00	￥16.00	131,072 tokens
kimi-k2-turbo-preview	1M tokens	￥1.00	￥8.00	￥58.00	262,144 tokens
kimi-k2-thinking	1M tokens	￥1.00	￥4.00	￥16.00	262,144 tokens
kimi-k2-thinking-turbo	1M tokens	￥1.00	￥8.00	￥58.00	262,144 tokens

生成模型Moonshot-v1

模型名称	计费单位	输入价格	输出价格	模型上下文长度
moonshot-v1-8k	1M tokens	￥2.00	￥10.00	8,192 tokens
moonshot-v1-32k	1M tokens	￥5.00	￥20.00	32,768 tokens
moonshot-v1-128k	1M tokens	￥10.00	￥30.00	131,072 tokens
moonshot-v1-8k-vision-preview	1M tokens	￥2.00	￥10.00	8,192 tokens
moonshot-v1-32k-vision-preview	1M tokens	￥5.00	￥20.00	32,768 tokens
moonshot-v1-128k-vision-preview	1M tokens	￥10.00	￥30.00	131,072 tokens

其他计费补充
- kimi-k2系列模型的缓存命中tokens按输入价格（缓存命中）单价收费，可在控制台查看"context caching"类型的费用明细。
- 所有模型的Input和Output总和长度不得超过对应模型的最大上下文长度，否则将影响生成结果。

四、常见问题

Q：调用接口时出现“link hit security strategy”报错如何处理？

A：该报错为平台安全策略拦截导致，需检查请求链接是否符合平台安全规范，确认无违规访问、协议不匹配（如HTTP向HTTPS端口发起请求）等问题，排查后重新发起请求。

Q：Kimi API返回的内容不完整或被截断怎么办？

A：先检查响应体中的choice.finish_reason字段，若值为length，说明生成Token数超过请求中max_tokens参数，可使用Partial Mode让模型接续输出。

Q：文件抽取内容不准确、图像无法被识别是什么原因？

A：平台对图片仅通过OCR提取文字内容，无文字内容的图片会导致解析失败；PDF文档若仅含图片则通过OCR提取，否则仅提取文本内容，可先确认文件内容类型是否符合提取规则。

Q：调用接口出现`content_filter: The request was rejected because it was considered high risk`错误？

A：该错误因请求的输入或模型生成的输出包含不安全、敏感内容导致，需排查并修改输入内容后重新请求。

Q：使用过程中频繁出现Connection相关错误如何解决？

A：按以下顺序排查：1.检查程序代码/SDK的默认超时设置；2.检查代理服务器的网络和超时设置；3.未启用流式输出stream=True时，模型生成Token过多易触发网关超时，推荐启用stream=True减少该类错误。

Q：报错信息的TPM、RPM限制与账户Tier等级不匹配？

A：大概率为使用了错误的api_key，如误用其他用户的api_key或混用多账号的api_key，排查并使用当前账户正确的api_key即可。

Q：调用接口出现`model_not_found`错误？

A：使用OpenAI SDK时未设置base_url=https://api.moonshot.cn，导致请求发送至OpenAI服务器，需在SDK中正确配置该基础地址。

Q：是否支持使用`file_id`引用文件内容作为上下文？

A：目前暂不支持通过文件file_id的方式引用文件内容作为模型上下文。