Z.ai

Z.ai 是由 Z.AI 研发的一站式人工智能服务平台,核心功能包括基于 GLM-5.1 等旗舰模型的智能对话、智能体(Agent)构建以及多模态内容生成能力。

Z.aiGLM-4.6GLM-5.1GLM-4.7GLM-5-Turbo
2访问 1 更新于 2026-04-29 17:05

声明:文档由AI生成,仅作参考,最终功能和计费标准以官方为准。

一、产品概述

Z.ai 是由 Z.AI 研发的一站式人工智能服务平台,核心功能包括基于 GLM-5.1 等旗舰模型的智能对话、智能体(Agent)构建以及多模态内容生成能力。

ScreenShot_2026-04-29_170211_899.png

二、产品特色

  • 旗舰模型 GLM-5.1:支持长达 8 小时的持续性任务自主执行,具备从规划、执行到迭代优化的闭环能力。在通用能力与代码性能上与前沿模型对齐,在 SWE-Bench Pro 等基准测试中取得领先结果,适用于复杂工程优化与自主智能体构建。
  • 多模态模型矩阵:提供包括文本(如 GLM-5 系列)、视觉(如 GLM-5V-Turbo)、图像生成(CogView-4)、视频生成(CogVideoX-3)、音频(GLM-ASR-2512)在内的全系列模型,覆盖多种内容处理与生成需求。
  • 智能体与工具服务:内置网页搜索、GLM Slide/Poster 智能体(测试版)、通用翻译等专用智能体。支持通过 MCP 协议灵活集成外部工具和数据库。
  • 开发与部署友好:提供完整的 API 接口,支持 cURL、官方 Python/Java SDK 以及 OpenAI Python SDK 调用,支持流式与非流式响应,便于开发者快速集成。

三、收费标准

信息来源基于官方网站公示定价,按实际使用量计费。价格单位:美元。

chrome-capture-2026-04-29 (4).png

文本模型

价格单位:美元 / 百万 Token(1M tokens)。缓存输入存储限时免费。

模型输入价格缓存输入价格输出价格
GLM-5.1$1.4$0.26$4.4
GLM-5$1.0$0.2$3.2
GLM-5-Turbo$1.2$0.24$4.0
GLM-4.7$0.6$0.11$2.2
GLM-4.7-FlashX$0.07$0.01$0.4
GLM-4.6$0.6$0.11$2.2
GLM-4.5$0.6$0.11$2.2
GLM-4.5-X$2.2$0.45$8.9
GLM-4.5-Air$0.2$0.03$1.1
GLM-4.5-AirX$1.1$0.22$4.5
GLM-4-32B-0414-128K$0.1-$0.1
GLM-4.7-Flash免费免费免费
GLM-4.5-Flash免费免费免费

视觉模型

价格单位:美元 / 百万 Token(1M tokens)。缓存输入存储限时免费。

模型输入价格缓存输入价格输出价格
GLM-5V-Turbo$1.2$0.24$4.0
GLM-4.6V$0.3$0.05$0.9
GLM-OCR$0.03(输入+输出)--
GLM-4.6V-FlashX$0.04$0.004$0.4
GLM-4.5V$0.6$0.11$1.8
GLM-4.6V-Flash免费免费免费

工具服务

工具价格
网页搜索$0.01 / 次

图像生成模型

价格单位:美元 / 张。

模型价格
GLM-Image$0.015
CogView-4$0.01

视频生成模型

价格单位:美元 / 个。

模型价格
CogVideoX-3$0.2
ViduQ1-Text$0.4
ViduQ1-Image$0.4
ViduQ1-Start-End$0.4
Vidu2-Image$0.2
Vidu2-Start-End$0.2
Vidu2-Reference$0.4

音频模型

模型价格
GLM-ASR-2512$0.03 / 百万 Token(约合 $0.0024 / 分钟)

智能体

智能体价格
GLM Slide/Poster 智能体(测试版)$0.7 / 百万 Token
通用翻译$3.0 / 百万 Token
热门特效视频模板$0.2 / 个视频

四、常见问题

Q:Z.ai 平台的 GLM-5.1 模型与官网免费聊天机器人有何关系?

A:Z.ai 官网(https://z.ai)提供基于 GLM-5.1 等模型的免费 AI 聊天机器人和智能体服务。而开发者文档中公示的定价体系面向 API 调用,两者为不同使用渠道。

Q:GLM-5.1 模型的核心技术参数是什么?

A:GLM-5.1 为纯文本输入输出的旗舰大模型,上下文长度为 200K Token,最大输出 Token 为 128K。它支持智能体编码、通用对话、创意写作、前端原型开发及办公自动化等场景,并可单次持续执行最长 8 小时的任务。

Q:平台提供免费使用的模型吗?

A:提供。文本模型中的 GLM-4.7-Flash 和 GLM-4.5-Flash,以及视觉模型中的 GLM-4.6V-Flash,均为完全免费使用(价格标注为 Free)。

Q:API 调用费用如何计算?是否有免费额度?

A:所有模型均按实际使用量计费,具体价格见“收费标准”章节表格。根据公示信息,目前未提及提供免费 API 调用额度。所有“缓存输入存储”项目前为限时免费。

Q:如何开始调用 API?

A:您需要先获取 API Key,然后参考文档中的 cURL、Python SDK 或 OpenAI SDK 示例代码进行调用。完整的 API 文档地址为:https://docs.z.ai。