Z AI (智谱AI)

Z AI（前身为智谱AI）提供突破性的 GLM-4.5 系列，具有混合推理能力和智能体 AI 设计。这些模型于 2025 年 7 月发布，在统一推理、编程和智能代理应用方面表现出色，同时在 MIT 许可下保持开源可访问性。

网站： https://z.ai/model-api（国际）| https://open.bigmodel.cn/（中国）

获取 API 密钥

国际用户

注册/登录： 前往 https://z.ai/model-api。创建账户或登录。
导航到 API 密钥： 访问您的账户仪表板并找到 API 密钥部分。
创建密钥： 为您的应用程序生成新的 API 密钥。
复制密钥： 立即复制 API 密钥并安全存储。

中国大陆用户

注册/登录： 前往 https://open.bigmodel.cn/。创建账户或登录。
导航到 API 密钥： 访问您的账户仪表板并找到 API 密钥部分。
创建密钥： 为您的应用程序生成新的 API 密钥。
复制密钥： 立即复制 API 密钥并安全存储。

支持的模型

Z AI 根据您选择的地区提供不同的模型目录：

GLM-4.5 系列

GLM-4.5 - 旗舰模型，总参数 355B，活跃参数 32B
GLM-4.5-Air - 紧凑模型，总参数 106B，活跃参数 12B

GLM-4.5 混合推理模型

GLM-4.5（思考模式） - 具有逐步分析的高级推理
GLM-4.5-Air（思考模式） - 主流硬件的高效推理

所有模型具有以下特性：

128,000 token 上下文窗口，用于广泛的文档处理
专家混合（MoE）架构，实现最佳性能
智能体原生设计，集成推理、编程和工具使用
开源可用性，采用 MIT 许可

在 Careti 中配置

打开 Careti 设置： 点击 Careti 面板中的设置图标（⚙️）。
选择提供商： 从"API 提供商"下拉菜单中选择"Z AI"。
选择地区： 选择您的地区：
- "国际"用于全球访问
- "中国"用于中国大陆访问
输入 API 密钥： 将您的 Z AI API 密钥粘贴到"Z AI API Key"字段中。
选择模型： 从"模型"下拉菜单中选择您想要的模型。

Z AI 的混合智能

Z AI 的 GLM-4.5 系列引入了革命性的能力，使其与传统语言模型区别开来：

混合推理架构

GLM-4.5 以两种不同模式运行：

思考模式： 专为复杂推理任务和工具使用而设计，进行更深入的分析过程
非思考模式： 为直接查询提供即时响应，优化效率

这种双模式架构代表了一种"智能体原生"设计理念，根据查询复杂性调整处理强度。

卓越的性能

GLM-4.5 在涵盖智能体任务、推理和编程挑战的 12 个基准测试中获得 63.2 的综合得分，在所有专有和开源模型中排名第三。GLM-4.5-Air 以 59.8 的得分保持竞争力，同时提供卓越的效率。

专家混合卓越性

复杂的 MoE 架构在保持计算效率的同时优化性能：

GLM-4.5： 总参数 355B，活跃参数 32B
GLM-4.5-Air： 总参数 106B，活跃参数 12B

扩展的上下文能力

128,000 token 的上下文窗口使得能够全面理解冗长的文档和代码库，实际测试确认了对近 2,000 行代码库的有效处理，同时保持出色的性能。

开源领导地位

在 MIT 许可下发布，GLM-4.5 为研究人员和开发人员提供了对最先进能力的访问，没有专有限制，包括基础模型、混合推理版本和优化的 FP8 变体。

区域优化

API 端点

国际： 使用 https://api.z.ai/api/paas/v4
中国： 使用 https://open.bigmodel.cn/api/paas/v4

模型可用性

地区设置决定了 API 端点和可用模型，自动过滤以确保与您选择的地区兼容。

特殊功能

智能体能力

GLM-4.5 的统一架构使其特别适合需要集成推理、编程和工具利用能力的复杂智能代理应用。

全面的基准测试

性能评估涵盖：

3 个智能体任务基准
7 个推理基准
2 个编程基准

这种全面的评估展示了在各种 AI 应用中的多功能性。

开发者集成

模型支持通过多个框架集成：

transformers
vLLM
SGLang

配备专用的模型代码、工具解析器和推理解析器实现。

性能比较

与 Claude 4 Sonnet 对比

GLM-4.5 在智能体编程和推理任务中表现出竞争力，尽管 Claude Sonnet 4 在编程成功率和自主多功能应用开发方面保持优势。

与 GPT-4.5 对比

GLM-4.5 在推理和智能体基准测试中排名具有竞争力，GPT-4.5 通常在 MMLU 和 AIME 等专业基准的原始任务准确性方面领先。

提示和注意事项

地区选择： 选择适当的地区以获得最佳性能并遵守当地法规。
模型选择： GLM-4.5 用于最大性能，GLM-4.5-Air 用于效率和主流硬件兼容性。
上下文优势： 大型 128K 上下文窗口使得能够处理大量代码库和文档。
开源优势： MIT 许可使得商业使用和二次开发成为可能。
智能体应用： 对于需要推理、编程和工具使用集成的应用特别强大。
混合推理： 使用思考模式处理复杂问题，使用非思考模式处理简单查询。
API 兼容性： OpenAI 兼容 API 提供流式响应和使用报告。
框架支持： 可用于不同部署场景的多个集成选项。

获取 API 密钥​

国际用户​

中国大陆用户​

支持的模型​

GLM-4.5 系列​

GLM-4.5 混合推理模型​

在 Careti 中配置​

Z AI 的混合智能​

混合推理架构​

卓越的性能​

专家混合卓越性​

扩展的上下文能力​

开源领导地位​

区域优化​

API 端点​

模型可用性​

特殊功能​

智能体能力​

全面的基准测试​

开发者集成​

性能比较​

与 Claude 4 Sonnet 对比​

与 GPT-4.5 对比​

提示和注意事项​