4月15日消息，智谱将开源 32B/9B 系列 GLM 模型，涵盖基座、推理、沉思模型，均遵循 MIT 许可协议。该系列模型现已通过全新平台 z.ai 免费开放体验，并已同步上线智谱 MaaS 平台。

其中，推理模型 GLM-Z1-32B-0414 性能媲美 DeepSeek-R1 等顶尖模型，实测推理速度可达 200 Tokens/秒（MaaS 平台 bigmodel.cn），目前国内商业模型中速度最快。此外，其价格仅为 DeepSeek-R1 的 1/30。

智谱启用全新域名 z.ai，目前该平台整合了 32B 基座、推理、沉思三类 GLM 模型，后续将作为智谱最新模型的交互体验入口。

模型开源

本次开源的所有模型均采用宽松的 MIT 许可协议。这意味着可以免费用于商业用途、自由分发，为开发者提供了极大的使用和开发自由度。我们开源了 9B 和 32B 两种尺寸的模型，包括基座模型、推理模型和沉思模型，具体信息如下：

基座模型 GLM-4-32B-0414 拥有 320 亿参数，其性能可与国内、外参数量更大的主流模型相媲美。该模型利用 15T 高质量数据进行预训练，特别纳入了丰富的推理类合成数据，为后续的强化学习扩展奠定了基础。在后训练阶段，除了进行面向对话场景的人类偏好对齐，我们还通过拒绝采样和强化学习等技术，重点增强了模型在指令遵循、工程代码生成、函数调用等任务上的表现，以强化智能体任务所需的原子能力。GLM-4-32B-0414 在工程代码、Artifacts 生成、函数调用、搜索问答及报告撰写等任务上均表现出色，部分 Benchmark 指标已接近甚至超越 GPT-4o、DeepSeek-V3-0324（671B）等更大模型的水平。

GLM-4-32B-0414 进一步提升了代码生成能力，可处理并生成结构更复杂的单文件代码。Z.ai 的对话模式内建了预览功能，支持对生成的 HTML 和 SVG 进行可视化查看，便于用户评估生成结果和进行迭代优化。

给我设计一个移动端机器学习平台的 UI，其中要包括训练任务，存储管理，和个人统计界面。个人统计界面要用图表展示用户过去一段时间的各类资源使用情况。使用 Tailwind CSS 来美化页面，把这 3 个手机界面平铺展示到一个 HTML 页面中

设计一个支持自定义函数绘制的绘图板，可以添加和删除自定义函数，并为函数指定颜色。

用 svg 展示一个 LLM 的训练流程

用 HTML 模拟太阳系的行星运动

GLM-Z1-32B-0414 是一款具备深度思考能力的推理模型。该模型在 GLM-4-32B-0414 的基础上，采用了冷启动与扩展强化学习策略，并针对数学、代码、逻辑等关键任务进行了深度优化训练。与基础模型相比，GLM-Z1-32B-0414 的数理能力和复杂问题解决能力得到显著增强。此外，训练中整合了基于对战排序反馈的通用强化学习技术，有效提升了模型的通用能力。

在部分任务上，GLM-Z1-32B-0414 凭借 32B 参数，其性能已能与拥有 671B 参数的 DeepSeek-R1 相媲美。通过在 AIME 24/25、LiveCodeBench、GPQA 等基准测试中的评估，GLM-Z1-32B-0414 展现了较强的数理推理能力，能够支持解决更广泛复杂任务。

GLM-Z1-9B-0414 是一个惊喜。我们沿用了上述一系列技术，训练了一个 9B 的小尺寸模型。虽然参数量更少，GLM-Z1-9B-0414 在数学推理及通用任务上依然表现出色，整体性能已跻身同尺寸开源模型的领先水平。特别是在资源受限的场景下，该模型可以很好地在效率与效果之间取得平衡，为需要轻量化部署的用户提供强有力的选择。

沉思模型GLM-Z1-Rumination-32B-0414 代表了智谱对 AGI 未来形态的下一步探索。

与一般推理模型不同，沉思模型通过更多步骤的深度思考来解决高度开放与复杂的问题。其关键创新在于，它能在深度思考过程中整合搜索工具处理复杂任务，并运用多种规则型奖励机制来指导和扩展端到端的强化学习训练。该模型支持“自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环，从而在研究型写作和复杂检索任务上的能力得到了显著提升。

（沉思模型解决开放问题demo：撰写两个城市AI发展情况，以及未来的发展规划）

速度提升 8 倍，价格仅为 1/30

除模型开源外，基座、推理两类模型也已同步上线智谱MaaS开放平台（bigmodel.cn），面向企业与开发者提供API服务。

本次上线的基座模型提供两个版本：GLM-4-Air-250414 和 GLM-4-Flash-250414，其中 GLM-4-Flash-250414 完全免费。

上线的推理模型分为三个版本，分别满足不同场景需求：

GLM-Z1-AirX（极速版）：定位国内最快推理模型，推理速度可达 200 tokens/秒，比常规快 8 倍；
GLM-Z1-Air（高性价比版）：价格仅为 DeepSeek-R1 的 1/30，适合高频调用场景；
GLM-Z1-Flash（免费版）：支持免费使用，旨在进一步降低模型使用门槛。

对应模型价格表：

Z.ai 上线

全新站点 Z.ai ，作为智谱最新模型交互体验入口，将正式启用！

Z.ai 目前已上线三款开源模型：

GLM-4-32B（基座模型）：具备强大代码生成能力，支持全新 Artifacts 功能，打造交互式开发体验。
Z1-32B（推理模型）：超强推理性能，在线体验最高达 200 Tokens/秒的极速输出。
Z1-Rumination-32B（沉思模型）：可以体验 Deep Research 的强大能力，适合做深度调研。

附：如何使用

【开源模型】 32B 基础模型、32B 推理模型、32B 沉思模型（裸模型）

【配置要求】

1 张 H100 / A100 或者更先进的NVIDIA旗舰显卡

4 张 4090 / 5090 / 3090

【在线体验】

MaaS平台：32B 基础模型、 32B 推理模型的极速版和高性价比版

z.ai：32B 基础模型、32B 推理模型、基于 32B 沉思模型的完整 Deep Research 功能

【模型测试侧重点--根据使用平台不同】

z.ai：GLM-4-32B（Artifacts 类任务）、Z1-32B （惊人的推理速度、各种难题）、Z1-Rumination（Deep Research 信息整合能力）

MaaS：GLM-Z1-AirX（速度）、GLM-Z1-Air（性价比）、GLM-Z1-Flash（免费）

开源：普通开发者 Z1-Rumination，有框架开发能力的可以试试体验沉思。

推理模型性能比肩世界先进水平，智谱 GLM开源模型系列迎来新成员，同时启用全球域名“z.ai”

模型开源

速度提升 8 倍，价格仅为 1/30

Z.ai 上线

附：如何使用

最新文章