智谱开源32B/9B 系列 GLM 模型,32B参数媲美DeepSeek R1,速度快8倍
备受瞩目的国内人工智能企业智谱华章(以下简称“智谱”)近日正式宣布,开源其新一代 GLM 系列大语言模型。
此次开源力度空前,不仅包含 32B 和9B 两种参数规模的模型,更涵盖了 基座模型、推理模型以及代表未来探索方向的沉思模型。所有开源模型均遵循 宽松的 MIT 许可协议,为开发者提供了极大的自由度和商业应用的可能性。
与此同时,该系列模型已通过智谱全新平台 Z.ai 免费开放体验,并同步上线 智谱 MaaS 平台 (bigmodel.cn)。
开源赋能:技术普惠与创新加速
本次智谱开源的 GLM 模型系列,最引人注目的便是其开放的态度。所有模型均采用 MIT 许可协议,允许免费用于商业用途和自由分发。这意味着开发者可以更便捷地获取和使用先进的大语言模型技术,无需担心授权问题,从而极大地降低了 AI 应用的门槛,有望加速各行各业的智能化进程。
智谱此次开源了 9B 和32B 两种尺寸的模型,包括各自的 基座模型、推理模型和沉思模型。不同规模的模型可以满足开发者在不同资源和应用场景下的需求,提供了更灵活的选择。
性能跃升:小参数迸发大能量
本次发布的核心亮点之一,便是 32B 参数的推理模型 GLM-Z1-32B-0414 的卓越性能。据官方数据,该模型在部分任务上 性能媲美 DeepSeek-R1等拥有671B 参数的顶尖模型。更令人惊喜的是,其 实测推理速度可达200Tokens/秒 (在 MaaS 平台 bigmodel.cn),堪称 目前国内商业模型中最快。此外,其 价格仅为 DeepSeek-R1的1/30,展现了极高的性价比。
基座模型方面,GLM-4-32B-0414拥有320亿参数,其性能也足以 与国内外更大参数量的主流模型相媲美。该模型利用 15T 高质量数据进行预训练,特别融入了丰富的推理类合成数据,为后续的强化学习打下了坚实基础。在后训练阶段,模型还通过人类偏好对齐、拒绝采样和强化学习等技术,重点提升了在 指令遵循、工程代码生成、函数调用 等智能体任务关键能力。
实际应用中,GLM-4-32B-0414在工程代码、Artifacts 生成、函数调用、搜索问答及报告撰写等任务上均表现出色,部分 Benchmark 指标甚至 接近甚至超越 GPT-4o、DeepSeek-V3-0324(671B) 等更大模型 的水平。值得一提的是,Z.ai 平台的对话模式还内建了 预览功能,支持对生成的 HTML 和 SVG 进行可视化查看,方便用户评估和迭代优化。
推理模型 GLM-Z1-32B-0414 在 GLM-4-32B-0414的基础上,采用了 冷启动与扩展强化学习策略,并针对 数学、代码、逻辑等关键任务进行了深度优化训练。
因此,其 数理能力和复杂问题解决能力得到显著增强。通过在 AIME24/25、LiveCodeBench、GPQA 等基准测试中的评估,GLM-Z1-32B-0414展示了 较强的数理推理能力,能够支持解决更广泛的复杂任务。
令人惊喜的是,智谱还推出了 9B 参数的推理模型 GLM-Z1-9B-0414。尽管参数量较小,但得益于相同的技术和训练方法,该模型在 数学推理及通用任务上依然表现出色,整体性能已跻身同尺寸开源模型的领先水平。这为需要在 资源受限场景下进行轻量化部署 的用户提供了强有力的选择。
前沿探索:沉思模型引领未来
本次发布的另一亮点是 沉思模型 GLM-Z1-Rumination-32B-0414。智谱将其定位为对 AGI 未来形态的下一步探索。与一般推理模型不同,沉思模型通过 更多步骤的深度思考来解决高度开放与复杂的问题。
其关键创新在于,它能在深度思考过程中 整合搜索工具处理复杂任务,并运用多种规则型奖励机制来指导和扩展端到端的强化学习训练。该模型支持 “自主提出问题—搜索信息—构建分析—完成任务”的完整研究闭环,从而在 研究型写作和复杂检索任务 上的能力得到了显著提升。用户现在可以通过 Z.ai 平台体验其强大的深度调研能力。
全新平台与 API 服务:便捷易用触手可及
为了方便用户体验和使用这些全新的模型,智谱启用了 全新域名 Z.ai。该平台 整合了32B 基座、推理、沉思三类 GLM 模型,作为智谱最新模型的交互体验入口。
除了免费体验平台,智谱 MaaS 开放平台 (bigmodel.cn) 也 同步上线了基座和推理两类模型的 API 服务,面向企业与开发者提供支持。上线的基座模型提供 GLM-4-Air-250414(免费) 和 GLM-4-Flash-250414两个版本。推理模型则提供 GLM-Z1-AirX (极速版,200tokens/秒)、GLM-Z1-Air (高性价比版,价格仅为 DeepSeek-R1的1/30) 和 GLM-Z1-Flash (免费版) 三个版本,以满足不同场景的需求。
空空如也!