智谱 AI GLM 5.2 开源发布：百万 Token 上下文与顶尖 Agent 能力

智谱 AI 近期正式开源了其旗舰模型 GLM 5.2。该版本不仅在上下文处理能力上取得了突破，更在 Agent（智能体）编程与多任务执行能力上达到了开源模型的新高度。采用 MIT 开源许可证，为个人开发者和企业提供了极大的灵活性。

核心亮点

GLM 5.2 实现了真正的 100 万 Token 上下文窗口。这一特性使其在处理大型代码库、整合多份文档知识库以及维持长周期 Agent 任务方面表现卓越，解决了长文本处理中常见的性能衰减问题。

GLM 5.2 是首个在 Terminal-Bench 测试中突破 80% 成绩的开放权重模型。它在真实终端环境下展现了极高的任务规划、命令执行及调试能力，标志着开源模型在自动化开发场景下正式具备了与顶级闭源模型正面竞争的实力。

IndexShare 架构：通过四层稀疏注意力层共享索引器，在 1M 上下文环境下将 FLOPs 降低了约 2.9 倍，显著提升了处理效率并降低了推理成本。
改进的 MTP 推测解码：优化了多 Token 预测（MTP）层，推测性解码接受长度提升最高达 20%，有效减少了生成延迟。

由于 GLM 5.2 采用 MoE（混合专家）架构，总参数规模约为 753B，这对硬件配置提出了极高要求。

量化版本	预估内存需求	建议配置
FP8	744GB – 890GB	8x H200 (141GB) 或 8x H100 (80GB)
Q4_K_M	476GB – 500GB	Mac Studio 集群或 6x 80GB GPU
Q2_K_XL	241GB – 280GB	256GB Mac Studio (Ultra) 或 RTX 4090 + 256GB RAM
1 Bit 动态	176GB – 180GB	192GB Mac Studio 或 24GB GPU + 192GB RAM