智谱发布GLM-5.1高速版模型输出速度达400 tokens/s

2026-05-22 10:50:36

据报道，智谱宣布，面向部分企业客户提供GLM-5.1高速版API“GLM-5.1-highspeed”，其模型输出速度达到400 tokens/s，刷新当前全球大模型厂商API的速度上限。GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景，现已面向智谱MaaS平台部分企业客户开放。