据报道,智谱宣布,面向部分企业客户提供GLM-5.1高速版API“GLM-5.1-highspeed”,其模型输出速度达到400 tokens/s,刷新当前全球大模型厂商API的速度上限。GLM-5.1高速版适用于AI编程、实时交互、商业决策、实时语音等对响应延迟要求极高的场景,现已面向智谱MaaS平台部分企业客户开放。