智谱 AI 宣布 GLM-4-Flash 大模型免费开放,支持 2
智谱 AI 今日宣布,GLM-4-Flash 适用于完成GLM-4-Flash 具备多轮对话、网页浏览、Function Call和长文本推理等功能,同时官方表示,通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等多种方法,在推理层面实现模型的延迟降低与速度提升,更大并发量和吞吐量不仅提升了效率,而且在预训练方面,官方引入了大语言模型进入数据筛选流程,获得 10T 高质量多语言数据,数据量是 ChatGLM3-6B 模型的 3 倍以上;同时采用了 FP8 技术进行预训练,提高了训练效率和计算量。
附相关链接如下:
体验地址:
说明文档:
