智谱正式发布并开源新一代大模型GLM-4.6 寒武纪、摩尔线程完成适配

每经记者 可杨    每经编辑 陈俊杰    

9月30日,《每日经济新闻》记者获悉,国内大模型企业智谱正式发布并开源新一代大模型GLM-4.6,在Agentic Coding (代理式编码)等核心能力上实现大幅跃升。

智谱官方宣布,GLM-4.6已在寒武纪AI芯片上实现FP8+Int4(一种混合精度计算技术)混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4模型—芯片一体化解决方案。在保持模型精度不变的前提下,该方案大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径和示范意义。

与此同时,摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型,充分验证了 MUSA((Meta-computing Unified System Architecture,元计算统一系统架构)架构及全功能GPU在生态兼容性和快速适配能力方面的优势。

寒武纪与摩尔线程完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。GLM-4.6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务。

责编 陈俊杰

Copyright© 2014 成都每日经济新闻社有限公司版权所有,未经许可不得转载使用,违者必究

互联网新闻信息服务许可证:51120190017  

网站备案号:蜀ICP备19004508号-2  

川公网安备 51019002002025号