今日,智谱AI正式上线并开源全新一代大模型GLM-5。作为面向复杂系统工程与长程Agent任务打造的新一代模型,GLM-5在Coding与Agent能力上实现开源SOTA表现,在真实编程场景中的使用体验已逼近Claude Opus 4.5。当前,昆仑芯完成Day 0深度推理适配。通过底层算子优化与硬件加速能力,GLM-5已在昆仑芯产品上实现高吞吐、低延迟的稳定运行。
Day 0适配落地,软硬协同助推高效部署
在本次Day 0适配合作中,昆仑芯团队深度协同智谱AI,依托在底层算子优化与工具链建设方面的长期技术积累,围绕GLM-5的模型结构与推理特性开展了针对性的联合优化。双方在模型正式上线前,即完成适配与性能调优,确保发布当日实现稳定、高效运行。本次适配不仅实现Day 0支持,更在两大主流开源推理框架vLLM与SGLang上完成验证落地。在算力层面,昆仑芯高性能算子快速完成对GLM-5的DSA与MoE架构适配,并结合INT8量化、MTP优化及双机PP并行等技术手段,显著提升GLM-5在昆仑芯集群环境下的推理吞吐与整体运行效率。
昆仑芯软件负责人王勇表示:“GLM-5的Day 0深度推理适配,是昆仑芯软件生态能力和软硬件协同能力的一次集中体现。通过底层算子重构与推理框架协同优化,我们实现了模型结构特性与硬件架构能力的深度匹配,确保模型在上线首日即可稳定释放高性能算力。”
此次高效适配,得益于昆仑芯自研软件栈的出色兼容性和高效适配能力。昆仑芯提供从驱动到专用库的完备软件栈,全面覆盖模型开发与部署关键环节。该软件栈高度兼容主流AI开发生态,在保障计算性能充分释放的同时,有效降低开发门槛与模型迁移成本,使客户能够以更低的适应成本与更短的部署周期完成AI模型开发与部署落地。
坚实算力底座,万卡集群支撑大规模应用
截至目前,昆仑芯已与国内外多款主流大模型完成适配,其中多个模型更实现“发布即适配、上线即可用”。面向企业及开发者,昆仑芯正持续完善模型适配与部署能力,全面支持各类模型架构与算法创新,助力开发者获得更流畅、高效的开发与部署体验。
在集群建设方面,2025年2月,昆仑芯成功点亮昆仑芯P800万卡集群,这是国内首个正式点亮的自研万卡AI集群。同年4月,该集群规模进一步扩展至3.2万卡。未来,昆仑芯还将不断支持国产算力集群建设,推动模型在真实场景中的规模化应用,助力国产模型的创新发展。
软硬协同创新,共建国产AI开放生态
未来,昆仑芯将持续深耕全栈技术研发,强化软硬协同与生态共建能力,为国产算力高质量发展提供强劲动能。昆仑芯将携手生态伙伴与开发者深化国产模型与国产算力融合创新,共建开放共赢的大模型生态,加速AI技术在更多真实产业场景中的规模化落地应用,推动国产算力高质量发展。

在线留言询价
| 型号 | 品牌 | 询价 |
|---|---|---|
| TL431ACLPR | Texas Instruments | |
| BD71847AMWV-E2 | ROHM Semiconductor | |
| RB751G-40T2R | ROHM Semiconductor | |
| CDZVT2R20B | ROHM Semiconductor | |
| MC33074DR2G | onsemi |
| 型号 | 品牌 | 抢购 |
|---|---|---|
| TPS63050YFFR | Texas Instruments | |
| ESR03EZPJ151 | ROHM Semiconductor | |
| BP3621 | ROHM Semiconductor | |
| IPZ40N04S5L4R8ATMA1 | Infineon Technologies | |
| STM32F429IGT6 | STMicroelectronics | |
| BU33JA2MNVX-CTL | ROHM Semiconductor |
AMEYA360公众号二维码
识别二维码,即可关注
请输入下方图片中的验证码: