AG庄闲和游戏华为昇腾、阿里平头哥、沐曦、壁仞：四大国产GPU不错在一说念了！

你的位置：AG庄闲游戏官网首页 > 关于我们 > AG庄闲和游戏华为昇腾、阿里平头哥、沐曦、壁仞：四大国产GPU不错在一说念了！

时间：2026-03-14 05:53 点击：72 次

快科技3月8日音信，上海东说念主工智能实验室（上海AI实验室）官方告示，基于此前的DeepLink混训时代决议、跨千公里多智算中心长稳混训千亿参数大模子，崇敬推出DeepLink多元算力夹杂推理加快决议，好意思满了对华为昇腾、沐曦、阿里平头哥、壁仞等多款国产GPU芯片的夹杂救援与协同推理。

据悉，DeepLink混推决议基于妥洽推理中间件、低时延通讯、智能流量路由、战略求解器等原创时代，不仅可对多款芯片夹杂救援与协同推理，性能也大幅升迁，对比单一芯片决议，推理时延TTFT最大可优化34.5％，推理蒙胧最大可升迁32％。

近些年，国产AI GPU如数见不鲜，性能越来越强，但一方面齐是各利己战，另一方面大模子推理时代也需要潜入优化和升迁。

上海AI实验室在国产GPU异构算力中，应用了预填充-解码区别（PD区别）战略，考据了夹杂芯片高效协同推理的旅途。

归拢数据中心内不同规格属性的GPU芯片组合优化使用，不错酿成最具性价比的异构算力配比。

具体好意思满上，上海AI实验室通过四大原创时代底座，好意思满了对异构算力资源的兼容救援。

推理中间件（DLInfer）：

以轨范化会通算子接口买通表层框架与底层硬件壁垒，好意思满算法模子在多元硬件上的妥洽推理，AG庄闲和游戏裁减应用门槛。

高速通讯库（DLSlime）：

全面兼容各类主流物理联结契约，好意思满跨架构确立高速互联，中枢场景带宽利用率阻止97％；具有较强的异步惩办才智，可好意思满野心与通讯的访佛。

智能流量路由系统（DLRouter）：

撑捏KVCache感知的恳求路由，最大箝制减少重复或访佛恳求，从简野心资源，好意思满分散式集群负载平衡分拨。

战略求解器（DLSolver）：

自动获得异构芯片全标的评测数据，结合模子竖立以及用户就业等第主义等输入，匹配最优PD区别竖立战略，兼顾推感性能与本钱。

单一算力平台推理加快方面，不错好意思满在华为昇腾A2上，针对千卡限制下的化学数据生成场景，蒙胧率升迁61.9％；在沐曦曦云C500上，MinerU多模态生成推理加快60％。

多款国产GPU芯片的深度夹杂救援与协同推理方面，千卡限制推理集群实测数据标明，在多模态生成、高并发智能就业等典型场景下，比单芯片决议推理时延TTFT最大可优化34.5％；

{jz:field.toptypename/}

在科学论文惩办等长输入短输出推理任务中，推理蒙胧可升迁32％。

值得一提的是，除了以上四家，寒武纪、燧原科技、天数智芯、无问芯穹、商汤科技、中科晨曦等也齐是上海AI实验室和DeepLink时代决议的合营伙伴。

坚信会看到越来越多的国产GPU并肩作战！

参考荟萃：

DeepLink官网：https://deeplink.org.cn/home

DeepLink Github：https://github.com/DeepLink-org

DLInfer仓库：https://github.com/DeepLink-org/dlinfer

DLSlime仓库：https://github.com/DeepLink-org/DLSlime

DeepLink合营伙伴

【本文收尾】如需转载请务必注明出处：快科技

拖累剪辑：上方文Q

著述践诺举报

]article_adlist--> 　　声明：新浪网独家稿件，未经授权绝交转载。 -->

AG庄闲和游戏 华为昇腾、阿里平头哥、沐曦、壁仞：四大国产GPU不错在一说念了！