你的位置:AG庄闲游戏官网首页 > 关于我们 > AG庄闲和游戏 华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU不错在一说念了!

AG庄闲和游戏 华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU不错在一说念了!

时间:2026-03-14 05:53 点击:72 次

AG庄闲和游戏 华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU不错在一说念了!

快科技3月8日音信,上海东说念主工智能实验室(上海AI实验室)官方告示,基于此前的DeepLink混训时代决议、跨千公里多智算中心长稳混训千亿参数大模子,崇敬推出DeepLink多元算力夹杂推理加快决议,好意思满了对华为昇腾、沐曦、阿里平头哥、壁仞等多款国产GPU芯片的夹杂救援与协同推理。

据悉,DeepLink混推决议基于妥洽推理中间件、低时延通讯、智能流量路由、战略求解器等原创时代,不仅可对多款芯片夹杂救援与协同推理,性能也大幅升迁,对比单一芯片决议,推理时延TTFT最大可优化34.5%,推理蒙胧最大可升迁32%。

近些年,国产AI GPU如数见不鲜,性能越来越强,但一方面齐是各利己战,另一方面大模子推理时代也需要潜入优化和升迁。

上海AI实验室在国产GPU异构算力中,应用了预填充-解码区别(PD区别)战略,考据了夹杂芯片高效协同推理的旅途。

归拢数据中心内不同规格属性的GPU芯片组合优化使用,不错酿成最具性价比的异构算力配比。

具体好意思满上,上海AI实验室通过四大原创时代底座,好意思满了对异构算力资源的兼容救援。

推理中间件(DLInfer):

以轨范化会通算子接口买通表层框架与底层硬件壁垒,好意思满算法模子在多元硬件上的妥洽推理,AG庄闲和游戏裁减应用门槛。

高速通讯库(DLSlime):

全面兼容各类主流物理联结契约,好意思满跨架构确立高速互联,中枢场景带宽利用率阻止97%;具有较强的异步惩办才智,可好意思满野心与通讯的访佛。

智能流量路由系统(DLRouter):

撑捏KVCache感知的恳求路由,最大箝制减少重复或访佛恳求,从简野心资源,好意思满分散式集群负载平衡分拨。

战略求解器(DLSolver):

自动获得异构芯片全标的评测数据,结合模子竖立以及用户就业等第主义等输入,匹配最优PD区别竖立战略,兼顾推感性能与本钱。

单一算力平台推理加快方面,不错好意思满在华为昇腾A2上,针对千卡限制下的化学数据生成场景,蒙胧率升迁61.9%;在沐曦曦云C500上,MinerU多模态生成推理加快60%。

多款国产GPU芯片的深度夹杂救援与协同推理方面,千卡限制推理集群实测数据标明,在多模态生成、高并发智能就业等典型场景下,比单芯片决议推理时延TTFT最大可优化34.5%;

{jz:field.toptypename/}

在科学论文惩办等长输入短输出推理任务中,推理蒙胧可升迁32%。

值得一提的是,除了以上四家,寒武纪、燧原科技、天数智芯、无问芯穹、商汤科技、中科晨曦等也齐是上海AI实验室和DeepLink时代决议的合营伙伴。

坚信会看到越来越多的国产GPU并肩作战!

{jz:field.toptypename/}

参考荟萃:

DeepLink官网:https://deeplink.org.cn/home

DeepLink Github:https://github.com/DeepLink-org

DLInfer仓库:https://github.com/DeepLink-org/dlinfer

DLSlime仓库:https://github.com/DeepLink-org/DLSlime

DeepLink合营伙伴

【本文收尾】如需转载请务必注明出处:快科技

拖累剪辑:上方文Q

著述践诺举报

]article_adlist-->   声明:新浪网独家稿件,未经授权绝交转载。 -->
回到顶部
服务热线
官方网站:http://www.cltarp.com/
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:888888888
邮箱:@http://www.cltarp.com/
地址:武汉东湖新技术开发区光谷大道国际企业中心
关注公众号

Copyright © 1998-2026 AG庄闲游戏官网首页™版权所有


AG庄闲游戏官网首页-AG庄闲和游戏 华为昇腾、阿里平头哥、沐曦、壁仞:四大国产GPU不错在一说念了!

技术支持:®ag庄闲游戏  RSS地图 HTML地图