以网强算,用算创新;华为与互联网携手共行,拥抱AI与未来
- +1 你赞过了
【天极网IT新闻频道】两年前,整个互联网都在惊叹ChatGPT所带来的颠覆性体验;两年后,中国互联网公司开发的各类大模型产品不仅做出了自己的优势和特色,更已成为经受住14亿用户考验的AI新选择。而在技术、流量等一系列要素的刺激之下,我国互联网行业在2024年仍旧走出了增长曲线。
中国互联网能够抗住压力实现增长,当然与市场热点所带来的增量有关,更与底层技术的稳健进化有关。
助推互联网跨周期发展的底层动力
无论AI还是其他产品,互联网的历次升级都与基础设施性能的提升紧密捆绑、相互成就。因为只有在单位算力成本和性能不断优化的前提下,互联网才能持续为市场提供更先进、更复杂的产品,为消费者和千行百业赋能。而在算力需求一路高歌猛进的同时,由AI驱动的互联网产业升级也对基础设施提出了更多维度的需求。
在上一轮的云/容器变革中,节点的算力通常会被打散成细颗粒度更高的虚拟机,以满足海量分布式业务对灵活性和弹性的需求;但在AI和大模型应用当中,业务对基础设施的需求则恰好相反,节点需要组成更大规模的集群才能在算力层面满足训推业务需求。因此在集群内部,网络的技术规格、延迟、吞吐量等指标也会直接影响计算集群的整体性能。
换言之,计算与网络融合匹配之后的“轮上马力”才是真正决定互联网在AI时代前进速度的关键指标。因此,对于互联网行业来说,手握计算和网络两大根技术的华为正是理想的合作对象。而在技术因素之外,华为长期服务互联网所积累的惯性和势能也是促使双方共赴AI新时代的底层动力。
算网融合,共赴智能未来
计算和网络是华为长期倾力的两大根技术。其中,前者是指以鲲鹏和昇腾为代表的计算生态,而后者则包含了数据通信网、光网络、无线网等多种网络技术,能够应用在数据中心、广域网、园区等众多场景之中。
同时掌握两种根技术意味着,华为不仅能够从底层切入,助力用户实现计算与网络*大程度的协同,避免出现系统性短板;更代表华为能够为用户提供自主创新、可持续、可演进的产品方案和服务支撑,避免用户在基础设施领域受限于人。
01、澎湃算力,生态创新
在华为的计算生态中,鲲鹏通用处理器和昇腾AI处理器,二者既能以超节点形式组成万卡集群,应对万亿级参数大模型的训推业务,也能以单独节点的形式进入云化资源池,分别在各自的业务领域中发光发热,为海量业务提供支撑。
而在硬件算力的基础之上,华为也分别为两大系列处理器提供了完整且持续更新的软件堆栈,能够助力客户完成软件开发、编译、优化、AI模型训推等业务。
我们认为:原生是人工智能时代*大的安全,原生生态将是互联网持续在智能化时代获得长期价值和能力的基石。以昇腾原生为例:原生开发让应用开发更高效,性能更优异;而华为推出的原生开发体系则能为算子、模型和应用开发三大场景带来开放、高效、易用的全新体验。
同时,在原生技术的生态建设领域,华为则联合伙伴,累计培养了30多万昇腾原生的学生;从3万多原生贡献者中合入了9.5万行代码;联合伙伴/客户核心开发者原生打造了80多个融合大算子。
而在原生商业生态上,华为则发展了50多家APN(Ascend Partner Network)伙伴,孵化了20多个原生大模型以及50多个大模型应用,共同探索大模型在行业场景的实践。
随着智算时代到来,互联网行业也在加速拥抱openEuler,openEuler与各头部互联网企业携手联合创新,成为众多互联网核心业务场景的运行底座。例如百度和openEuler一起构建的智算操作系统BaiduLinux CloudOS,已成为百度智算云底座的重要组成部分,已在核心业务场景实现了规模化部署;京东云基于openEuler打造的云舰OS已实现商业化应用,应用于零售、科技金融等核心场景;美团基于openEuler开发的 MTOS,也已规模应用于外卖、买菜、各类大促活动等民生服务业务场景。
在鲲鹏920系列发布后,我们与互联网用户,在ARM原生、大数据、分布式存储、数据库、推荐等多个业务场景开展联合创新,取得系列的成果。鲲鹏生态进入快速发展期,如何高效迭代ARM和x86多路线版本成为互联网*为关心的问题,目前我们也已经实现关键技术突破,在互联网行业推出了鲲鹏920高性能版,在性能规格上实现了赶超。24年初,我们全面启动了鲲鹏原生开发计划,全面升级了鲲鹏开发工具链。未来,还将推出更多高性价比的产品解决方案,更开放的基础软硬件生态,持续助力互联网业务创新,为中国互联网的计算产业筑牢根基。
简言之,华为在过去的2024年依旧在用快速进化的算力产品和生态助力互联网向前发展,使能AI和其他业务能够用上更快、更省、更先进的基础设施。
02、以网强算,扩展无限
在推动算力产品进化的同时,华为也在加大研发与需求相匹配的网络解决方案,并能根据客户需求和组网规模提供对应的盒盒、盒框组网方案。
在技术层面,华为选择了基于RoCE的以太组网路线。其中,RoCE技术允许GPU通过网络直接进行跨节点的内存读写,且无需CPU参与,由此便可降低海量GPU之间的通讯延迟,并缓解网络丢包现象。结合更高带宽的400G交换机和华为独有的NSLB负载均衡技术,AI算力集群便可杜绝网络拥塞和丢包现象,避免集群出现性能下降、锁死等情况。
而以太网路线则能让AI算力集群在网络技术栈层面与整个数据中心保持一致,继而在数据中心层面实现一张网、统一管的运维效果,以实现运维效率和运维成本的一升一降。
相对于技术封闭的Infiniband网络,华为方案不仅用开放技术栈实现了类似的数据传输性能和效率,更能在大幅降低设备采购成本和运维技术门槛的前提下,提升集群的扩容能力,真正实现了多种优势特性的兼顾兼得。
2024年,B站选择盒盒组网的方案,构建的是一张千卡规模的AI算力集群。组网过程中,华为使用支持RoCE技术的400G交换机组建了Spine-Leaf架构网络,并实现了上下行带宽的1:1收敛。由此,集群内1024个GPU之间的所有通讯只需*多3跳即可完成,*低延迟仅2.8微秒,跨Spine网络延迟也仅为5.6微秒。而在带宽效率方面,方案则达到了同Leaf下点对点网络带宽利用率超98%、多对一网络带宽利用率超80%、All-to-All和AllReduce过程带宽利用率超98%等效果,使网络性能真正与算力和需求相匹配。
算力+运力始终是互联网产业的新质生产力
2024已经结束,2025款步而来;站在时间的分界线上驻足远眺,AI为互联网带来了新业务、新模式、新增长,是驱动产业持续发展的新质生产力。而如果“剥开”算法和应用的外壳,互联网产业增长的底层逻辑仍旧是计算、网络以及整套基础设施持续进化所带来的效率提升。因此,算力与运力的融合匹配、接力发展就是互联网产业的新质生产力。
而回望身后,我们也能轻易发现,同样的驱动力在十年前让互联网迈入了云时代,又在十年后推着互联网产业进入了AI时代。即便再过十年,互联网的业务形态和商业模式都变换了模样,底层的驱动力依然需要高效、强大且稳固。
也正是因为动力源不变,专注创新的互联网和钻研计算、网络等根技术的华为才能在更长的时间周期之中携手前行,建立跨越周期的紧密联接。而这样的联接也足以让双方走好面前的AI之路,共赴下一个技术周期,以及未来的每一个周期。
“数智世界 一触即达” 选择华为,让您的企业轻松数智化。
类型:广告最新资讯
热门视频
新品评测