登录注册
【西部计算机】GH200的不同观点:颠覆传统计算机架构
灯盏糕
为国接盘的散户
2023-05-30 09:18:39
【西部计算机】GH200的不同观点:颠覆传统计算机架构,GPU上、CPU下,利好寒武纪、海光信息

事件:5月29日,英伟达披露GH200,引发市场大量讨论,主要集中在光模块上。

评论:
我们认为应该从更大的视野看待GH200带来的变化。GH200代表了一种新的趋势,即在AI大模型时代,GPU大厂再次强化了自身的王者地位,GPU上、CPU下,而GPU的权杖则是通信能力(mallonox)+掀桌子重塑生态(自研arm CPU)。过去大家更重视的是AI GPU芯片+CUDA生态的软硬件协同优势,而GH200则告诉大家,除了芯片+软件生态,通信能力+掀桌子重塑生态这另外两道护城河有多深。

展开:
一、GH200的256卡和32台8卡H100服务器(8*32=256)组网相比,最大的区别和优势有两个:
1、从2路CPU带8卡GPU到CPU+GPU一一对应,甩开intel CPU的限制,GPU从外挂升级成计算机架构的核心。
——传统架构下,在服务器内部,8张GPU焊在一张主板上,通过PCB上的铜线接入nv switch,实现8张GPU的相互通信。对外通信时,则因2路x86服务器带8张GPU,GPU是CPU的外挂,服务器之间的通信受限于CPU到GPU、CPU之间的通信限制,8张GPU只能排队串行對服务器外通信,限制了訪問速度。
­——而GH200,则通过英伟达自研ARM CPU代替intel CPU,和GPU一一搭配成单台服务器,突破了2张CPU带8张GPU的限制,GPU两两之间均可采取直连,突破了传统2带8架构下服务器之间通信受intel CPU限制的上限,实现了3-7倍的内存访问速度。
2、arm架构替代intel X86架构,CPU的新能更加灵活,如复杂计算等,有助于整个系统的任务在GPU和CPU之间分配。实际上,很多计算负载并不是仅在GPU上,CPU也要承担当量负载,因此arm+GPU的架构对实现诸如训推一体等功能有极大提升,整个系统的任务灵活性可能有极大提升。

二、GH200的挑战:
1、英伟达这种GPU上、CPU下的掀桌子行为,对计算机架构是重大变化,且涉及到指令集的变化,历史上来看阻力很大;
2、成本将成为胜负核心。GH200意味着全系统由英伟达自研甚至自产,从历史上来看,英伟达自产的成本都远远高于OEM或者开放生态。即使开放给OEM,英伟达也需要大量重写相关软件适配硬件架构,并整合大量arm生态的开源软件库,效果尚待观察。

三、结论和建议
1、从目前英伟达披露微软等大厂的采购意愿,能看出大厂由于自身的能力较强,愿意接受这种重大的体系架构变化带来的红利。我们认为GH200成功的概率不低。
2、GH200给整个AI GPU产业指明了新的发展方向:除了AI GPU本身和软件适配,通信能力(mallonox)+掀桌子重塑生态(自研arm CPU)必须成为未来AI GPU乃至整个数据中心GPU发展的新趋势。新狮王将会分享老狮王的地盘,停滞是没有前途的。
3、相关标的:寒武纪、海光信息等。

联系人:邢开允、赵宇阳
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
寒武纪
S
海光信息
工分
7.66
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据