登录注册
NV H20重要信息更新
戈壁淘金
只买龙头的老司机
2024-03-02 09:18:03

英伟达对华"特供版"AI芯片H20的终端产品已可接受预订。根据草根调研,单卡售价根据性能外推预期在 $ 1.3-1.4万美金,目前国内Top2客户已下订单,乐观Q2出货。昨天国内两家大厂下了H20订单,量级比较大。全年H20出货量可能会在大几十万片,之前的市场预期应该是30万片左右。
         
浪潮信息涨停原因,两大厂下单数万片H20

国内两家大厂下单英伟达H20、L20测试中从产业得知,国内有两家大厂已向英伟达下订单采购数万片H20。据悉,其中一家厂商目前对H20持保守乐观态度。同时,英伟达另一中国特供版芯片L20 PCIE目前也在测试中,即将启动采购。

国产算力趋势非常明确、持续关注国产算力链我们认为,两家大厂关于H20的大单并不会冲击国产算力演绎逻辑。国产算力的趋势是明确且不可逆的。一方面,我国对芯片国产化的支持力度强而持续。国产芯片持续自主迭代,在实践中性能得到大幅提升。另一方面,近年来美国持续升级对华制裁,今年1月以来更是多方面收紧我国获取先进计算能力的途径。算力国产化是必由之路。
         
国产芯片占比持续提升

测算了 23、24年我国AI芯片市场各家占比情况。国产芯片占比可能从去年25%左右提升至40%到45%此次H20订单较超预期、建议关注中国NV链去年年底至今,国内外对H20在华出售的预期较为悲观,此次两家大厂的订单较超预期,建议关注浪潮信息、紫光股份等相关标的建议持续关注国产算力
            

H20:是高缓存、高带宽,但是算力性能差,这主要是M国禁令的要求和限制。H20卡算力性能差,大约是HW昇腾910算力的一半,缓存与带宽是比910B高,带宽是910B两倍。NV有NVlink架构。英伟达的卡是通过多卡使用、多卡堆叠模式,与国内HW的高算力的卡抗衡。国内910B的性能与A100单卡很接近,1)国内的卡弊端是互联带宽弱,卡间、AI服务器间弱;2)软件生态不够成熟。英伟达的卡是在这个软肋的基础上推出的,在互联带宽与CUDA生态上做的。
         
         
Q&A
Q:H20是H800做训练的6-7成。原来H的时候,算力使用效率是3-4成,新的H20加大带宽,组成集群的大模型训练效率可能比H800更好吗?
A:国内软件训练框架比较弱,国内是GPT1.0\2.0架构为主,H800算力性能很高,但还是在几百万的训练参数方面没有办法使用起来,H800使用效率很低。但是H20方面,更容易取得训练参数不是很高的方面,很适合多卡堆叠与多个AI服务器的使用。
         
         
Q:改良版芯片是更容易大模型训练的吗?
A:国内大模型训练方面,不能单独看硬件。一是卡,二是框架。GPT4.0是基本囊括国内所有知识,但国内3.0、4.0都没办法用,正规渠道都是1.0/2.0,训练参数、性能都局限了。即使H100有卡也训练不出来,因为底层软件有局限。英伟达推出H20的卡,是可以通过国内客户多买卡实现与A100、H800同样效率。NV可以多买卡,又满足M国禁令,也不会让基于GPT2.0训练模型框架训练处更高的模型,这个模式也是一举多得的。NV不会完全切断NV与国内的来往,硬件可以给,但是软件层面切断,国内没办法用千亿级训练模型的框架。  
NV的IB交换机,光模块的400G\800G不是必须的。因为H100 AI服务器,可以用400G光模块,也可以800G(8张卡是4个800G光模块)。因为AI服务器数量多了,光模块数量也会多的。组网方面,是NV用ib交换机,正常组网还是以太网交换机。
         
        
Q:H20产品的HBM3是一个板用了3个,就是算力是A100的30%,HBM用量一样?
A:单卡的HBM量与H800相近,H20的cowos的制程与800相比更简单。卡的算力高低,在于晶元制程,nm越低,集成度越高,算力越强。H20的算力来看,设计工艺是一般,还不如910B的算力设计工艺好。代工厂而言,可以用一些比较差的制造工艺来复用,成本下降了。唯一是HBM的好了,价值量3倍。
         
         
Q:H20的NVLINK是900GB/S,H800只是400,可以达到吗?
A:NVLINK对NV不是高端的,很成熟了,H系列都可以支撑。网络带宽支撑这么大,可以买更多的卡达到,nvlink的传输速度可以领先的。昇腾达不到的,现在是400G,8卡一连就是200了。
         
         
Q:H20组成集群的性能与HW的比较?
A:服务器卡间瓶颈,服务器间瓶颈。卡间互联910B的互联带宽是H20的一半,卡间互联性能下降一半。服务器间互联,英伟达有一分半IB交换机,没有替代解决方案。国内是400、800G集群交换机,算力损耗比较大。  
         
         
Q:H20使用液冷方案吗?
A:H20是风冷,液冷还是H100,750w功耗。H20加了2-3张卡,功耗是A100的3-4倍。
         
         
Q:H20组网会比原先的H800组网增加功耗及散热需求吗?
A:H20的散热会低于H800,因为算力、功耗低,散热会低的。

但也有另一些不同意见

B:相信很多人看过这个对英伟达高端显卡出货量的估算,其中认为中国互联网大厂的采购量很大,加起来可能达到了微软Azure的水平。但是我为此咨询了国内云计算大厂的朋友,他们认为严重高估了中国的采购量,甚至可能高估了几倍。

如果这个数据确有来源,最大的可能是将“采购登记”与“实际发货”混为一谈。英伟达的大卡高度供不应求,几个季度以后才发货是常态,中国厂商一个季度登记几万张是正常的,实际到手的可能是这个数字的几分之一。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
浪潮信息
工分
20.58
转发
收藏
投诉
复制链接
分享到微信
有用 44
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(19)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    03-02 12:48
    感谢分享
    2
    0
    打赏
    回复
    投诉
  • “韭菜”
    中线波段的老韭菜
    只看TA
    03-02 09:31
    谢谢分享
    2
    0
    打赏
    回复
    投诉
  • 耀华璟耀
    热爱评论的散户
    只看TA
    03-02 13:05
    感谢分享!
    1
    0
    打赏
    回复
    投诉
  • 秋丰
    中线波段的老韭菜
    只看TA
    03-02 13:02
    感谢梳理解读👍👍👍
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    03-02 11:13
    浪潮信息有给H20做供货吗
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    03-02 10:09
    感谢分享
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    03-02 09:42
    谢谢分享
    1
    0
    打赏
    回复
    投诉
  • 割伤的小韭菜
    春风吹又生
    只看TA
    03-02 09:35
    谢谢分享
    1
    0
    打赏
    回复
    投诉
  • 韭韭评论
    热爱评论的吃面达人
    只看TA
    03-04 07:15
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    03-03 20:58
    谢谢
    0
    0
    打赏
    回复
    投诉
  • 1
  • 2
前往