登录注册
资深AI专家解读英伟达H20性价比-AI算力专家系列(二十九
金融民工1990
长线持有
2023-11-10 21:36:20

【情况解析】

1、本次卡分为 2 大类,H20 与 L20+L2。H20 与 H800 类似,L20\L2 用于其他架构。

1)L20\L2 基于 pcie,在 intel 第三代平台出来的,性能比较低。英伟达出卡是因为 intel 第三代平台在国内将继续 1 年销量,不用深入研究,带宽、缓存、算力比较低。

2)H20:是高缓存、高带宽,但是算力性能差,这主要是美国禁令的要求和限制。H20 卡算力性能差,大约是华为昇腾 910 算力的一半,缓存与带宽是比 910B 高,带宽是 910B 两倍。

NV 有 NVlink 架构。英伟达的卡是通过多卡使用、多卡堆叠模式,与国内华为的高算力的卡抗衡。国内 910B 的性能与 A100 单卡很接近,1)国内的卡弊端是互联带宽弱,卡间、AI服务器间弱;2)软件生态不够成熟。英伟达的卡是在这个软肋的基础上推出的,在互联带宽与 CUDA 生态上做的。

2、英伟达官宣之后,会引入测试与采购。H20 的价格没有官方,价格是比 910B 价格低。产品方面,H20 生产工艺不是很高,不用 cowos 产能,所以对于卡的成本有比较大的节省。

NV 有 A\V100 工艺,H20 可以用他们的工艺封装,成本节省。国内厂商的封装刚刚起步,成本没有优化,所以 NV 有优势(制造工艺的成本节省)。2-5 个 H20 的性能达到一个 A100,可以达到互联特性,又可以多卖了卡,也赚钱,也规避美国禁令风险。H20 没有官方的价格,价格不会高于 910B 价格,910B 的市场价格 5-6w 一块,A100 的 7w RMB 一个。3 个 H20 替代 A100,明显好的。

3、给国内云厂商供货,Q1 小批量,Q2 批量供应。华为推出 910B,明年 910B 销量也会 15-20w张 910B 销量,对国内卡是不错的量级。H20 的销量不会很差,30-40w 张。国产卡与 NV 的卡还是在相互 PK 的阶段。拉开差距是明年下半年华为 920 出来后,NV 挑战,920 与 H100相近,可以替代 H20。NV 的 H20 是一个临时性措施,可能会对华为有不小影响。

Q&A】

Q:H20 是 H800 做训练的 6-7 成。原来 H 的时候,算力使用效率是 3-4 成,新的 H20 加大带宽,组成集群的大模型训练效率可能比 H800 更好吗?

A:国内软件训练框架比较弱,国内是 GPT0\0 架构为主,H800 算力性能很高,但还是在几百万的训练参数方面没有办法使用起来,H800 使用效率很低。但是 H20 方面,更容易取得训练参数不是很高的方面,很适合多卡堆叠与多个 AI 服务器的使用。

Q:改良版芯片是更容易大模型训练的吗?

A:国内大模型训练方面,不能单独看硬件。一是卡,二是框架。GPT0 是基本囊括国内所有知识,但国内 0、0 都没办法用,正规渠道都是 0/0,训练参数、性能都局限了。

即使 H100 有卡也训练不出来,因为底层软件有局限。英伟达推出 H20 的卡,是可以通过国内客户多买卡实现与 A100、H800 同样效率。NV 可以多买卡,又满足美国禁令,也不会让基于 GPT0 训练模型框架训练处更高的模型,这个模式也是一举多得的。NV 不会完全切断NV 与国内的来往,硬件可以给,但是软件层面切断,国内没办法用千亿级训练模型的框架。

NV 的 IB 交换机,光模块的 400G\800G 不是必须的。因为 H100 AI 服务器,可以用 400G光模块,也可以 800G(8 张卡是 4 个 800G 光模块)。因为 AI 服务器数量多了,光模块数量也会多的。组网方面,是 NV 用 ib 交换机,正常组网还是以太网交换机。

Q:H20 产品的 HBM3 是一个板用了 3 个,就是算力是 A100 的 30%,HBM 用量一样?

A:单卡的 HBM 量与 H800 相近,H20 的 cowos 的制程与 800 相比更简单。卡的算力高低,在于晶元制程,nm 越低,集成度越高,算力越强。H20 的算力来看,设计工艺是一般,还不如 910B 的算力设计工艺好。代工厂而言,可以用一些比较差的制造工艺来复用,成本下降了。唯一是 HBM 的好了,价值量 3 倍。

Q:H20 的 NVLINK 是 900GB/S,H800 只是 400,可以达到吗?

A:NVLINK 对 NV 不是高端的,很成熟了,H 系列都可以支撑。网络带宽支撑这么大,可以买更多的卡达到,nvlink 的传输速度可以领先的。昇腾达不到的,现在是 400G,8 卡一连就是 200 了。

Q:训练框架是指?

A:训练模型都是用语言框架支撑,软件框架。软件更新换代,或者技术迭代,国内训练语言框架方面,软件版本比较低,为 0、0,海外升级到 GPT 0 版本。API 端口不给国内账户申请试用,所以体会不到 0 里面软件功能。美国封锁 A100\H100 是不愿意分享制造工艺。

Q:为什么 H20 卡不需要 covos 封装?

A:看到有 HBM,但是 cowos 是 4 或 3nm 以上,是高端封装,所以 A100\A800\H20,制造工艺不像 H100 那么高,所以封装架构不需要 cowos,成本下降。明年 H100 北美需求旺盛,所以不会为了中国的量,占用封装产能。

Q:对算力租赁影响?

A:从前大部分是 A\H800,但是现在对于禁令以后,算力租赁停滞了。现在 NV 推出 H20 以后,可以组建算力中心、算力租赁中心。可以通过 NVLINK、IB 网络架构,使用多张 H20,多个基于 H20 的 AI 服务器,搭建数据中心。大部分算力公司是基于 cuda 架构的,H20 的出现会帮助算力租赁中心缓解数据中心搭建的缺卡情况。

Q:是不是可以理解为缓解算力的短缺,限制算力的涨价,对算力租赁公司偏利空?

A:算力公司来讲,是利空的状态。算力租赁行业对卡的依赖性很强,没有生存的价值。

Q:H20 可以保留 NVLINK,此前带宽要求不影响了吗?

A:限制 A\H100 时候,有限制网络互联带宽。但是现在 11 月份对 H800 禁令来看,取消带宽限制。这是美国政府的问题,如何既不给高端卡,但是不切断业务来往,买更多的卡,达到 A\H100 的性能。NV 会对 NVLINK 卡间互联做文章,堆叠卡提升性能,是一个好的商业模式。

Q:H20 组成集群的性能与 HW 的比较?

A:服务器卡间瓶颈,服务器间瓶颈。卡间互联 910B 的互联带宽是 H20 的一半,卡间互联性能下降一半。服务器间互联,英伟达有一分半 IB 交换机,没有替代解决方案。国内是 400、

800G 集群交换机,算力损耗比较大。

Q:昇腾卡的性能对标 A100,软件方面差距在哪里?

A:1)软件方面,商用的软件方面,基本的高端软件都是海外的软件公司。国内公司做兼容性适配是很困难的,NV 的出卡之前会做相应性能兼容性测试与调优,所以 NV 在销售平

台上使用方面是最好的。

2)国内卡的客户在互联网公司,他们不会用商业软件,是开源软件做开发,因为每个互联网公司商用方式不同,会做一些开发。他们用互联网的自研平台,迁移适配到国内的卡方面,适配成本迁移成本比较低。大家对互联网行业很关注,国内芯片行业对其也很关注,因为切入 NV 中,互联网是最容易切入的,没有商业软件的影响,都是自研。软件开发周期比硬件长得多。

Q:17 号禁令下单之后,会有 H20 订单的转换吗?还是再次重新下单呢?

A:禁令以后得订单取消掉了,NV 的取消。所以 H20 的订单是重新来的,不能同等替代。

Q:阉割版上市有用吗?客户端需要 4 多久业务适配?

A:英伟达的卡在于互联网公司,适配到小批量-大批量,需要半年时间,从引入测试到小批量是半年。卡的阶段是英伟达的设计完成,自身做检测,但没有下方代工厂商,交付给互联网引入测试,下方给服务器代工厂小批量生产调试,再做小批量供应,与互联网同步,半年采购。

Q:大家从训练模型的角度,到底是看 INT8 还是看 FP16 甚至是 FP32,感觉说法很多,我们评判国内外的卡主要是看哪个指标的算力呢?

Q:主要是 FP32 与 FP64,FP16 是国内由于设计工艺原因,没办法达到,真正看浮点运算,还是 FP32 与 FP64。英伟达基本不会做 FP16 浮点运算参数。国内模型框架,FP16 还是可以用的,但还是一旦训练参数激增,就是 FP32 与 FP64。

Q:相对 H100 等先进芯片,NV 变通方案会对成本上升多少呢?

A:运营成本上升会与卡的采购量上升成正比的。以一个通俗例子来看,H100 的卡的运营成本,与 H800 的成本不同,空间、功耗、人员费用方面,卡的费用都是很高的。H20 比 H100功耗有一些下降,但是比 A100 提升不少,通过 H20 来看,未来大批量使用的成本提升 A100的 3-4 倍,比 H100 低一些。

Q:H20 使用液冷方案吗?

A:H20 是风冷,液冷还是 H100,750w 功耗。H20 加了 2-3 张卡,功耗是 A100 的 3-4 倍。

Q:H20 组网会比原先的 H800 组网增加功耗及散热需求吗?

A:H20 的散热会低于 H800,因为算力、功耗低,散热会低的。

Q:现在英伟达有了合规产品,但是由于单卡算力降下,是不是意味着同样算力集群需要更多的服务器?

A:会的,H20 留下很多带宽的原因,让国内的用户实现一些堆叠。

Q:假设有足够买卡资源和不考虑能耗,基于 H20 算力集群算力能否达到基于 H100 算力集群算力?

A:可以的。

 


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
恒信东方
S
先进数通
S
工业富联
工分
3.54
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-11-12 09:26
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往