事件:北京时间6月14日凌晨AMD将举办名为“AMD数据中心和人工智能技术首映式”的活动,以展示其最新的数据中心和AI技术。此前宣布的MI300加速卡,亦有望在此次发布会明确上市日期。
1、MI300为AMD最强AI芯片,对标英伟达H100
MI300目前是AMD AI领域最强芯片。该芯片被业界认为对标英伟达H100,体现在:
【架构】MI300是业界首款“CPU+GPU+内存”一体化的数据中心芯片,也是AMD第三代CDNA架构(专门针对HPC)产品。基于高度整合的架构,MI300晶体管数量多达1460亿个,多于H100的800亿个。
【内存】MI300采用Chiplet技术连接CPU+GPU,使两大核心共享HBM,减少内存带宽占用。MI300上采用的最新HBM3内存带宽达819GB/s,英伟达NVLink-C2C技术带宽为900GB/s。
【算力】MI300的AI性能是MI250X的8倍,而MI250X FP32单精度峰值性能为47.9TFlops。相比之下,英伟达H100 NVL的FP32单精度浮点性能为134TFlops。
2、AMD相比Nvidia的主要优势
1)MI 300性能显著超越H100,在部分精度上的性能优势高达30%甚至更多;
2)Chiplet第一人,CPU+GPU都是自己的(MI300+Genoa),通过TSV的链接方式,产品组合性能更高,成本更低
3)收购赛灵思以后,在加速卡领域的定制化服务大幅领先英伟达(Xilinx AI Engine),协助云厂商在特定算法模块上进行训练,进一步降本增效
3、AMD的预期差
1) AMD目前生态差,干不过CUDA
目前AMD生态确实更差,在大模型的部分训练区域存在一些问题,随着微软和其他云厂商对行业二供的大力扶持,这些问题有望很快解决,AMD自己的生态成型是大概率事件
2)没有GH200,盈利能力不如英伟达
GH200这款芯片不是在设计上进行突破,而是把原本8块GPU的Server换成了256块,通过增大连接数的方式进行集群优化,本质上是一件你行我也行的工作,这东西就看苏大姐愿不愿意搞,接下来可能也会发布大规模集群式的算力卡。
4、AMD产业链梳理
【封装测试】通富微电(AMD封装核心供应商)
【PCB】奥士康,胜宏科技,一博科技,景旺电子(AMD封装基板)
【封测设备】金海通(AMD封测环节分选机核心供应商)
【分销商】中电港(AMD CPU分销商)
【Chiplet&IP】芯原股份(Chiplet;微软Win 10 IoT合作;AMD ALveo开发)
【服务器组装厂】工业富联