1)2024年2月19日,国务院国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会,10家中央企业签订倡议书,表示将主动向社会开放人工智能应用场景。
2)具有央企、国资或者地方政府背景的智算中心已进入投建高发期。根据《IT时报》记者对国内最近半年的智算中心建设进行不完全梳理后报道,具有央企、国资或者地方政府背景的智算中心已进入投建高发期,动辄数亿至数十亿的招投标项目此起彼伏,总招投标金额已超百亿元。其中,电信运营商走在前沿:①中国移动于近日发布《2023年至2024年新型智算中心(试验网)采购》并集采1500台液冷AI训练服务器、158台风冷AI训练服务器、80台AI推理服务器,以及数据中心交换机、分布式文件存储等配套设备,总投资额将近32亿元。中标候选人包括华为、新华三、烽火通信、中兴通讯、华鲲振宇、神州数码等。②中国电信于2023年10月15日公布AI算力服务器(2023-2024年)集中采购项目候选人,总集采金额超84亿元,超聚变、华鲲振宇等多家入围。从招标文件来看。③中国联通于2023年2023年12月1日发布《山西晋云(能源智算云)算力平台新建工程软硬件采购项目》需求公示,预算1.44亿元。
1)根据外媒TrendForce报道,面向中国推出的H20芯片将在今年的GTC 2024大会(3月18日-3月21日)开完之后,全面接受预订,最快四周可以供货。根据华尔街见闻报道,H20降规型号可以认为是H800和L40S的裸片的后道物理点断工序的改造产物,算力水平约等于50%A100和15%H100,更适用于垂直类模型的训练/推理,不容易满足千亿参数级LLM的训练需求。
2)2024年3月1日,戴尔公布2024财年Q4财报。第四季度实现营收223亿美元,全年实现营收884亿美元。其中,戴尔AI优化服务器势头强劲,订单环比增长近40%,出货量达到8亿美元;积压订单几乎翻倍,2024财年结束时达到29亿美元。戴尔副董事长兼首席运营官克拉克表示,尽管H100的交货时间有所改善,但需求继续超过GPU供应。人们对配备下一代AI GPU(包括 H200 和 MI300X)的AI优化服务器的订单产生了浓厚的兴趣。大多数客户仍处于人工智能之旅的早期阶段。
1)2024年2月15日,OpenAI发布文生视频模型Sora,展示出许多量带你。我们认为,1分钟长度有望大规模应用在短视频领域,扩展视频的能力也有望制作长视频,或将带来新一轮内容创作产业革命。
2)在训练端,根据GPU Utils报道,GPT3.5同级别模型需要数千张H100、GPT4或对应数万张A100、GPT5或对应数万张H100,模型训练对大规模算力集群的需求呈现刚性;在推理端,仅考虑文字问答场景,根据百度智能云、科创板日报、快科技、英伟达等报道,我们估算,大约需要数万张H100、对应算力投入数十亿美元;而多模态或有更多提升。
风险提示:技术迭代不及预期、经济下行超预期、行业竞争加剧。