登录注册
AI算力专家
金融民工1990
长线持有
2023-11-14 21:30:21

一、综述讨论了升腾910D和H20在算力和集群化方面的优劣,以及未来的采购策略。公司倾向于采购国产化的升腾产品。讨论了其他AI芯片的能力和选择,以及未来训练需求的增长。对于万亿级规模的模型训练,还需要具体场景和部署形式的支持。讨论了英伟达在生态建设方面的优势和挑战。英伟达H20开发计划的时间安排和供应链问题也被提及。讨论了国内算力行业的供给情况紧张,特别是针对A100等高性能卡的供应。阿里云的算力供应与业务发展之间的关系,以及不同类型客户对算力的需求。讨论了H20和AIA的性价比问题。华为在算力问题上突破难度较大,需要持续优化和调整。大厂采取复合型策略,停止租赁A100芯片,探索采购920B芯片。

二、详细介绍

升腾910D和H20的比较讨论了升腾910D和H20在算力和集群化方面的优劣,以及未来的采购策略。虽然H20的理论值较高,但考虑到成本和采购量,升腾910D可能更适合。长期来看,公司倾向于采购国产化的升腾产品。其他AI芯片的能力和选择,以及未来训练需求的增长。公司计划推出新的等级模型,需要更高的算力支持。综合考虑,公司可能会选择购买智能机电产品作为主要供货商。

H20价格和性能讨论讨论了H20芯片的价格和性能,以及与H800的比较。根据目前的消息,H20的价格约为H800的70%到80%。然而,最终采购成交价可能会因采购量而有所不同。讨论还涉及到英伟达的算力支撑方以及明年的910C芯片的性能和替代HR的能力。总体而言,讨论围绕着如何选择适当的芯片以满足需求展开。

新河AI网络架构的使用情况及优势新河AI网络架构的使用情况和优势。提到了该架构可以支持万亿参数的大模型,并且可以适配目前的主网。虽然存在一些适配工作量,但整体上来说,该架构对集群能力有所提升。然而,对于万亿级规模的模型训练,还需要具体场景和部署形式的支持。理论上来说,支持万亿级别的模型训练在目前的集群能力下是可行的,但实际情况可能存在较大差异。同时,讨论了达到支持万亿参数模型所需的集群规模,最基础的情况下也需要上万匹的集群。

英伟达生态建设的护城河和挑战英伟达在生态建设方面的优势和挑战。英伟达通过针对大型软件的兼容性测试和调优等措施,建立了天然优势。然而,建设生态需要时间和资源,并且会增加成本。尽管如此,一旦生态建设完成,将能满足客户需求并带来增量市场。预计英伟达生态的建设需要两三年的时间。

英伟达H20开发计划及政策风险英伟达H20开发计划的时间安排和供应链问题。预计下周开始开发布会,但具体的供应时间尚不确定。根据对话,英伟达H20可能需要重新签单,并且供应时间可能延长到明年三月底。然而,政策风险仍然存在,因为明年可能会面临新的制裁。整体而言,与英伟达的合作存在较大的政策不确定性,使得后续合作调整变得困难。

国内算力行业供给情况及卡的供应紧张国内算力行业的供给情况紧张,特别是针对A100等高性能卡的供应。现在很难从国内渠道搞到这些卡,而海外建设IDC也存在风险。生成卡的供给也非常紧张,交付时间长且卡

顿。目前各大互联网厂商的现有卡的情况不明,但A100等卡已经不对外租赁,后续可能还会降低租赁占比。

阿里云算力紧张影响业务阿里云的算力供应与业务发展之间的关系。提到了阿里云官网下架A100服务器,可能是因为算力不够。对于商业化的业务,需要大量的算力支持,因此可能会影响到业务的发展。

然而,阿里云会尽量保证供应,但价格可能会有所上涨。整个阿里巴巴集团换了CEO,可能会对阿里云的发展产生一定影响。

阿里云算力租赁情况及应用推进阿里云在保障大客户需求的同时,也需要考虑中小客户和非战略客户的租赁情况。目前阿里云的算力租赁服务受到众多大客户的欢迎,其中一个项目使用了大约100匹算力,主要用于人工智能应用。阿里云也在持续关注市场需求,并计划推出更多算力租赁产品。

算力供应与客户需求不同类型的客户对算力的需求:包括互联网公司、科技引擎、高校和能源企业。对于具体的需求量和价格,因客户业务情况和应用场景的不同而有所差异。目前,算力价格呈上涨趋势,但长期来看,供需关系仍处于变化中。

H20和AIA的性价比问题H20和AIA(包括AIPAIPC和GPTstore)的性价比问题。针对H20的出租价格可能翻倍的问题,讨论了租赁的纠结性以及客户购买的意愿问题。对于AIA,提到了爆发的迹象,但对于爆发的时间节点和具体方向尚无定论。同时,讨论了用户对于AIDC产品的粘性和付费意愿问题,以及当前新推出的AI产品的落地情况和用户养成学习的阶段。最后,谈到了国内大模型厂商的算力问题,指出其算力不足但也存在合作和储备。

华为的算力问题及其解决难度华为作为全球顶级的ICT企业集群,在算力间题上突破难度较大,需要持续优化和调整。

然而,华为可以通过提升单卡性能、建立口碑和优化其他能力来解决问题。此外,华为的H20产品在性能上相对于A100有优势,但在多卡互联情况下效果打折,且性价比不高,不能满足长期需求。

大厂芯片策略及合作方向大厂正采取复合型策略,停止租赁A100芯片,探索采购920B芯片,与星辰合作,但具体量尚需观望。长期来看,优先考虑国产化。寒武纪和寒光在模型推理场景下有竞争力,但在大数据场景下仍需依赖硬件卡。H209910B的性价比有待比较。

 

三、Q/A

Q:你们会如何选择H20和升腾910B的比较?

A:目前觉得升腾910D单卡算力ok,但集群化情况下还有提升空间。长线来看可能会往国产化倾斜,但短期内可能不会大量采购。

 

Q:H2O的价格如何?

A:目前H20训模型训练价格大约是H800的70%左右,但需要通过杜卡堆叠使用,成交价格可能更多取决于采购量级。

 

Q:英伟达的HR系列有什么问题?

A:价格较贵,需要讨论砍价问题。

 

Q:英伟达的维度方式是否割韭菜?

A:英伟达的政策沟通方式导致性价比不高,需要讨论。

 

Q:英伟达的生态壁垒如何衡量?生成的910C会有什么改进?

A:明年出的910C可能会比H100更接近,但具体还需观察。可能会有大幅度的改进,可以完美地替代现有的HR系列。

 

Q:HR系列的适配问题有什么解决方案?

A:明年的910C可能会有比较好的解决方案,但对于现有的HR系列还需要进一步的观察。

 

Q:英伟达的大生态问题如何解决?

A:未来可能需要多年时间来赶上奔腾生态的差距,具体还需观察。

 

Q:生态建设需要多长时间?

A:至少需要两三年的时间,需要点对点的手段,同时需要时间来去换工作量。

 

Q:H20下周开发布会吗?什么时候可以批量供应?英伟达的H20会不会涉及到客户产能限制问题?

A:英伟达的卡需要重新清签单,加上小批量和大批量的测试和供应,预计明年3月底才能稳妥供应。不确定英伟达的H20是否会涉及到客户产能限制问题。

 

Q:现有卡的情况如何?

A:现有A1006300张,H800七八千张,A8版小于1万张,V100一万张不到,其他厂商已经跟升腾下单并使用。不同厂商可能会有不同的调整

 

Q:阿里的大模型今年在GPT5,明年到4,是否需要算力的缺口?

A:目前的情况下,如果全部聚焦在商业化,可能够用,但在明年1到3月份会显现出来。

 

Q:阿里云官网下架了A100台对外出租,是否已经影响到咱的业务?A100台对外出租的下架是否已经影响到阿里的业务?

A:阿里云下架A100台是因为算力不够,至少需要4MP以上。同时还需要考虑达摩院的研发和淘宝、阿里巴巴集团的使用,价格不会像以前一样便宜。目前会缩减A100的供应,但保证大客户的供应。阿里优先保障大客户的供应,对中小客户采取标准的租赁方式,因此A100台的下架对阿里的业务已经有影响。

 

Q:明年可能还要发布GPT5,到时候算力需求还要进一步提升,这个问题会如何影响我们?

A:目前来看,GPT5的算力至少10万匹起,而且目前的HH2O、H800等等都没法去搞,只能依赖于一些最顶配的A30、A8、AA100,还有包括H100等等这些。但是如果我们要去做,要就是我们自己,如果要去搞定GPT5的问题,目前的这个能力肯定是不支持的。

 

Q:阿里云的算力租赁有哪些大客户,他们使用多少匹算力,是否推进了下游应用?

A:主要客户有互联网公司、科技引擎、高校、电力公司等,其中互联网公司包括音视频、电商等,高校有自己的研究机构,科技引擎有小米、OPPO等,电力公司有中海油、南方电网等,具体用多少匹算力不太确定,但每家公司都会有自己的情况。他们的应用场景很明确。

 

Q:米哈游在游戏开发中的应用场景有哪些?

A:米哈游正在做一个叫做大模型的东西,其中包含人物的自动化建模、剧本的自动化生成、素材的自动化生成等,还包括智能NBC等。他们做了一年半的时间了。

 

Q:米哈游和升腾或英伟达合作吗?

A:是的,他们可能会和这些公司合作。但具体合作多少天的算力、每家公司使用的算力不同,且是持续动态的情况。

 

Q:H2O出租价格可能会翻倍吗?

A:是的,如果拿来出租,价格可能会比现在的价格翻一倍。因为下游客户一般不会自己去买H20,因为价格太贵了。

 

Q:AIPC、GPT等应用可能爆发吗?

A:是的,我们也在尝试做一些场景化的能力落地,让更多的企业可以基于我们提供的通用能力,再去做一些场景化的产品。但是目前从供给端和客户的付费意愿来看,落地程度和场景化程度都越来越丰富,但是用户的付费意愿很低,逐渐为零。

Q:国内新发了十几家大模型的牌照,有没有大模型厂商接下来会使用我们的算力?

A:虽然会有厂商接下来使用我们的算力,但这些厂商也会自己去做一些算力储备,包括自己去做一些裁判,以及去做一些其他厂商的合作。从我们国内这些厂商来说,基本上都会存在算力不足的情况。

 

Q:华为作为全球顶级的ICT企业集群,算力间题对于华为是否容易突破?

A:虽然对于华为来说,这是一个卡点,但并不是一个死结。只要把整个集群的网络带宽和性能去做调优,不断去做测试,就可以实现整个单卡的性能的提升。

 

Q:国内的多卡互联是否能达到单卡性能?

A:多卡互联实际效果与单卡差不多,再叠加生态兼容优势。

 

Q:大厂如何应对研芯片和采用华为卡的策略?

A:大厂目前采取复合型策略,包括停止对外租赁A100等H芯片,同时跟深层做沟通,采购一部分920B,探索不同场景下的可行性。但是这个事情是持续的,多种方式共同推进。

 

Q:H20跟星辰的合作是否会受到影响?

A:目前从长期来看,我们更优先国内,但具体量还需要结合供给端的情况和价格、交货周期等因素来看。短期内我们可能会继续使用H20和920B,但长期来看需要优先考虑国产化为主。

 

Q:国内追赶万亿参数的进程是否会受到算力的影响?

A:国内追赶万亿参数的进程可能会因为算力不足而受到延迟,但从长期来看,我们优先考虑国产化为主,可能会受到影响,但是需要制定后续采购计划来应对。

 


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
中科曙光
S
科泰电源
S
景嘉微
工分
1.89
转发
收藏
投诉
复制链接
分享到微信
有用 6
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据