登录注册
AI异构计算服务器-AI服务器的未来,大幅提高算力,降低能耗
明天一定赚
2023-02-16 16:17:56

什么是异构计算:

异构计算(英语:Heterogeneouscomputing),又称为异质运算,早在80年代中期就产生了,其主要是指使用不同类型指令集和体系架构的计算单元组成系统的计算方式。常见的计算单元类别包括CPU、GPU、DSP、ASIC、FPGA等。目前“CPU+GPU”以及“CPU+FPGA”都是受业界关注的异构计算平台。

现在随着5G、AI、云计算等新兴领域对计算量的需求,已经超过了通用CPU的发展速度,仅通过提升CPU时钟频率和内核数量而提高计算能力的传统方式遇到了散热和能耗瓶颈,所以需要GPU、FPGA、DSP,现在还多了DPU,这些计算单元去配合CPU进行并行计算,大家分工协作,“专人干专事”,以此来很好的满足这些计算需求。

而英特尔、AMD、英伟达三大厂商最近的一些列集中的动作更是把异构计算推上了风口浪尖

国内芯片厂商跟进

不同于国际大厂在各方面实力雄厚,国内厂商难以在短时间内形成如此全的产品线,但是国产芯片厂商现在已经渐渐开始选择通过投资和合作的方式埋下异构的种子。

2021年11月,GPU芯片企业壁仞科技,与IDG资本、字节跳动等共同参与了国产DPU初创企业云脉芯联数亿元的天使轮投资。据壁仞科技创始人、董事长、CEO张文透露,除了DPU之外,从布局整体计算产业出发,壁仞科技正在密切关注国产CPU的最新发展,未来形成CPU+GPU+DPU的全国产系统级解决方案。

日前,DPU芯片厂商云豹智能与AI芯片厂商燧原科技达成了战略合作,共同研发和提供大规模高性能AI算力平台解决方案。基于云豹智能云霄DPU和燧原科技云燧T20率先推出了DataDirectPathStorage解决方案,为AI训练储存访问提供更高效的解决方案。在传统解决方案中,云燧T20访问存储时,需要将数据先搬移到系统内存,再由系统内存搬移到目标设备。而基于DataDirectPath Storage技术,云燧T20可通过DPU直接获得数据,从而绕过系统内存和CPU,让数据访问速度更快,访问延迟更短,系统开销更小。

此外,国内还有异构处理器IP提供商华夏芯,通过自主设计的Unity统一指令集架构和基于此架构的CPU、DSP、GPU、AI专用处理器系列IP与SoC,在提升性能价格比的同时,显著降低计算芯片研发成本和研发复杂度,同时缩短研发周期,减少开发人员工作量和降低开发门槛。据悉,华夏芯的Unity和英特尔的OneAPI都是为了简化编程环境,但不同的是,OneAPI是面向不同体系架构的统一编程环境,Unity是面向不同微架构的统一体系架构和统一编程环境。

下面贴一部分关于异构计算服务器研报:

异构计算促进高效算力释放。将CPU不擅长的计算卸载下来,交给专用芯片以实现“提质增效”,是业界目前解决算力瓶颈主流方案之一。英伟达认为,CPU、GPU、DPU是未来计算的三大支柱。通用CPU偏向于控制为中心结构,面向逻辑控制;GPU以数据为中心的结构,面向大量并行计算;DPU也是以数据为中心,是面向强IO。CPU基础层负载给“异构计算”提供了一个广阔的发展空间,CPU、GPU和DPU将优势互补,建立起一个更加高效的算力平台。

 

异构计算突破算力瓶颈 大模型问世,AI 计算量需求指数增长。如第二章所述,AI 训练算量自 2012 年 开始以平均每 3.43 个月翻倍的速度实现指数增长,但摩尔定律逼近极限,同期 算力增长仅 7 倍,远低于 AI 模型计算量的 30 万倍。由于实现人工智能所需的 深度学习算法需要很高的内在并行度、大量浮点计算能力以及强大的矩阵运算能 力,其与图形渲染有着相似之处,这为使用 GPU 训练深度神经网络打下了理论 基础。自 2012 年 AlexNet 面世之后,GPU 及 AI 加速器(DSA)的广泛应用 使得硬件计算能力的不足得以被快速弥补,人工智能行业迎来了又一次加速发展。

异构计算打破 AI 芯片算力瓶颈。大模型训练、自动驾驶等复杂应用场景对算力 的追求没有止境,尽管过去 10 年晶体管的数量依然随摩尔定律增长,但单核处 理器性能已经出现明显瓶颈,晶体管的数量增长主要来自于核心数量的增加,算 力提升需要寻求新的突破点:

 ⚫ 单个处理器的性能提升:目前集成电路制程工艺的边际提升极其困难,考虑 到硅原子的直径约为 0.1nm,在 3nm 制程之后量子隧穿效应(Quantum tunnelling effect)会越来越明显。因此,单纯通过改进工艺以提高晶体管密 度,从而提升芯片性能的方法已难以满足大数据和人工智能时代下的业务规 模爆炸性增长。

⚫ 处理器的核心数量增加:核心数的增加会提高芯片功耗、成本,并且需要软 件端适配多核。尽管“东数西算”等项目能从宏观层面增加全社会的总算力, 但 AI 芯片大规模落地的前提是满足 AI 场景快速迭代的通用性,否则新增的 算力依然会出现利用率低、成本高。

 ⚫ 处理器的灵活度提升:随着算力需求不断攀升,单一计算类型/架构的处理器 无法应对多样的数据处理任务。当前,GPGPU 作为一种异构计算方案,灵

 


 经过小编一番挖掘,发现一只相对低位的中电兴发,自研AI异构计算服务器已经应用于多个算力中心。

最近如浪潮信息因为AI服务器,股价一路飙升,智微智能AI服务器二连板,AI异构计算服务器的中电兴发值得关注!


 

 

 

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内可能择机卖出。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
中电兴发
工分
19.87
转发
收藏
投诉
复制链接
分享到微信
有用 29
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(28)
只看楼主
热度排序
最新发布
最新互动
  • gogo君
    今天被套的吃面达人
    只看TA
    2023-02-16 21:47
    现在做算力的都是异构的。
    3
    0
    打赏
    回复
    投诉
  • 龙龟战法
    中线波段的老司机
    只看TA
    2023-02-17 04:29
    低位、低价、正宗胜于一切,王
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-16 16:18
    我今天刚走,我看没上的去
    0
    0
    打赏
    回复
    投诉
    于2023-02-16 16:23:41更新
    查看1条回复
  • 一卖韭涨
    一卖就涨的老韭菜
    只看TA
    2023-02-17 09:12
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-17 09:12
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-17 08:41
    不错,正宗,低位
    0
    0
    打赏
    回复
    投诉
  • 龙龟战法
    中线波段的老司机
    只看TA
    2023-02-17 04:30
    算力世界领先水平
    0
    0
    打赏
    回复
    投诉
  • 龙龟战法
    中线波段的老司机
    只看TA
    2023-02-17 04:28
    正宗低位低价就是王道,胜于一切
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-17 02:06
    股性奇差,大涨第二天准时低开低走
    0
    0
    打赏
    回复
    投诉
  • 韭月韭日韭
    绝不追高的散户
    只看TA
    2023-02-16 23:41
    这股股性特别差,我持有中,欢迎各位来抬轿
    0
    0
    打赏
    回复
    投诉
  • 1
  • 2
  • 3
前往