登录注册
DPU专题交流
夜长梦山
2021-11-22 10:57:34
一、分享环节
1、DPU的产生
DPU的概念由英伟达首先提出,通过收购Mellanox将其整个BlueField系列产品包装成DPU,其本质为网卡的延伸或升级一代的产品。
2、DPU的发展和现状
英伟达、博通、英特尔等公司推动了DPU的发展。其中一部分用FPGA(现场可编程门阵列)的方案做(如英特尔的DPU),另一部分用芯片做解决方案(如英伟达的DPU)。国内公司如华为的华为云和电信云,其云的解决方案是闭环式或耦合式,阿里用的是FPGA的方案。目前国内大部分公司处于融资或推销其解决方案阶段。DPU是从标卡到智能网卡(SmartNIC)再到DPU迭代的结果,从数据中心业务发展方面,DPU在未来会有爆发式增长。
二、互动交流环节
Q:从技术角度上如何解决数据中心能力的卸载?
A:DPU可以节省大量吞吐空间和大量的算力,因为其在网卡上嵌入了ARM和CPU,使其可直接处理高质量吞吐而不是通过内核到CPU处理。网卡上的CPU价格低于内核的CPU,在处理时减少了成本。另外,由于IO读写数据受限,DPU可减少IO读写的次数,增加整个数据中心板块的效率。
Q:DPU和中央处理器的配套关系比例如何?
A:目前国内基本上单台server配1到2块DPU。有些欧美服务器厂商将DPU功能集中化,从而转变为一个小型设备进行交换和分发以达到大规模节约目的。
Q:DPU芯片的价值量?
A:BlueField目前单个标价为一万多人民币,由于出货量较小需通过代理购买,实际购买价为两万多左右。后期出货量达到一定程度可能会将价格降至6000元左右(规模化生产,按此价格,成本在2000以下)。
Q:国内DPU技术路线与演进?
A:美团从重业务轻底层的角度出发投星云智联,注重快速和技术成熟。因为其方案偏FPGA(如赛灵思),整个平台较成熟,FPGA已考虑好PCIe和底层的IP,只需要公司将客户需求从软件转为硬件语言融入FPGA中。如美团的定制化服务(白皮服务器),偏FPGA的DPU可使其直接在业务端生效,达到短平快的目的。用FPGA做DPU并未100%发挥FPGA所有功能,只使用了部分业务功能,这是和用芯片做DPU的区别。而大多数互联网厂商采用FPGA的DPU是因为他们更注重解决业务问题,并不太注重花费(可转化为一定的固有资产)和FPGA的能耗。国内DPU基本上为FPGA做解决方案,因为国内大部分厂商为新兴厂商,而芯片制造和检测(对比芯片功能和上层业务)需要较长周期,用FPGA打造DPU可从根本上解决该问题。腾讯投资了云豹,其最早有三个解决方案组:1)与英特尔做FPGA解决方案;2)与赛灵思做FPGA解决方案;3)自主研发芯片。目前偏成熟的仍为FPGA的解决方案。美团或者腾讯已经在自己业务上通过测试,但不能短期开始复制,需要大量人员,需要理解业务,C语言或其他软件语言表达出来,再转换到硬件里面,放到FPGA里面去跑,再把DPU放到前端去测试。
Q:DPU产品的技术门槛?
A:硬件上,DPU实现上,除了FPGA,还有3种技术在做,一种使用NP(Network Processing),在可编程上与FPGA不一样,没有FPGA灵活;NP带有可编程,里面能力,微处理核,编译微码来实现业务层需求,NP方案再小NP都比网卡要大很多;还有一种是ASIC,比较固化。现在又提出一个新的概念,叫SoC,利用Chip去处理,SoC芯片解决方案是未来大势所趋。SoC难度与技术积累与FPGA完全不一样,FPGA就是一批懂得交换与网卡的人去做的,如果要有自己的东西,就必要去用芯片去做解决方案。但是,现在做一颗芯片,这是芯片生态的门槛。第二个是软件生态门槛,Windows、Linux版本非常多,满足这些就需要非常多的软件开发人员。存储这块的技术方向一个是NVMe over TCP,是未来主流;还有一个是NVMe over RDMA (RoCE v2)。NVIDIA可以做得好,原因在于存储上有芯片的优势,比如SMARTNIC,MEllanox可以做到双端口,一个用网络卸载,一个用存储卸载。
英伟达能做好的原因:原来Mellanox的产品用的IP网络,无损态网络,在存储方面有先天优势,国内水平远远不及Mellanox。Mellanox的smartNIC可以做到双端口,一个端口跑网络卸载,一个端口跑存储卸载,优势巨大;而现在国内很少有厂家把其中一方面做到很好。从FPGA转到SoC还需要回过头来做标卡,10G 以上智能网卡,可能只有网讯做基础网卡。
团队人员上,在加速场景上,未来能做到DPDK卸载,也需要一个大的团队。底层至少要有20年以上工作经验,100人的团队,3-4个亿投入都不一定可以搞得定。
技术积累上最大的问题是国内的在标卡方面的缺陷。字节、美团、腾讯等互联网大厂对网卡基本的要求就有两三百项,而国内做DPU的厂商只是做到DPU的可卸载,只是用FPGA解决了关键问题,没有考虑标准网卡的功能,接下去做芯片解决方案时,还需要容纳标准网卡等底层的功能,而国内目前还没有厂家能做到10G的标准网卡。DPU未来会回归到芯片上,这对团队对芯片设计能力具有极高对要求,且需要两三年对时间,而两三年后英伟达等厂家已经走得更远。
Q:未来国内DPU竞争格局展望?
A:未来DPU格局预计是3-4家厂商,一家英伟达,一家英特尔,还有一到两家是国内的,肯定是既做过FPGA,又做芯片解决方案,或者是只做芯片解决方案的。做FPGA解决方案是实验室产品,需要看软件的适配情况。
Q:影响DPU发展的核心要素?
最重要因素是价格和成本。国内智能网卡的出货无法和英伟达CX6/7系列相比,价格也更贵。全球每年服务器出货量在1000万台以上,国内价格能做到3000元以下,就有竞争力,超过3000元,可能就没办法满足市场化需求。
Q:业内DPU将逐渐从FPGA解决方案转向ASIC?
A:对,但最终比拼的是谁更先研发出芯片,更快地占领市场,做迭代的开发。举个例子,千兆的网卡业务量出来,千兆的芯片也很多,但这个市场已经被占完了,已经到下个阶段,向边缘云计算方向走。无论是硬件还是软件,所有的Leader会大量投入变更,让行业主线按照自身milestone来做。亦步亦趋可以把产品做出来,但回报率相对低。博通,Marvell都能做芯片,国内拿这些芯片进行改装,此时获益最大的是服务器厂商,一旦芯片出来,服务器厂商能够大规模采购组装,且采购成本较低,例如浪潮、中芯,应用厂商将直接购买服务器厂商的DPU产品,国内新兴的DPU厂家将没有市场。
未来随着计算规模的增大,端到端某一个环节能力的缺陷会催生新的解决方案,靠前端业务推动后端研发。比如IO读写,在十几年根本不是问题,如果摩尔定律保持,CPU性能足够强,则不需要DPU的发展,而现在DPU确实解决了IO读写瓶颈的问题。短时间内,很难有厂家推出SoC的解决方案,首先要把网卡的钱赚了,赚完之后才考虑卖芯片,而未来瓶颈可能不再IO读写。
Q:DPU最后会有一个通用的解决方案?
A:不一定。英伟达的BlueFieldX2,会有配套的工具,大厂商只做标准化产品,标准化到定制化最后一公里由使用者做,厂商提供工具。FPGA需要派人了解业务,把业务做各种转型放到FPGA里,再做使用,这些业务会有标准化的东西,但还是有差异。互联网厂家倾向于速度快,更倾向于定制化的开发,但更多的客户积累下来,把很多套解决方案合并成一套是比较困难的。要么提供工具,要么像FPGA一样派人定制。
Q:DPU对高算力CPU需求是否下降?
A:在虚拟化云里,CPU的核数是确定的,资源池是确定的,把可卸载的任务用网卡的算力解决掉,节约下来的算力可以在CPU上供给客户使用,在共有云上节约了成本,而网卡上增加的成本非常低。特定的业务用特定的芯片处理,能效比是最好的。
Q:SoC大厂如高通做DPU是否有优势?
A:有优势。在芯片行业里,最终最挣钱的是卖芯片的,高通、Marvell等厂商的能力肯定能做,他们是卖芯片的,在整个利益的最高端,但芯片在业务层能有多少响应,是需要花成本做的。高通会看是不是在产品的milestone上,且高通的每一款产品都是暴利,做出来能否被使用、能否产生暴利,还不确定。
Q:行业2025年几十亿美金市场空间测算拆解?
A:根据服务器的数量测算有一定的参考意义,但市场情况有变化,比如原来不愿意用但产品出货量大了价格下降,可以用了,等等情况,如果是FPGA的解决方案,偏离会更大。
SmartNIC和DPU的区别:智能网卡是DPU的过渡性产品,价格低,能够处理一些定制化场景。例如阿里,云场景非常多,并不是一个解决方案通达,有多种需求,对于DPU网卡厂商,肯定不是一张、一套网卡,肯定是各种各样的解决方案和网卡,未来的三四家DPU厂家,肯定不是一张网卡打天下,而是多种网卡和解决方案。
Q:DPU是否有国产化市场?
A:有。航母、军工、部队等都有需求,不要FPGA解决方案,只要芯片解决方案,量不好估,但有需求。未来的业务侧,很多场景会下发到网卡做处理,成本仍是重中之重:只有降成本,才有市场;而只有解决业务端卸载端问题,市场规模才会大。芯片解决方案是大势所趋,不会一直用FPGA来做。
三、总结与展望
目前市场做FPGA解决方案的厂商太多了,几千万的融资无法支撑产品研发,行业未来几年内会处于大鱼吃小鱼的阶段。互联网厂商如阿里会找强强合作,寻求芯片解决方案;而运营商需求旺盛,DPU厂家最好能绑上运营商。国产化大优势会慢慢体现,而英伟达会不断挑战国产化的性能,国产化会给国内厂商带来春天,而最关键的是产品的不可复制性。不可复制的最大的两个门槛一个是芯片,一个是软件和生态,这是未来对DPU厂家最大的考核
-------------------------------------------------------------------
兴业计算机团队介绍
团队成员包括蒋佳霖、孙乾、吴鸣远、冯欣怡、陈鑫、杨本鸿,2015-2020年连续6年获新财富最佳分析师。2020年,新财富、水晶球最佳分析师第3名。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
复旦微电
S
安路科技
工分
7.15
转发
收藏
投诉
复制链接
分享到微信
有用 5
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(5)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2021-11-22 11:04
    浪潮信息??
    1
    0
    打赏
    回复
    投诉
    于2021-11-22 14:03:41更新
    查看1条回复
  • 星火🔥燎原
    一路向北的萌新
    只看TA
    2021-11-23 07:34
    写这么多,没看到国内对标上市公司
    0
    0
    打赏
    回复
    投诉
    于2021-11-24 17:48:56更新
    查看1条回复
  • 熊途牛路
    躺平的老韭菜
    只看TA
    2021-11-22 13:57
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往