登录注册
算力中心灾备专家交流纪要
金融民工1990
长线持有
2023-10-23 20:42:07

要点: 智算中心的灾备市场是全新的增量灾备市场,训 练侧占比小,可达小几十亿,但加上占比大的推 理、AI 应用等场景,增量空间可达百亿。目前智 算中心的灾备已经开始,一般是建设的时候会一 起规划一部分,后续看业务再加 政策文件要求重点行业的重要数据 2025 年需要 达到 100%灾备覆盖率,目前重点行业平均来看 还非常低,平均在 40%的水平。分行业看,金融 行业较高,但是工业、医疗等都很低,比如瑞金 医院。 相对来讲第三方的公司,比如英方软件,他们的 优势是在某一些领域投入比较大,比如有的会在 数据备份方面做的比较好,有的会在别的方面做 的比较好,会有自己的特色。云厂商更多在虚拟 机、网络层面比较专业一些,因此经常和第三方 公司以互补的方式去获取客户 

算力中心灾备市场发展的几个阶段:起步阶段,智算中心概念提出,即 21 年,工信 部发布了《十四五软件和信息技术服务也发展规 划》,明确提出要丰富数据备份、灾难恢复等安 全软件的服务和要求,标志着智算中心灾备市场 得到了政策层面的认可和支持。 发展阶段,全国已经超过 30 多个城市已经建设 或者规划建设智算中心,标志智算中心的灾备市 场开始进入实质性的发展阶段, 需求增长阶段,随着数字化转型的推进,企业组 织对这种数据备份和灾难恢复需求的增长,特别 是对信息基础设施的自主安全可控政策趋势下, 灾备系统国产化需求迫切。 最近,政策要求 25 年重点数据的 100%灾备覆 盖,标志灾备行业已经进入国际层面的重点规 划。 

Q&A】 

Q:有没有智算中心灾备案例分享一下? 

A:比如天津的一个算力中心,已经开始落地做 容灾备份,第一期规模是大几百万。对比传统的数据中心(CPU 为主)、智算中心(CPU、GPU 异构架构)的基础架构更加复杂,加上大数据的 广泛应用、数据量的急剧增大,对于客户群体来 说,对于灾备的等级要求提升了,带来了新的需 求和增长点。 灾备产品线和之前也有较大的不同,以前传统的 灾备更加关注存储阶段,但是现在大数据平台的 发展,很多数据已经到了 PB 级规模,如果业务 对性能要求比较高,如何做好容灾备份,例如大 模型厂商,会挂载一些向量数据库、高性能算力 异构,对于灾备市场带来一个大的挑战,面对国 内更复杂的传统架构以及多元的云厂商去做好在 灾备是一个挑战,也是比较大的增长点。 


Q:政策要求 25 年重点数据的 100%灾备覆盖,我的理 解是金融行业对灾备率比较高,其他行业灾备率比较 低,平均下来,重点行业灾备率大概在多少呀,2025 年 提到 100%的迫切性如何? 

A:整体 40%左右,金融比较高一些,因为金融 对数据安全要求比较高也比较有钱,工业 30%都没达到,工业信息化不够高、利润率低一些,受 限资金、人员现实原因没办法做。 文件从实际落地情况来说,头部标杆客户不能有 侥幸心理,大家会在限定时间点做这个事情。实 际过程中,可能有些中小企业客户,可能根据自 己的实际情况不会把所有的数据都去做比较高层 次的灾备,只对关键业务比较核心的数据做保 障。 


Q:灾备软件的成本在智算中心的成本中大概能够占到 多少?怎么看智算算中心带来的整个市场的灾备空间? 

A:只看纯软件(不含软硬一体消费产品),占 比 1%左右。加上硬件,占比在 5%-10%。其 中,智算中心的成本是不包括建筑费用,只包含 的服务器、通信、电等成本。 


Q:在建设数据中心过程中,什么环节会上灾备的产 品,给灾备厂商的付款是什么环节?对使用方的收费在 什么环节,是什么模式? 

A:灾备灾建设阶段开始规划,在实际落地过程 中不会一下子全部都上,一开始可能会更多的做一些虚拟机、操作系统的备份,这些是预防云厂 商云主机故障的情况下如果不影响线上的业务。 会预留一些没有做的,比如具体的客户接入进来 以后,会对数据库、文件方面有或有更高级的容 灾备份的要求,可能先规划,但不会去做。 对最终客户,有一种方案是,我会在给客户的定 价中,留有一点空间,成本已经在里面,客户不 一定感知到我提供了这个服务。然后有一些可能 在此基础上觉得不够,会购买一些增值服务,会 单独再收费用。 对于上游,开始规划做的部分实施之后就会开始 计费。还没规划做的部分,如果客户要求且客户 买单之后,我们再和软件厂商做结算,以项目制 做。 


Q:假设是项目制,在建立数据中心的时候,客户就把 产品铺进去,他在这个环节收不到钱,等客户使用了算 力服务后,您提供了灾备给客户,收到灾备的钱再付给 灾备的厂商?

A:灾备有很多细分服务,一部分基础服务一开 始就有,做完就会付费。有些相当于我保留了这 个功能,但是现在还没有启动,因此现在不付 费,等接触客户后再启动这个服务。 


Q:智算中心本身对于灾备的价值量提升相较于原本数 据中心是否有量化数据? 

A:原来数据中心的云灾备在国内市场有大几十 亿规模,智算中心现在还是以大模型厂商为主, 跟上游 GPU 供货有关联,云灾备还是几十亿规 模,但是到下一个阶段等 AI 应用层的丰富后, 越来越多垂直领域模型的敏感数据公有云做不 了,云端私有化和本地私有化切入之后,这个市 场会有百亿以上的增长。 


Q:未来智算中心和一个普通数据中相比,价值量会有 几十万到几百万级别的价值量提升? 

A:智算中心很多是新建的,本来就是新增的需 求,从存储量收费的单价来看,智算中心比普通 计算中心会高。


Q:智算中心的使用效率和算力空置情况? 

A:现在高端算力,例如国内的 A800 和 H800 是供不应求,因此使用率非常高,但是消费级的 低端卡会稍差。但总体需求非常大,甚至有一些 厂商不方便自己买卡,可以通过这种方式租给客 户,客户也愿意买单。 


Q:智算中心的灾备业务大规模落地节奏? 

A:25 年的重点行业会做到 100%,包括金融、 党政军、医疗、教育、运营商、能源等行业,因 此这些行业在 24、25 年左右会有比较大的增 长。从上游 GPU 供应来看,明年上半年 GPU 的 产能会有比较大的提升,未来算力方面瓶颈会比 较小,企业应用端创新会更多,因此未来企业私 有化成本太高,自己重要数据无法上云的情况会 dada减少。所以从明年开始,我们可以看到这个 市场会有比较大的放量。 


Q:您觉得现在智算中心的建设阶段在什么程度? 

A:现在全国大概有 30+地方在建设智算中心, 商汤等企业也会走的比较靠前,阿里的乌兰察布智算中心的应用已经开始落地了,但有一些地区 还在规划阶段。 


Q:现在落地的成熟云厂建设比较多,一些国家建设的 智算中心建设进度如何,比较快是因为能拿到卡? 

A:比较靠前的,例如,南京的鲲鹏和昇腾人工 智能智算中心在 22 年 4 月份就已经上线,甘肃 那边也有国家枢纽的节点,已经开始在做了,但 是后面进度比较慢,因为卡的交付一直在逾期。 全国一些比较早的一期已经交付了,但有一些新 的可能土建还没弄好。整体比较早期。 


Q:这种灾备对于智算中心来说是后周期还是会同步规划 ? 

A:在建设时会同步规划。 


Q:业务没上如何知道该规划多少? 

A:比如上一台机器,会按照折算一定的比例进 行容灾相关的建设。规划会做,但是不是马上同 步做,可能会有一定滞后性。


Q:您怎么看云厂商、第三方厂商和硬件厂商灾备的差异? 

A:我认为现在参与竞争的企业主要分三类:

1) 国内云厂。

2)第三方厂商。

3)海外厂商。

相对来讲第三方的公司的优势,比如英方软件,是在 一些领域投入比较大,有的会在数据备份方面做 的比较好,有的会在别的方面做的比较好,会有 自己的特色。云厂商更多在虚拟机、网络层面比 较专业一些,且因为他们更多接触终端的客户, 因此可以和第三方公司以互补的方式去获取客 户。海外的公司的特点是在云灾备的领域,包括 产品能力和苹果生态方面做的更好一些,但缺点 是更贵。随着国产替代的浪潮,最近 H800、 4090 在国内停供后,海外厂商会在一定程度上 被国内厂商替代。总体来说,海外厂商最早开展 业务,最早入局;在国内初步阶段大家会倾向于 使用云厂商服务;随着业务的发展,大家了解到 第三方厂商的存在后可能会找第三方厂商。


Q:现在很多智算中心在开始建设,有一些能够放灾备 了,未来到 25 年具体的节奏和份额划分如何? 

A:我可以根据客户案例的金额提供计算模型: 现在一家做大模型厂商,智算中心提供的服务一 年规模几个亿,具体到灾容相关软硬件加一起会 有千万的级别。目前租赁市场大概几百亿级别, 容灾大概是十亿左右,明年可能会翻几倍到 30 亿,到 25 年可以到 50-80 亿规模。


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
云赛智联
S
数据港
S
常山北明
工分
3.29
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据