算力收入:Q3 为1200 万,Q2 为12 万。Q3 到Q4 还会一百倍增长。
算力规模:930 算力超过3000P 按期完成、1231 年底可调度算力一万P-英伟达A/H,会只多不少。多出来部分算力未上架,要做机房调整,调整后会组织参观。年底自主可调控10000P。
明年服务器和今年95%是一样的,英伟达A/H 的。一样能拿,量和速度会受影响。
明年规划和投资额:等公告-远远大过今年好多倍。
算力拆分:算力多模态大模型训练为主95%,5%做推理数据清洗处理——5%cpu 推理型算力,很多国产可用。5%很多支撑算力实验室研发,寻找可代替方案。~~AMD、海光:远期:未来搏博云规划目标可调度算力目标30-50 万P:海外、国内、自己可控制算力池子。
海外做储备和机房建设。
商业模式:不只卖设备帮建设,不是裸金属,而是共建——出资完物权共同所有,会成立轻资产公司,算力调配、使用、定价、运维全由英博数科团队做。100/150P 以内的小中心没法卖给客户,公司提供纳管服务,平台安装国博云调度算力,给小客户提供分成/固收收益。
超售:一台机器多卖几个客户,已上客户不耽误销售,需要流管平台、VGPU、切片化能力。
提升调度使用效率,属于降本增效。一开始与英伟达合作有底层沟通和服务更新,有能力。
一开始没做是因为客户类型,目前客户包机器不和其他共享,所以虚拟GPU 研发后置下,跨平台数据清洗提前了。在手3000P 情况下在手订单超20000P——超售场景。大厂和友商对于A/H800 都不具备切片能力,公司会套软件平台交给客户,对应虚拟电厂概念:GPU 实化后再切片管理能力。
AI 智能创新赋能中心/英博技术委员会:无人驾驶、智能制药、算力研究院。9 月开始聚焦算力实验室。达摩院是目标,战略指导解决技术问题,面向全行业提供解决方案。公司和百川技术骨干为主,MIT AI lab 专家、CCI 专家、院士、清华汪玉教授确认同意加入。AI 智能创新赋能中心未来24 个月核心:硬件端寻找替代nv 的方案,目前看没有任何一种能达到A/H 80%效果,但是已找到加速方式可能不需要24 个月。软件侧:汪玉老师无问芯穹通过压缩模型、算法加速、算子库优化等方式,在有限模型做到最大训练效率提升。不排除资金和股权合作。
战略升级:原计划2024Q2 启动战略调到了2023Q3,之前发展初期定位AI 专业多模态大模型训练服务平台,现在战略为AGI 全栈服务商。目前GPT3.5 4.0 刚到AGI 门槛,训练算力依然会大几何倍数增长。全栈指开发完模型后训练阶段提供算力,过程中提供陪伴式调优,专门客户经理跟着走,现在平台跑的大模型有Transformer、LLaMA、bloomberg,不看数据量看数据精准性和稀有性,训练过程中提供数据服务、模型服务、加速服务。
商业转换:帮客户(如百川)做市场沟通和撮合,如开源大模型和政务平台、香港晚会对接、对接千寻数字人直播,三农产品推广和门票景区带货。
给客户提供投融资服务,
数据资产相关:2024Q1 数据资产入表,Q3 和数交所等做了沟通。数据方面公司有2 个方向:
什么数据入表,公司提供挖掘工具给企业把简单累积数据文档变成可交易化数据资产。二是根据客户需求将数据资产推荐给平台客户进行撮合,类似appstore 生态,学英伟达CUDA生态——开箱即用, 90%以上都是同样代码,适配性高。苹果appstore 非常活跃,目标:和百川合作,希望提供开源环境、底座,搭建交易平台,构筑国内自主可控AGI 平台。
搏博云/工具:增值服务通过搏博云交付客户,很快会专门发布,9 月已向灯塔级客户提供内
部测试,向量数据库使用和分布式存储评价比较好。自主研发,不在美国管控范围内,主要
提供数据清洗功能,昨晚开始需求爆发。昨晚可能国内云厂商明确供应能力加上海外禁令因
素导致很多客户要求迁移到国博云。
订单:AI 算力订单一直非常多,5 月产生收入,7 月订单超过在手算力10 倍以上。契约涨不了价,早期签约客户明年4 月底12 个月到期会有价格调整机会,新客户涨价15-30%空间。
这两天客户竞价模式,随行就市。3000P 在手订单超20000P,728 订单完成了,不受1017 1023
限制。交付周期会变化,原装机6-8 周交付会拉长。20000P 后采购订单价格随行就市,给客户价格有涨价空间。年底10000P 算力大概是5 个127 集群,客户大模型公司,之前百川智能、深言科技、同业竞品都有合作,需求都是127 集群。客户需求256 256 向上增,价格锁定也是这么锁。大客户价格比零售好很多,通过零售超售,大概率超售到2,最高到7,一台机器切片出7 个,大厂关注算力伸缩。阿里云和腾讯都没做到让人满意的状态,所以客户跟着机器走,这方面公司有竞争力,此基础上明年切片把零售客户超售拓展目前不要对
超售特别大期望,都是大客户,没有很多零售客户小/散需求。
零售公告标准为29 万。
大规模能力掌握头部AGI 企业定价群:客户32/64 台规模单机器收1,如果128/256 收费
1.5-2。128 集群市场只有公司能够提供服务,掌握头部客户企业定价权。下个阶段超大型智算中心,万卡——不低于英伟达卡,同意集群。目前只有阿里可以提供256 大集群服务。
明年规划和对应投资额:额度有点大以公告为准,超过5 个亿就要披露。
成本:100P 6000 万,硬件服务器4200 万剩下是网络配套设备,占比20-30%。
运维收费:很少,1024 机器一年1028 万。
京能:股权合作比较确认,成立共同运营公司,海外智算中心共建合作。客户合作到一定程度成立共同公司。
客户:平台2 个核心客户,后背分别是腾讯阿里领头,肯定是金主无法满足需求找到公司,报价比市场正常略偏高。
百川:第一个最主要客户,价格较便宜。百川底座开源,工具闭源收费和公司比较匹配。公司定价会看客户和公司匹配度。百川需求很大,可能BAT 加起来都不够。
交货:NV 不会停产A/H,中国特供就没有了。英伟达性能控制通过软件,类似锁算力防挖矿。字节50 亿订单还有10 个亿2022 年的,但是量大不交货。
申请许可:不能是实体客户名单,知名度越高越难,需求量越大越申请不到。每一批货出来都要申请,一次有效。最终客户使用地变更要告诉它。
友商扫货:公司去年就开始扫A800,之前HGX 供货周期52 周,台积电cowos 一年14 万套,每个季度3.5 万台,20%流入国际7000 台。算中国1/4,2-3k 套。中国只有4000 套模组,1/4 2800-3200 套。今年只有Q1 和去年年底分中国货,后面没有。
拿卡:英伟达全是代工,原装机叫DGX 配置固定,和meta 等大客户沟通过配置确定——高级别OEM 制作;二是英伟达8 张GPU 集合在板上给代工厂,浪潮华三宁畅超聚标,的叫组装机hgx,组装机硬件用户可以选配——cpu 降频,ib 减少,电源用便宜的。原装机开箱即用,纯裸金属,售后由英伟达做。组装机自己做售后。
禁令:不分原装组装、消费级工业级。最早GPU 和传输标准一个不超过就行,英伟达降了传输。现在禁售标准:存储、传输、cpu,任何一个超了都不能进来。4090 有较大显存,L40s/x显存只有38G,4090 存储超了。NV 新品,显存刚性指标很难去做。1023 卡只要卡未激活都要拉回去,special permit 去申请。未来24 个月只会更严格。
IB:迈络思以色列,IB 价格增幅,Q1 96000 一台交换机,现在20 多万三倍。H800 用400G交换机,国内光模块也供需不平衡,博通芯片限制。
美国团队:中国3000 亿订单和美国掌握话语权军火商相比不算什么,公司美国专业团队法务、公开咨询商务区研判政策。卡外网络设备:不在禁售但是产量低很难拿,网络设备20-30%;服务器。网络设备产量低难买。公司hgx 也是配ib,和dgx 一样,也在用国内以太网交换机做实验。深度合作伙伴光
模块项目进展很快,达到单波200G,可以做1.6T 光模块,目前400/800G 光模块每个Q 产能10 万片左右。
谷歌:各种尝试,算法侧加速有较高成功概率。参数值不是好坏指标,百川2.0 评测全面超过llama2 13B。不靠投喂数据、靠调教,数据精准缺失性决定算法。
京能万卡集群和重庆2 万P:京能不受禁令影响,年初开始10 个亿合同10 个月周期拿下来。
重庆有受到影响,最早从64 台开始谈不断追加需求到4 万P,50%会受影响交付周期会变慢。分成按劳分配,看投入多少。京能1 万p,40%公司提供,大概率四六开-机器台数,60%通过英博买,公司还会投入运维研发客户管理,一是收基础运营服务费每年固定数字,二是按照算力比例基数分成。公司4 买的早卖的贵,他们6 买的晚。
人员:50%运维,30%开发,20%其他部门。比年出多30-40%人。运维目前60 人,年底80,24H1 140 人。
长寿湖项目:风火水电长寿政府提供,物权由公司和政府联合持有,执行时政府资金可能不够,需要分阶段投入,中城立扬和政府共同投资,建设规划执行由公司做,公司还是建成后
运维管理方。xh社国重已挂牌西南实验室部门,做2 件事,优化机器投喂中伦理道德标准,如种族、民族、性别歧视等伦理道德标准相关问题,做规范性。二是做成生态交流重地,由x社组织宣传推广。