不少用户向微软反馈:集成ChatGPT聊天功能的New Bing搜索引擎回答速度正在变慢。即便是与OpenAI进行深度合作的微软也只能无奈回应“该情况因GPU资源补充速度跟不上用户增长速度所导致”。国内互联网公司在打响“百模大战”的同时,也在不妨碍原有业务的前提下,尽可能腾挪手中算力资源,以满足大模型训练刚需。
在进行大模型训练时,需要大量GPU资源组成算力集群来应对极高的密集性计算,换句话说,考验的是规模性算力资源在短时间内的计算“爆发力”,对算力、算法、数据三方面的技术均有一定要求,再强的单卡也只是整体运算过程中的节点,单打独斗无法完成AI大模型的算力任务。所以,有别于分布式的云计算技术,需要专用的高速互联计算网络、高性能文件存储和强劲的GPU算力,其本质是基于高性能计算架构的超算算力。
并行智算云是并行科技针对人工智能和高性能计算场景的算力服务平台,面向企事业单位、高校、科研院所在人工智能领域和高性能计算等方向的GPU算力需求,提供专业、海量的GPU算力云。通过云主机、高性能集群和裸金属三大产品体系支撑,基于高性能计算环境构建GPU算力服务平台,以满足大规模预训练、微调、高并发推理和高精度科学计算中对计算、存储、网络等环节的多样性需求。
但满足硬件和技术的客观需求,并不意味着接下来训练AI大模型的工作就会顺理成章,因为若想让大模型顺畅地运行,并最终得到理想成果,后续的服务保障体系同样重要。