国内Chatgpt现状和MLOps的关联
首先我们需要理解下为何Chatgpt如此火热,AI产业的发展随着Chatgpt的出现,打破了原有的行业空间。这一现象标志这AI技术已经能够作为高效的生产力工具服务于B端(Business;顾名思义就是面向商家、企业级、业务部门)和C端(Consume;顾名思义就是面向个人用户)。Chatgpt如今最为显著的两个现象,5天百万注册和89% 美国大学生用 ChatGPT 写作业。这标志着一个全新的时代即将来临,微软CEO纳徳拉说,“这辈子第一次见这么大的技术浪潮,AIGC堪比工业革命!微软将全线接入ChatGPT。”
然而如今大炒的Chatgpt,其实国内并没有与之比肩的产品。大多仍然停留于概念炒作,如今的Chatgpt是基于openAI GPT 3.5,然而国内甚至连3.0的水平都无法到达,相关炒作甚至发散到数据中心。然而在数据中心如火如荼的建设过程中,量变并没有引起质变,NPL(人工智能技术驱动的自然语言处理工具)的实现,离不开AI数据服务和机器学习模型的帮助。三倍大牛股海天瑞声则是国内AI训练方案设计的先驱公司。而MLOps( Machine Learning Operations)机器学习模型运营化将是这一技术的破局者,我先从Chatgpt的视角看下他对MLOps系统定义和理解。
最近大炒的鸿博股份与英伟达签署相关AI中心合作而大涨,而在即将到来(3.20-3.23)的GTC(全球AI开发者大会上)英伟达即将向世界展现其AI生态布局。而MLOps则是其AI生态系统建设的基石。(链接:https://www.nvidia.cn/data-center/solutions/mlops/)
Chatgpt的背后是open AI,而open AI的背后则是国际巨头微软,Semafor报道称,微软正在为ChatGPT的母公司OpenAI进行一轮规模更大的融资,此次投资将使其估值达到290亿美元。
同时,微软(MSFT.US)宣布,该公司开始向必应搜索引擎的桌面用户推出ChatGPT功能,博彦科技(微软小冰外包程序服务)和宁夏建材(微软中国总代替)因此大涨。
大家都知道chatgpt背后是openAI,那open AI又是基于什么呢?他是基于以微软云计算Azure 机器学习管道,全称为Azure OpenAI。(链接:https://azure.microsoft.com/zh-cn/products/cognitive-services/openai-service/)。不难看出中间那个图标就是大火的ChatGPT,这也意味着ChatGPT还只是微软AI生态版图的一部分。
那Azure 机器学习管道提供了什么样的功能,使得微软云计算拥有如此强大的能力?
答案还是MLOps,下图是微软Azure MLOps(链接:https://learn.microsoft.com/zh-cn/azure/machine-learning/concept-model-management-and-deployment)
(链接:https://azure.microsoft.com/zh-cn/products/machine-learning/mlops/?cdn=disable)
(链接:https://learn.microsoft.com/zh-cn/azure/cloud-adoption-framework/manage/mlops-machine-learning)
(链接:https://learn.microsoft.com/zh-cn/azure/databricks/machine-learning/mlops/mlops-workflow)
2022年9月12日MLOps行业人工智能初创公司Diveplane宣布完成2500万美元A轮融资。本轮融资由Shield Capital领投,Calibrate Ventures、L3Harris Technologies和Sigma Defense参投。Diveplane创立于2018年,致力于帮助企业和政府组织通过可训练、可解释和可审计的人工智能工具更好地理解和利用其数据的力量。“随着人工智能工具的普及,支持技术和数据的合乎道德的使用从未像现在这样关键。我们设计这项技术是为了让机器和人和谐相处。”
国内MLOps的领跑者
国内头部企业百度即将推出文言一心,其在AI领域锤炼多年的百度智能云必将为文言一心提供强大的后盾。2022年11月,百度智能云企业AI开发平台参与了MLOps开发管理服务能力评测,成为国内首个在开发管理能力上,达到旗舰级的MLOps平台,代表其服务能力达到国内卓越级水平。
启明信息大家对他印象仍然停留于EDR和自动驾驶,然而他早已经在国产软件,大数据,数据中心和人工智能方向积极布局,并拥有强大的技术储备。
启明信息的AI智能服务平台基于云原生的MLOps敏捷AI平台,专注于AI数据服务和机器学习模型。
不仅如此,启明云基础平台是依托启明数据中心基础硬件环境,采用OpenStack云计算管理平台架构,满足大规模部署、多租户需求的小型私有云平台。可容纳100台云主机,后期可横向、纵向无限扩展,具备完整云计算能力,面向政府、事业单位提供可扩展的弹性的云计算服务。公司投资承建并运营的吉林省数据灾备中心,总建筑面积20259平方米,分地上三层和地下一层,机房使用面积为6600平方米,是东北地区最大的第三方数据中心。数据中心业务覆盖东北三省,可集中向省内外用户提供数据中心外包服务,拥有吉林银行、北京和顺恒通、吉林省工商局、吉大正元等重要客户。并且启明信息是百度和科大讯飞的重要合作者。
中国信息通信研究院重磅发布了《人工智能研发运营一体化(Model/MLOps)能力成熟度模型 第二部分:模型交付》。万达信息(300168)凭借在人工智能MLOps领域深厚的技术沉淀和丰富的行业应用经验,作为核心编写单位全程参编本次模型交付标准。此次发布的模型交付标准作为该系列的第二个标准。今年,万达信息与中国移动、中国联通、华为、百度、商汤科技等30余家国内龙头企业共同携手,作为核心编写单位,历时五个月有余完成定稿,充分发挥了自身在人工智能领域中所积累的经验和技术优势,针对模型交付标准中能力子项分项要求、规范性引用文件、考察维度等方面积极提供思路与解决方案,并结合当今AI工程化能力的发展特点和公司技术积累和实践,提出多项极具价值的反馈意见,为推动人工智能领域构建标准化的体系建设贡献一份力量。如此阵容不可谓不豪华。