一图文看不懂 MLOps 相关股票解析 (温馨提示:手机版可以手指左右翻动页面)
MLOps 是通过构建和运行机器学习流水线,目的是为了提高 AI 模型生产质效,推动 AI 从满足基本需求的能用变为满足高效率、高性能的“好用”。
顾名思义,MLOps就是机器学习时代的DevOps。它的主要作用就是连接模型构建团队和业务,运维团队,建立起一个标准化的模型开发,部署与运维流程,使得企业组织能更好的利用机器学习的能力来促进业务增长。
MLOps是一门工程学科,旨在统一 ML 系统开发(dev)和 ML 系统部署(ops),以标准化过程生产高性能模型的持续交付。
ML(机器学习)系统开发生命周期和 MLOps 需求的完整演练
直到最近,我们所有人都在学习软件开发生命周期 (SDLC) 以及它如何从需求获取→设计→开发→测试→部署→一直到维护。 我们曾经(并且正在)研究软件开发的瀑布模型、迭代模型和敏捷模型。
现在,我们正处于几乎所有其他组织都试图将 AI/ML 纳入其产品的阶段。 构建 ML 系统的这一新要求增加/改革了 SDLC 的一些原则,所以产生了称为 MLOps 的新工程学科。
MLOps — 一个新术语出现了,它正在引起轰动并产生新的工作机会。 MLOps 是 Machine Learning Operations 的缩写,也称为 ModelOps。
要了解 MLOps,我们必须首先了解 ML 系统的生命周期。生命周期涉及数据驱动组织的多个不同团队。
这是 ML 生命周期的非常简化的表示。
Google 的团队一直在对构建基于 ML 的系统所带来的技术挑战进行大量研究。 一篇 NeurIPS 论文表明,开发模型只是整个过程的一小部分。 许多其他流程、配置和工具将被集成到系统中。
为了简化整个系统,我们拥有这种新的机器学习工程文化。 该系统涉及从具有最少技术技能的高级管理人员到数据科学家到 DevOps 和 ML 工程师的每个人。
大规模管理此类系统并非易事,需要解决许多瓶颈。以下是团队提出的主要挑战:
在这一点上,我已经深入了解了系统的瓶颈以及 MLOps 如何解决这些瓶颈。您需要瞄准的技能可以从这些挑战中获得。
以下是您需要关注的关键技能:
机器学习系统开发通常从业务目标或目标开始。它可以是将欺诈交易的百分比降低到 0.5% 以下的简单目标,也可以是构建一个系统来检测皮肤科医生标记的图像中的皮肤癌。
这些目标通常具有特定的性能度量、技术要求、项目预算和 KPI(关键性能指标),它们推动监控已部署模型的过程。
在目标被清楚地转化为机器学习问题之后。下一步是开始搜索合适的输入数据以及要针对此类数据尝试的模型类型。
搜索数据是最艰巨的任务之一。这是一个包含多项任务的过程:
数据准备包括特征工程、清理(格式化、检查异常值、插补、重新平衡等)等任务,然后选择有助于输出潜在问题的特征集。
将设计一个完整的管道,然后编码以生成干净且兼容的数据,以提供给模型开发的下一阶段。
部署此类管道的一个重要部分是选择高性能且经济高效的云服务和架构的正确组合。 例如,如果您有大量数据移动和大量数据要存储,您可以考虑使用 AWS S3 和 AWS Glue 构建数据湖。
您可能想要练习构建几种不同类型的管道(批处理与流)并尝试将这些管道部署在云上。
准备好数据后,您就可以继续下一步训练 ML 模型。 现在,训练的初始阶段是用一堆不同类型的模型进行迭代。 您将使用准确度、精确度、召回率等多种量化指标缩小到最佳解决方案的范围,您还可以对模型进行定性分析,以解释驱动该模型的数学,或者简单地将模型的可解释性放在首位。
我有这个完整的任务列表,您可以在训练 ML 模型时阅读这些任务:
您可以将版本控制与参数一起添加到 ML 系统的所有组件(主要是数据和模型)。
其他任务包括:
构建 ML 管道时应牢记以下任务:
部署 ML 模型主要有两种方式:
在动态部署中,您可以使用不同的方法:
以下是注意事项:
组织需要密切关注模型在生产中的表现,但要确保良好和公平的治理。 此处的治理意味着采取控制措施,以确保模型向所有受其影响的利益相关者、员工和用户履行其职责。
作为此阶段的一部分,我们需要数据科学家和 DevOps 工程师通过执行以下任务来维护整个系统的生产:
随着业界对人工智能研发效率、团队协作、安全保障等需求进一步提升,整个MLOps产业实践呈现出“内涵很明确、落地很困难”的现状。
从技术内涵来看, MLOps的核心和要求已明确,即围绕“一个基础、两个关键、三个提升”,逐步建设从需求、开发、交付到模型运营的全生命周期运营管理机制。
一个基础是指持续交付,通过搭建工厂流水线式的模型生产方式,提高规模化生产效率。
两个关键是指持续训练和持续监控,通过持续训练和持续监控搭建高效闭环的运营管理体系,提高机器学习可观察性,保证模型质量,增加赋能效果。
三个提升是指数据管理、特征管理、模型管理能力的提升。对数据、特征和模型等AI资产加以沉淀、安全管控和风险治理,提升企业级AI治理能力,已成为MLOps新风向。
1.改进数据管理:在MLOps实践中,数据管理是至关重要的。这包括数据清理、数据预处理、数据增强、数据集版本控制等等。一个好的数据管理策略可以确保模型的稳定性和准确性,并且可以降低模型的风险。
2.加强模型监控:MLOps可以使开发团队更好地监控模型的性能和行为,及时发现并解决问题。这包括模型的预测准确性、模型的预测质量、模型的可解释性等等。
3.提高模型部署效率:MLOps可以使机器学习模型的部署过程更加高效和可靠。它可以实现模型的自动化部署、版本控制和配置管理,从而减少了人为错误和部署失败的风险。
4.加强团队协作:MLOps可以实现团队内部和团队之间的协作,从而加快模型的开发和部署。
此外,MLOps的市场持续火热,端到端的MLOps一体化工具和细分场景的专项工具都非常火热,端到端工具追求大而全的功能集,专项工具在局部或某些场景下功能和性能较好,例如流水线编排、可观测等工具,未来MLOps相关工具可能会成为AI软件市场的重要赛道。MLOps相关新闻
又一“火热”概念横空出世!“ML OPs”赋能AI加速,A股参与研发仅这5家
新题材!人工智能再次火爆,细分MLOPs生产力加速器来了
人工智能新题材MLOps——人工智能生产力加速器
人工智能研发运营体系(MLOps)实践指南(2023年)
MLOps相关股票及概念解析
启明信息002232
2023年3月22日公司互动:公司基于云原生的MLOps敏捷AI平台,帮助数据科学家和开发人员快速准备、构建、训练和部署高质量的AI模型;降低AI的成本,以自动化、低代码的方式进行生产和落地,提高生产效率,高效率,低成本的赋能启明各业务线产品和制造业各领域的智能化转型,实现操作、流程、决策的自动化、智能化,帮助企业AI进入工业化阶段。
万达信息300168
据2023年3月19日互动易回复:万达信息参编的团体标准《人工智能研发运营一体化(Model/MLOps)能力成熟度模型 第一部分:开发管理》(AIIA/P 0008-2022)、《人工智能研发运营一体化(Model/MLOps)能力成熟度模型 第二部分:模型交付》(AIIA/P 0009-2022)已经于2022年正式发布。
据公司招股意向书:Sophon MLOps通过统一纳管多源异构的算法框架、模型文件和模型服务,同时通过规范化的集成管理,统一部署大规模机器学习模型,并且提供实时监控模型服务的运行状态,可大幅降低模型管理成本,提升模型使用效率与运营能力,降低模型集成管理成本,控制生产环境风险。
宇信科技300674
据公司2022年年报:AIOps-学件管理中心是MLOps的一种在运维领域的实践,可以推广到更多的AI领域,并通过该能力实现产品和技术的变现。
科大国创300520
据2021年年报:国创九章数据智能平台持续做深平台的数据处理、AI开发、AI推理和AI部署能力,打造云边端协同的一站式AI平台,持续深化并行计算、高性能推理等核心技术的应用,以MLOps理念构建AI开发敏捷流水线,赋能行业客户端到端的业务建模。
传音控股688036
据2022年半年报:公司智慧云平台提高三方服务快速接入和智慧分发能力,完成端侧AI相关的MLOps平台服务建设。
看完老师您懂了啵,嗯,一目十行没懂?再来一遍
这次好好学习,下次再炒作第一时间上车,干之,肉之,会之,嫩之。
谢谢老师们点赞,收藏,转发,如有疏漏,请及时指出不足,我们共同成长学习,一起财富自由。奥利给。
上文不构成投资建议,仅供参考。
风清扬买票原则,不追高、不打板、不接力,祝您发财,8了个8。