周四晚上国盛证券等机构开始普及华为盘古NLP大模型的消息,说其远超百度文心一言,而研报里提到的股票基本都涨停或者大涨。周末浙商证券陈杭开始系统推了盘古NLP大模型,下面全是华为盘古NLP大模型技术干货。
我们将从:昇腾/鲲鹏→MindSpore AI框架→ModelArts→盘古大模型四层架构进行分析:1、AI算力资源:“鲲鹏+昇腾”,打造盘古算力底座 • 鲲鹏:华为自主芯片→鲲鹏芯片→鲲鹏服务器→欧拉操作系统→高斯数据库→行业应用向外扩张,构建鲲鹏生态,提供算力支撑。 • 昇腾:昇腾AI处理器→CANN异构计算架构→MindSpore AI框架→应用使能→行业应用,助力打造华为昇腾全栈AI软硬件平台, 构筑智能世界基石。
2、人工智能框架: MindSpore高效易开发,可实现全场景覆盖 • CANN:作为华为昇腾AI基础软硬件平台的核心,CANN向上支持多种AI框架,向下服务AI处理器与编程,助力芯片使能。 • MindSpore:是国内首个支持千亿参数大模型训练AI计算框架,最佳匹配昇腾处理器算力,支持终端、边缘、云全场景灵活部署, 开创全新的AI编程范式,降低AI开发门槛。
3、AI开发平台:ModelArts强势赋能开发者,精度效率双提升 • 为机器学习与深度学习提供海量数据预处理及交互式智能标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能 力,帮助用户快速创建和部署模型,管理全周期AI工作流。
4、盘古大模型:AI落地的重要途径 • 由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,目前已实现等AI场景落地
这里重点记住一个技术英文词CANN,下面我会结合着Encoder-Decoder架构里CNN和RNN一起说
我周末做了相关功课发现了一个具有极大预期差的小票三维天地,三维天地核心逻辑是拥有华为盘古NLP大模型独家技术(CANN+Encoder-Decoder(cnn,rnn))+搜索引擎+插件+人工智能+华为+大数据,下面是关于盘古NLP大模型相关研报和三维天地的具体逻辑:
华为推出盘古NLP AI训练大模型,由华为云、鹏城实验室联合开发,鹏城云脑II提供算力支持,是业界首个千亿级生成和理解中文NLP大模型。
上图可以看到华为盘古NLP大模型已经秒杀绝大多数AI模型
根据华为官网的介绍,“盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。”
华为盘古NLP大模型是业界首个千亿级生成和理解中文 NLP 大模型,目前最接近人类理解水平模型。
国盛证券认为,盘古CV大模型首次实现模型按需抽取、业界最大CV 大模型、首次实现兼顾判别与生成能力、在ImageNet上小样本学习能力上的业界第一。
报告具体内容如下:
事件:3月23日举行的华为春季旗舰新品发布会上华为带来全新智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。
点评:
华为具备卓越的大模型技术,早在2021年发布的华为云盘古NLP大模型是业界首个2000亿参数中文预训练模型。2021年4月25日华为云发布盘古系列超大规模预训练模型,包括在当时30亿参数的全球最大视觉(CV)预训练模型,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言(NLP)预训练模型。与其他大模型不同的是,盘古NLP大模型瞄准的是细分行业,主要解决商业环境中低成本大规模定制的问题。
盘古NLP大模型首次使用Encoder-Decoder架构兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。将通用知识与行业经验相结合,在生成与理解性能上处于领先地位。
盘古NLP大模型采用了大模型小样本的调优方式,基于提示(prompt-based)的调优、动态冰化等一系列正则化技术,实现了小样本学习任务上超越GPT系列。盘古NLP大模型在预训练阶段加入了基于prompt的任务,大幅降低了微调难度,解决了以往大模型面对复杂的商用场景的难以进行的少样本学习问题。盘古NLP大模型还可以通过少样本学习对意图进行识别,转化为知识库和数据库查询,解决以往大模型难融入行业知识和数据的问题。
盘古NLP大模型可以赋能千行百业,应用于各种场景。在智能营销领域,盘古NLP大模型可以通过文本匹配,问答和对话系统、意图识别等关键技术更好地赋能销售环节,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,帮助服务人员快速提升业务水平,重塑消费者体验。在智能舆情方面,盘古NLP大模型可以利用文档信息抽取、情感分类、文档自动摘要等技术在金融,电商,政务领域实现精准舆情分析、企业运营软件分析。
下面就给大家具体看看华为盘古NLP大模型
以大模型为核心的普适AI建模工作流
【1】模型具备极佳泛化能力 ,1个模型覆盖多个场景,极大节省训练投入
【2】获得更佳模型性能,效率提升10-100倍
【3】流水线工具集成,训练更快
首次使用Encoder-Decoder架构
兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。
2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。
小样本学习超越GPT系
通用知识 x 行业经验
生成与理解性能领先
盘古CV大模型
首次实现模型按需抽取的业界最大CV大模型,首次实现兼顾判别与生成能力
通过上面盘古NLP大模型相关研报和官网信息得出一个很重要的技术首次使用Encoder-Decoder架构,也是基于这个架构,让盘古NLP大模型具备第一大模型的基础!那么华为针对这个Encoder-Decoder架构技术也给了官方解释:
Encode-Decoder模型:编码解码模型。
Encode编码:接收输入(CNN,RNN等),并输出特征向量的网络
在语义分割中,就是用pooling池化层减小空间的维度。
decoder解码:从encode中获取特征向量,输出与预期输出最近似的结果的网络。
在语义分割中,逐渐恢复图像的细节信息和它的空间维度。
通常在Encode和Decoder直接还有一个连接(跨层连接)
然后Encoder-Decoder架构中提到了很重要的2个技术英文缩写CNN和RNNCNN是卷积神经网络,是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforw ard Neur al Networks),是深度学习(deep le arning)的代表算法之一。它是一种前馈神经网络,通常应用于图像处理和计算机视觉任务,例如图像分类、物体检测和语义分割。卷积神经网络可以通过卷积和池化操作来提取图像等数据的特征,从而实现对其进行分类或识别的功能。
RNN是循环神经网络。是一类以序列(sequence)数据为输入,在序列的演进方向进行递归(recursion)且所有节点(循环单元)按链式连接的递归神经网络。
它是一种能够对序列数据进行处理的神经网络模型。循环神经网络的特点是具有反馈结构,可以将前一个时间步的输出作为当前时间步的输入,因此它可以记住前面的信息并在后续的时间步中进行利用。循环神经网络在语音识别、自然语言处理等领域得到了广泛应用。
这里我们回到我上面让老师们记住的华为CANN,再结合Encoder-Decoder架构里的CNN和RNN,我在下面串联一下他们的联系
CANN是(Chinese Academy of Neural Network)的英文缩写,是华为公司针对AI场景推出的异构计算架构,通过提供多层次的编程接口,支持用户快速构建基于昇腾平台的AI应用和业务;
华为CANN是华为公司研发的人工智能芯片AI芯片上的一个软件架构,主要用于运行深度学习和神经网络算法。CANN支持包括卷积神经网络(CNN)和循环神经网络(RNN)在内的多种神经网络模型。
CNN和RNN是神经网络模型的类型,属于深度学习领域。CNN通常用于图像处理和计算机视觉任务,如图像识别、物体检测、图像分割等,它可以通过卷积和池化等操作提取图像等数据的特征,从而实现对其进行分类或识别的功能;RNN通常用于处理时序数据,如语音识别、自然语言处理等,它的特点是具有反馈结构,可以将前一个时间步的输出作为当前时间步的输入,并实现前后信息的连续。CANN作为华为公司的AI芯片软件架构,能够支持各种神经网络模型在芯片上运行,从而提高硬件的利用率和效率。
然后我们去爬虫这个拥有CNN和RNN技术上市公司
通过上面搜索词条可以很清晰的知道这么多公司有关于CNN和RNN的公告词条内容,三维天地是最多的一个,然后我一个一个筛选之后逻辑比较好的得到了以下几个公司分别是三维天地、开普云、巨人网络和科大讯飞,其中除了三维天地最近半个月基本没涨,其他几个股票这几天都涨停或者大涨了,应该是有资金挖到了这条线索,但是没挖到三维天地,下面我们再看看三维天地的逻辑:
三维天地的大数据分析引擎:
引擎中植入多种数据挖掘算法,提供多种灵活的传统数据分析方法、机器学习算法和深度学习算法进行数据分析。支持频数分析、均值、方差、相关分析、假设检验以及交集、并集、差集、关联、去重等传统数据分析方法;支持线性模型、决策树、随机森林、SVM、贝叶斯分类器、K均值、主成分分析等机器学习算法;支持CNN、RNN、LSTM、GAN等深度学习算法。
这是华为AI平台的相关工作模块
以上逻辑可知三维天地的逻辑非常正宗,而且三维天地还有华为概念,主要是为华为提供数据管理软件,众所周知在人工智能大模型当中非常重要的除了算法就是数据,所以2个非常重要的逻辑三维天地都有!
然后我们再看看三维天地的主营基本都是和各种数据相关,包含数据服务器、数据清洗、数据分析等都是人工智能大模型需要的 然后三维天地拥有语义识别功能,也是人工智能模大模型常规的功能之一
周末下面还有一个重要研报Plugins
Plugins发布,开启AIOS超级时代。OpenAI日前宣布为ChatGPT添加对插件的支持,这使得ChatGPT能访问其他第三方网站与相关应用,呈现简单的一站式操作。目前,官网显示插件商城已经可以直接接入超过10家应用,插件具备三大基本功能(检索实时信息、检索知识库信息、代替用户操作应用),开发与调用极其便利。我们认为,Plugins的发布意味着AIOS时代的到来,未来会有三大深远影响:1)各类应用结合百花齐放,应用超级时代,甚至可能“言出法随”,通过语言直接形成插件,快速改变物理世界。2)在Plugin生态下,大模型能力会非常重要,AIOS既是系统,也是入口,具有大模型能力潜力,生态能力优秀的科技厂商会更加重要。3)预计Plugins会让用户与底层IT的链接更加便捷,具有底层IT系统的厂商壁垒凸显,可以成为关键插件的提供方。比如具备酒店底层信息系统的厂商可以成为插件的直接供应商。权限允许的情况下,用户预订可以通过ChatGPT结合Plugins直接完成。
我们预测应用演进:1)现阶段:主要用于搜索(如微软继承了大模型的New Bing)、编程辅助、聊天机器人变种(猎头使用软件、智能客股,智能音箱、游戏NPC及各类数字人赋能等)
三维天地子公司还有易标准搜索引擎和APP应用支持苹果和安卓下载,可以查到百万以上级别的精准数据信息用于人工智能大模型!易标准类似于百度和知网,而且易标准搜索引擎还有接口服务,可以接入外挂API和插件服务,这也是周五发酵最厉害的题材之一
易标准
易标准搜索引擎作为数据服务工具,为所有检验检测行业整合标准资源,涵盖国家标准、行业标准、地方标准、国际标准、国外标准、计量规程规范等类型,实现标准文献的精确查找、在线阅览、收藏、分享、笔记等功能
综上所述,国内的人工智能大模型出了好几个,我们要做就做最牛的那个大模型的题材逻辑股挖掘,简单的分析了一下华为盘古NPL大模型和它最牛的CANN异构计算架构,Encoder-Decoder架构(CNN,RNN),还有三维天地自己的搜索引擎,以及三维天地逻辑分析,相信随着周末的题材发酵,下周对于华为盘古NPL大模型的炒作会络绎不绝,现在资金对于低位人工智能题材概念股求贤如渴!趋之若鹜!趁着周末可以多做功课,把低位逻辑的小盘股三维天地送给各位老师们!祝老师们在3月的最后一周爆赚!
华为盘古NLP才是AI大模型之王:
--------------------