国内科技巨头在大模型领域已有多年布局
国内科技巨头在大模型领域已有多年布局
我们认为,以 GPT 大模型为代表的 AI 能力提升,开启了新一轮的科技创新周期,
其中大模型成为科技创新的底座。
大模型增强 AI 技术的通用性,让开发者以更低成本、更低门槛,面向场景研发
更好的 AI 模型,助力普惠 AI 的实现。基础大模型的大规模产业应用不仅需要有与场
景深度融合的大模型体系,也需要有支持全流程应用落地的专业工具和平台,还需要
开放的生态来激发创新;三层之间交互赋能,形成良性循环的产业智能化生态共同体。
模型层是大模型能力的核心引擎。模型层从技术发展与产业应用出发,主要包
含基础、任务、行业大模型,模型的训练要求高,算力消耗大,建设人员主要为高级
算法人员。基础大模型主要优势在于其通用性,可以让该技术方向的相关应用任务都
得到进一步提升,但也正是这样的优势导致基础大模型在行业、任务中表现尚未最优。
任务大模型是在基础大模型上,面向典型的任务,如对话、搜索、文档智能、人脸识
别、OCR 等,进一步结合任务特性,优化模型算法,学习任务相关数据与知识,从而
使得大模型在任务上表现出更优异的效果,很多任务甚至可以零样本直接应用。行业
大模型是在基础或任务大模型上,进一步融合行业数据、知识以及专家经验,提升大
模型对行业应用的适配性,目前在金融、能源、制造、传媒、城市等已经有头部企业
或机构与科技公司或科研单位联合发布了行业大模型。基础+任务+行业三层大模型相
互促进,共同支撑起产业转化。
我国主要大模型产品盘点
百度文心大模型
百度率先在 2019 年 3 月发布预训练模型 ERNIE1.0,持续投入大模型的技术创新
与产业应用,布局了 NLP、CV、跨模态等大模型,率先提出行业大模型,构建大模型
工具与平台,探索产品与社区,在企业端和用户端均有不同程度的突破。
百度凭借海量的知识积淀和丰富的应用场景推出的文心大模型,具备知识增强、
产业级两大特色。百度自研的多源异构知识图谱,拥有超过 5500 亿条知识,被融入
到文心大模型的预训练中。百度文心大模型同时从海量数据和大规模知识中融合学习,
在知识的指导下,以语义单元为单位进行学习,效率更高、效果更好,可解释性更强。
文心大模型已应用于百度搜索、信息流、智能驾驶、百度地图、小度等重要产品,服
务数亿用户;在行业落地中,文心率先提出行业大模型概念,通过百度智能云在制造、
能源、金融、城市、传媒等行业广泛应用;通过大模型工具平台、开源开放的模型与
服务,已有近百万开发者使用文心大模型。
在近年的大模型技术探索与产业实践中,百度文心形成了支撑大模型产业落地
的关键路径,构建文心大模型层、工具平台层、产品与社区三层体系:建设更适配
场景需求的基础、任务、行业三层大模型体系,提供全流程支持应用落地的工具和方
法,孵化基于大模型的任务系统与创新产品,营造激发创新的开放生态。
文心「基础+任务+行业」三级模型体系:文心大模型层,结合技术发展趋势、
产业实践,构建基础、任务、行业三级模型体系。基础大模型聚焦技术方向的技术挑
战、通用性、泛化性探索;任务大模型深入理解任务特性,构建预训练算法、训练数
据集,打造紧贴任务的模型能力;行业大模型深度融合行业数据与知识特性,构建更
适配行业的模型底座。基础大模型支撑任务与行业大模型的建设,任务和行业大模型
结合真实场景与数据反哺基础大模型优化。
我们认为,百度在 AI 及大模型领域深耕多年,不仅具备完备的技术积累,同时
发力技术与行业的结合,推出了行业大模型,并在多个应用场景中得到实际应用,
具备先发优势。
目前,文心大模型已经建设了 36 个大模型,其中基础大模型包含:NLP(自然语
言处理)大模型、CV(计算机视觉)大模型、跨模态大模型,任务大模型包含对话、
搜索、信息抽取、生物计算等多个典型任务,行业大模型包含与来自 8 个行业的头部
企业或机构共建的 11 个行业大模型。
2.2.2.阿里通义大模型
2022 年9月2日,在阿里达摩院主办的世界人工智能大会「大规模预训练模型」
主题论坛上,阿里巴巴资深副总裁、达摩院副院长周靖人发布阿里巴巴最新「通义」
大模型系列,其打造了国内首个 AI 统一底座,并构建了通用与专业模型协同的层次
化人工智能体系,将为 AI 从感知智能迈向知识驱动的认知智能提供先进基础设施。
为了实现大模型的融会贯通,阿里达摩院在国内率先构建 AI 统一底座,在业界
首次实现模态表示、任务表示、模型结构的统一。通过这种统一学习范式,通义统
一底座中的单一 M6-OFA 模型,在不引入任何新增结构的情况下,可同时处理图像描
述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务,并达到国际领先水平。这一突破最大程度打通了 AI 的感官,受到学界和工业界广泛关注。
近期 M6-OFA 完成升级后可处理超过 30 种跨模态任务。
通义统一底座中的另一组成部分是模块化设计,它借鉴了人脑模块化设计,以
场景为导向灵活拆拔功能模块,实现高效率和高性能。目前业界普遍认为,人脑本
身由不同的模块组成,大脑中拥有储备各种知识和处理不同模态信息的能力模块,人
类思考时只调用与特定任务相关的模块,正这种机制保证了人脑的高速运行。通义统
一底座的另一组成部分「模块化设计」正是借鉴了这种运行机制。具体而言,模块化
大一统模型采用模块化 Transformer Encoder-Decoder 结构来统一多模态的理解和
生成,同时切分出不同的独立模块,包括基础层、通用层(如不同模态)、任务层到
功能性模块(如推理),每个模块间相互解耦,各司其职。
腾讯混元大模型
2022 年 4 月,腾讯对外正式宣布,腾讯“混元”AI 大模型在 MSR-VTT,MSVD,
LSMDC,DiDeMo 和 ActivityNet 五大跨模态视频检索数据集榜单中先后取得第一名的
成绩,实现了该领域的大满贯。这是腾讯首次对外披露“混元”AI 大模型的研发进
展,该模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、
文生视频等多个方向的超大规模 AI 智能模型。“混元”AI 大模型基于腾讯太极机器
学习平台进行研发,借助 GPU 算力,实现快速的算法迭代和模型训练。
MSR-VTT、MSVD、 LSMDC、DiDeMo、ActivityNet 是行业内最具权威性的五大跨
模态视频检索数据集榜单,主办单位包括微软、加州大学伯克利、阿卜杜拉国王科技
大学等,检索库涵盖了日常生活的诸多场景,已经成为科技企业和研究机构展现 AI
大模型技术实力的重要的竞技场之一。
华为盘古大模型
华为云盘古大模型于 2021 年 4 月正式发布,到 2022 年聚焦行业应用落地,已经
发展出包括基础大模型(L0)、行业大模型(L1)、行业细分场景模型(L2)三大阶
段的成熟体系。在华为全联接大会 2022 中国站上,华为云进一步迭代盘古大模型的
技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘
古 OCR 大模型三项重磅服务。
极端天气会带来巨大的生命和财产损失。华为云盘古气象大模型能够秒级预测未
来 7 天全球天气情况,相比传统预报算法,速度提升 1000 倍、精度提升 20%。今年 8
月,盘古气象大模型预测台风“马鞍”的轨迹和登陆时间,准确率达 90%,远超行业
平均水平。在海外,华为云为印尼打造了“国家海洋人工智能平台”,助力预测海洋
灾害,保障航行安全。此外,华为云 AI for Meteorology 还可以用于农业、航空、
航天等领域。
为了解决 AI 在煤矿行业落地难、门槛高等问题,华为云打造了全栈性能领先的
盘古矿山大模型。只需导入海量无标注的矿山场景数据进行预训练,盘古矿山大模型
即可进行无监督自主学习,仅一个大模型就能覆盖煤矿的采、掘、机、运、通等业务
流程下的 1000 多个细分场景,让 AI 应用在煤矿普及更容易。
在主运场景中,基于盘古矿山大模型的 AI 主运智能监测系统能够精准识别大块
煤、锚杆等异常情况,异物识别准确率达 98%。此外,相较于人工巡检,盘古矿山大
模型实现了全时段巡检,帮助工作人员及时地发现问题,避免因漏检造成的安全事故,
缩短停机时间,同时提升井下巡检人员的工作效率。
OCR 技术是人工智能的基础之一,能够对结构多变、种类多样、来源丰富的非结
构化数据进行识别与提取。传统的 OCR 厂商通常从特定的应用切入,陆续发展出卡证
识别、票据识别、文档识别、表格识别、车牌识别、智能扫码等一系列细分 OCR 能力,
通过组合的方式服务于各个行业。行业中每产生一个的新的识别场景,都需要在标注
后才能训练一个新的模型。这使得 OCR 服务的开发、维护成本居高不下。
华为云发布盘古 OCR 大模型,通过独有的对比学习与掩膜图像建模相融合的自监
督学习方法,学习并充分利用大规模的无标签数据,实现一个模型覆盖多个领域的全
部通用文字识别场景,并将标注工作量降低 90%。此外,盘古 OCR 大模型在 11 项经典
数据集测试中取得显著的精度提升,而且与原本领先的文字识别算法相比,盘古 OCR
大模型的精度平均提升 5%以上。
1、信创:国产数据库领军太极股份,国产WPS龙头厂商金山办公(与中小盘组联合覆盖),国产服务器龙头中科曙光,“中国芯”海光信息。其他受益标的还包括:1)信创软件:中国软件、用友网络、星环科技、海量数据、麒麟信安等。2)信创硬件:中国长城、龙芯中科、拓维信息、神州数码等。
2、新能源IT:重点推荐新能源SaaS龙头国能日新、配网调度先头兵东方电子、能源互联网唯一标的朗新科技(通信组联合覆盖)。
3、金融科技:重点推荐证券IT恒生电子,此外宇信科技、长亮科技、同花顺均迎景气上行。
4、智能驾驶:重点推荐智能座舱龙头德赛西威(汽车组联合覆盖)、座舱+驾驶OS龙头中科创达、此外高精度地图领军四维图新为重点受益标的。
5、人工智能:重点推荐智能语音龙头科大讯飞。
6、网络安全:重点推荐商密+自研芯片三未信安,新兴安全双龙头奇安信+深信服,安恒信息作为细分新兴安全龙头也将深度受益,其他受益标的包括:启明星辰、美亚柏科等。
7、云计算SaaS:重点推荐企业级SaaS龙头用友网络、办公软件龙头金山办公(与中小盘联合覆盖)、超融合领军深信服。
华为AI盘古大模型研究框架
华为产业链深度系列研究 (感谢浙商证券提供)
ChatGPT 推动 AI 芯应用,算力提升终端多点开花
ChatGPT 有望带动数据快速增长,AI 运算贯穿云-边-端。根据 IDC 预计,
全球数据总量预期 2026 年将超过 221,000 exabyte,2021-2026 年年复合增
长率达到 21.2%,其中非结构化数据占每年创建数据超过 90%;透过云、边、
终端架构,以数据为中心将算力资源前置,在更靠近数据源的地方为用户提
供低时延服务。
云端芯片:AI 模型训练核心,计算参数指数级增长重点受益。人工智能的
模型自 2012 年 AlexNet 问世以来,模型的深度和广度一直在逐级扩升;大
规模预训练模型成了一个新的技术发展趋势。根据 TrendForce 数据,截至
2022 年统计 AI 服务器年出货量占整体服务器比重近 1%,随着大型云端业者
开始大量投入 AI 相关的设备建设,AI 服务器 2022~2026 年复合成长率有望
达到 10.8%。
边端芯片:云端与终端的中继站,满足 AI 轻量化部署需求。根据 IDC 预测,
2025 年 64%的数据将在传统数据中心之外创建,意味着更智能的处理将在
设备上完成,边缘服务器具有体积较小、环境适应性更优、支持多种安装方
式、快速前维护和统一管理接口等技术特点。全球边缘 AI 处理器市场规模
近 30 亿美元,快速响应需求增加有望带动市场规模快速增长。
终端芯片:AIGC 应用多点开花,终端 AI SoC 迎来升级变革。AIGC 生成的
内容种类越来越丰富,而且内容质量也在显着提升,随着 AIGC 模型通用化
水平和工业化能力提升,有望降低内容生产和交互的门槛和成本。SoC 涵盖
声音、影像、AI 处理,为智能化场景提供完整解决方案,随着终端朝向 AI
应用发展,SoC 成为为智能终端的算力主控。
存储芯片:大数据同步算力提升,AI 需求推动市场增长。DRAM 方面 AI 运
算需足够的内存带宽,智能化有望带动内存需求提升;NAND 方面发展垂直
方向堆栈 3D NAND 层数,新技术注入成长动力。
建议关注:
云端 AI 相关企业:寒武纪、海光信息(天风计算机覆盖)、龙芯中科、紫光
国微、复旦微电、安路科技等。
边/终端 AI 相关企业:瑞芯微、晶晨股份、恒玄科技、全志科技、乐鑫科技、
富瀚微、中科蓝讯、炬芯科技、兆易创新、中颖电子、芯海科技等。
存储相关企业:江波龙(天风计算机联合覆盖)、澜起科技、聚辰股份、北
京君正、普冉股份、东芯股份、佰维存储等。
AI 应用端相关企业:工业富联、大华股份、海康威视等。
看完老师您懂了啵啵啵啵啵啵,嗯,一目十行没懂?再来一遍
这次好好学习,下次再炒作第一时间上车,干之,肉之,会之,嫩之。
谢谢老师们点赞,收藏,转发,如有疏漏,请及时指出不足,我们共同成长学习,一起财富自由。奥利给。
上文不构成投资建议,仅供参考。
风清扬买票原则,不追高、不打板、不接力,祝您发财,8了个8.