阿里“通义”大模型体系,打造AI的统一底座。该模型在业界首次实现模态表示、任务表示、模型结构统一:不引入新增结构,单一模型就可以同时处理超过10项跨模态任务。应用方面已经深入到电商、设计、医疗、法律、金融等行业,服务超过200个场景。
基于统一学习范式、模块化设计,阿里推出了义-M6、通义-AliceMind和通义-视觉三大类模型。1)统一学习范式OFA是通义大模型背后的关键技术支撑,其核心在于实现了多架构、多模态、多任务的统一:2)模块化设计使
大模型能够实现轻量化,并取得较好的微调效果,单模态、多模态任务水平均能得到提升:3)通义-M6模型(主攻多模态):2021年10月发布十万亿参数模型,成为全球最大预训练模型,2022年1月推出业界首个通用统一大模
型M6-OFA:4)通义-AliceMind模型(主攻NLP):是达摩院开源的深度语言模型体系,涵盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备阅读理解、机器翻译、对话问答、文档处理等能力:5)通义-视觉大模型(主攻CV):可在电商行业实现图像搜索、万物识别等场景应用,并在文生图、交通和自动驾驶领域发挥作用。
超大模型的落地难题,阿里给出了答案。一方面,阿里研发出高质量的大模型压缩技术S4框架,能够实现百亿参数大模型在几乎不损失精度的情况下进行稀疏化,最终实现单卡运行。另一方面,基于“通用大模型+行业knowhow”的方式迭代模型,通义大模型的架构设计将这一过程做得更快且更高效。目前,通过部署超大模型的轻量化及专业模型版本,通义大模型已在超过200个场景中提供服务,实现了2%-10%的应用效果提升。
生态:“魔搭”社区和“飞天智算平台”。1)在开源社区生态层,2022年11月,达摩院联手合作伙伴推出AI模型社区魔搭ModelScope,致力降低AI应用门槛,从代码下载到安装部署再到效果验证,所需时间从数天下降倒几个小时甚至几分钟。2)在算力底座层,2022年8月,阿里云宣布推出“飞天智算平台”,并启动位于张北和乌兰察布的两座超级智算中心,算力规模合计15EFLOPS,成为全球最大规模智算平台。粗略估算,如果15EFLOPS资源同时工作,10分钟就能完成一个万亿参数AI大模型的全部训练。
建议关注阿里系持股,且在AI大模型方向有潜在应用场景的标的(但并不意味着阿里或达摩院大模型已经使用):
石基信息(酒旅)、超图软件(GIS)、恒生电子(金融)、安恒信息(隐私计算+数据安全)、光云科技(电商SaaS)、千方科技(交通)、卫宁健康(医疗)、金桥信息(法院)、税友股份(财税)等。
互联网传媒领域,阿里系持股公司或与阿里有重要合作的标的:分众传媒(阿里持股)、丽人丽妆(阿里持股)、光线传媒(阿里持股)、值得买(电商导购,与阿里有流量合作)、盛天网络(与阿里文娱有IP合作)、蓝色光标(与阿里合作虚拟直播间)、易点天下(阿里是公司第一大客户)、创业黑马(与达摩院合作赋能中小企业)。
其他部分AIGC在计算机的重要公司:润达医疗(电万医药、医疗诊断AI)、大华股份(AI领军)、广联达(建筑Al化)、虹软科技(Stable Diffusion 2B图像)、福昕软件、金山办公、致远互联、万兴科技等。
风险提示:大模型技术中美仍存在差异,部分技
术尚处于实验室阶段,存在落地风险。 顶部