登录注册
华为盘古3.0大模型发布
耕谷坊丨金岁月
只买龙头的龙头选手
2023-07-08 08:20:58


2023年7月7日,华为开发者大会2023(Cloud)在东莞拉开帷幕。会上,华为常务董事、华为云CEO张平安最先登台演讲,并发布了盘古大模型3.0,强调称“华为做AI的方向始终是AI for industries(工业人工智能)”。



本次发布的盘古大模型3.0,亦是面向行业。



一,盘古大模型3.0迎来首次重大升级华为云盘古大模型3.0版本正式发布,包含五个基础大模型、N个行业大模型以及更多细分场景模型;盘古大模型3.0是一个面向行业的大模型系列,包括“5+N+X”三层架构。



其中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求,提供100亿参数、380亿参数、710参数和1000亿参数的系列化基础大模型,匹配客户多样化需求。



同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,用户可直接调用这些技能。L1层是N个行业大模型,华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;



也可以基于行业客户的自有数据,在盘古大模型的L0和L1层上,为客户训练自己的专有大模型。L2层则为客户提供了更多细化场景的模型,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,为客户提供“开箱即用”的模型服务。



张平安称,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求,支持公用云、大模型云专区、混合云等多样化部署形态。



二,盘古大模型与其他大模型的区别华为的盘古大模型,不会写诗,只会做事。



翻译翻译就是:很酷,不聊天。从能力来看,盘古大模型已具备文生图、文生文、文生代码、文生视频等多模态能力,从调用内容来看,用户可直接调用公开通用大模型,也可以利用自身行业数据训练自己的专属大模型,支持公用云、大模型云专区、混合云等多样化部署。



区别于最早一批发布的通用大模型,如百度文心一言、讯飞星火等低门槛接触、随意对话的新一代人工智能,华为并未将自家大模型的重心放在C端。



从现场演示来看,盘古并非没有对话和问答功能,而是华为选择将这些ToC功能先放在行业场景中,再来看效果。没有写作绘画,没有诗和远方,华为给盘古大模型的定调就是“完全面向行业”的大模型。背后,则是一套系统——包括自然语言、多模态、视觉、预测大模型和科学计算五个基础大模型,以及针对政务、金融、制造、矿山等行业设计的专用大模型,和台风预测、药物制造等场景大模型。



三,盘古大模型的进化史华为云盘古大模型2020年启动研发,在2021年4月也就是前两年的HDC大会上,华为就发布了盘古NLP大模型1.0和盘古视觉大模型。



当时,时任华为云CEO的余承东还给予了“华为云盘古大模型是一款在AI产业界非常、非常、非常震撼的产品”重要事情说三遍的称赞。



2021年4月,华为发布了盘古NLP(中文语言)大模型、盘古视觉大模型、盘古科学计算大模型。



盘古NLP大模型,不仅是业内首个千亿参数的中文大模型,而且在预训练阶段学习了超过40TB行业文本数据和400万小时的行业语音数据,具有1100亿参数。



在大模型中,参数占有重要的分量。所谓的AI大模型就是将海量数据导入具有亿量级参数的模型中,机器通过完成类似“完形填空”的任务后,最终被训练成具有逻辑推理和分析能力的人工智能。



目前大模型参数均在千万亿级别,GPT-3拥有1750亿参数(即175B)。



而后,在2021年5月,最大版本参数量达2000亿的“鹏程·盘古”大模型也重磅亮相,2021年的盘古大模型着实称得上“厚积薄发”。



同时,2021年的盘古视觉(CV)大模型也是一个超30亿参数的CV大模型。在预训练时就输入了10亿级图像,能够同时满足底层图像处理与高层语义的理解需求。



2021年9月,华为推出用于药物研发细分场景的大模型。2022年,华为与能源集团合作发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。



四,盘古3.0大模型如何赋能行业?



在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手小福,能够精准理解民众咨询意图,改变传统的一网通办模式,把老百姓的话语转化为政府办事的语言。



盘古政务大模型对超过20万条政务数据进行精调,包括12345热线、政策文件、政务百科等,掌握了丰富的法律法规、办事流程等行业知识。



在煤矿领域,盘古矿山大模型已经在全国8个矿井规模使用,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景,让更多的煤矿工人能够在地面上作业,不仅能让煤矿工人的工作环境更加舒适,而且可以减少安全事故。在铁路领域,盘古铁路大模型能精准识别现网运行的67种货车、430多种故障,无故障图片筛除率高达95%,成为货运列检员身边有力的数字助手,将列检员从每日数百万张的“图海”检测中解放出来。



在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的AI预测模型,同时预测速度也有大幅提升。原来预测一个台风未来10天的路径,需要在3000台服务器的高性能计算机集群上花费5小时进行仿真。



现在基于预训练的盘古气象大模型,通过AI推理的方式,研究者只需单台服务器上单卡配置,10秒内就可以获得更精确的预测结果。



在金融领域,盘古金融大模型可以对银行的各种操作、政策、案例文档进行预训练,能根据客户的问题,为柜台工作人员自动生成流程和操作指导,将原来需要平均5次的操作降低为1次,办结时间缩短5分钟以上。



盘古大模型让数十万网点柜员都拥有自己的智慧助手。在制造领域,过去单产线制定器件分配计划,往往要花费3个小时以上才能做齐1天的生产计划。



盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够对业务需求进行准确的意图理解,并调用天筹AI求解器插件,1分钟即可做出未来3天的生产计划。



在药物研发领域,原来一款新药研发平均需要10年时间、花费10亿美金。盘古药物分子大模型助力西安交通大学第一附属医院刘冰教授团队发现全球40年来首个新靶点、新类别的抗生素,并将先导药物研发周期缩短至1个月、研发成本降低70%。张平安表示:“盘古大模型要让每个行业、每个企业、每个人都拥有自己的专家助手,我们始终坚持AI for Industries的战略,在深耕行业的道路上不断前行。”





五,A股公司披露与盘古大模型合作情况



1,梦网科技在互动平台称,公司结合盘古大模型打造“AI+5G消息”,进一步发掘消息服务场景结合的潜力,为客户打造智能化消息服务解决方案。6月15日,梦网科技表示,目前公司已与华为云盘古大模型签署业务合作框架协议,目前暂未产生收入和利润贡献。



2,东方国信表示,公司自主研发的AI深度学习应用层产品与华为昇思(盘古大模型的底层AI框架)完成兼容认证。



3,云鼎科技称,为促进人工智能和矿山智能化建设的深度融合,云鼎科技联合华为公司基于盘古矿山大模型技术,利用山能人工智能训练中心开发和实施矿山领域应用场景,涵盖采煤、主运、提升、掘进、辅运、安监、防冲、洗选、焦化等多个专业,打造了一体化的矿山应用产品及解决方案。



4,吉宏股份表示,公司于2023年6月5日与华为云签署人工智能大模型联合创新协议,正式启动跨境电商平台AIGC深度赋能第二阶段合作,双方将以跨境电商平台的智能化改造升级为核心,在AIGC赋能企业全流程、大模型战略联创、跨境电商平台深度赋能、应用现代化改造、数据挖掘和数据治理等领域展开全面交流,共同打造盘古跨境电商大模型,推进更深层次的数字化转型。



5,华塑科技称,公司已向盘古项目供货。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
工分
0.68
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据