全球科技创新核心AI发展展望会议纪要-韭研公社

登录注册

全球科技创新核心AI发展展望会议纪要

夜长梦山

2023-02-13 10:28:12

【国盛计算机】全球科技创新核心AI发展展望会议纪要特邀嘉宾：云从科技董事长周总【首席前言】过去两年全球科技领域融资比较低迷，但是AI方面的革命性创新（如机器人、C hatGPT、AIGC）为未来带来希望。近期科技投资的热度进入底部区域，AI方面的新进展层出不穷，基于对机器人导入期的研究、后续ChatGPT、AIGC的研究来看，新一轮的科技投资周期以及科技发展周期里，人工智能是目前全球科技发展、科技投资的核心。【行业分享】 AI发展： 1）软件：两个派系，分为数据派（有更多的数据来训练更大的模型）和知识派（加入人的知识，通过知识来建立规则，向专家系统发展）。随着deep Learning的发展，即2016年开始，数据派占优，大量数据会支撑模型优化，在计算机视觉上有突破性进展。2016年的代表Alpha Go带动资本浪潮，在AlphaGo时代，围棋上的成功并不能带来很大现实应用，而ChatGPT重要的推进是，其现实应用更多，类似助理。 2）技术：使用的模型与2年前发布的GPT 3模型底层数据和模型规模一致，ChatGPT的突破性进展在于引入了人的知识，而非扩大了数据，即人类反馈的强化学习。简单来说，以前监督学习的大数据训练也需要人为标注，标注比较初级，而chatGPT的标注是来源于专业人士，把人类对于问题最好的回答回传，教练模型最大程度挖掘大数据，在各个具体的领域训练、精修，很好的结合了之前两个派系（数据派和知识派）。 3）未来chatGPT的发展将得益于人机协同，将人的知识和数据的能力做更好的结合。其优势在于：a）使得各个应用场景的门槛降低；b）如果技术非常场景化，通用性就变差，基础研下技术的高成本难以分摊，但是通过ChatGPT的范式，可以做到核心技术的投入、算力、算法的通用化，人的标注可以快速做场景的应用，边际效用增长，会大大加速各个行业的智能化升级。c）目前chatGPT深入产业链解决问题，比AlphaGo更振奋人心。 AI和产业落地结合，从一横一纵来看： 1）横：人的能力包含感知、认知、行动。关于认知体系，ChatGPT主要是是认知的环节，不包含感知；关于感知体系，感知主要指云识别和CV，如果没有感知，物理和数字世界无法打通，而未来的大模型包含视觉、语音、自然语言的大模型，这才是未来的发展方向；关于行动体系，AI与人的互动有三种：托管（主要依赖于AI来做）、伴随（人和AI一起操作）、问答（以人为主，操作过程中有问题通过语音或文字输入的方式询问AI），三种从强到弱，前两种无法实现是因为没有与物理世界打通。仅从软件角度来看，未来强AI一定要将视觉、语音、自然语言、大数据融入，软件逻辑需要横向打通。如果将软件结合实体，数字人与实体机器人打通，会带来巨大的突破，完成完整的横向逻辑。 2）纵：即产业链的发展，类似汽车厂商的产业链分工。Tier 3：AI里的Tier3是大量要解决的技术点，场景、文字、行为等识别都是单点技术，都需要大量资源投入，由各个供应商来突破，通过SDK或者API来提供；Tier 2：需要技术平台整合各种技术，比如通用的视觉、语音、自然语言处理平台、人形机器人组件的平台；Tier 1：Tier 1品牌商类似汽车里的整车厂商，设计AI整个数字人、人形机器人的厂商，面向场景应用形成各种产品，比如家庭医生、造型设计师等数字人产品。早期，一些公司会占据多个定位，纵向拉通；随着产业链的分工的细化，未来每个层次里都会有很多的机会和公司参与，数字人和实体机器人可以应用的行业领域非常多，在每一个行业下面都会形成巨大的市场空间，产业体系下的产品会在多个场景下赋能。【Q&A】 Q：从训练的数据集、模型的体量来看，国内达到chatGPT 3.5，模型能力、数据能力、标注能力，2年之内有没有可能形成对标的类似产品？ A：国内从NLP角度来看，百度、华为、清华、鹏程实验室的大模型数据量、参数规模不亚于GPT3.5，达到千亿级数据，甚至数据量和模型都会更多。下一步要解决的问题还是要更好地和知识做接入。从目前来看，两年对国内信心较足，1）算力、数据量没有差距，追赶较快。2）未来做教练模型、强化学习、经验模型，不一定要由少数大公司来做，可以由既掌握深度学习大模型的核心技术、又有行业理解的公司来做，形成生态的丰富化，对于本身有AI布局的公司来说都是机会。云从在计算机视觉、语音、NLP上遵从模型和知识相结合、再做教练模型、再做经验模型的思路推进，国内头部企业都会按照chatGPT验证成功的这个范式来推进。 Q：GPT3.0和GPT3.5的差别很大，对于知识点的回应比较全面，chatGPT3.5距离通用型人工智能还有多远的距离？ A：通才是一件比较困难的事情，目前GPT3.5总是在讲“正确的废话”，具备了语言组织的框架和逻辑，但是对于某个特定领域的回应不够深，内行人会觉得有所欠缺，教练模型就是为了提升专业性，可以通过数据和知识（行业Know How）来训练。如果想让通用型人工智能在某个方面做的非常专业是比较容易的，能解决某个领域已经具备很大的现实意义。 Q：微软对此最感兴趣，Office和Bing上都会做投入，投资在百亿美金的级别，如何理解微软的行为？是否因为在微软的生态下，商业化更容易实现? A：AI有三个阶段，1）一档时代：单点阶段，语音识别，人脸识别，车牌识别、手写体识别、OCR识别等，2）二档时代：多个技术的组合，在工业、医疗等场景解决问题，；3）三档时代：颠覆入口和内容。 l 颠覆入口：颠覆交互方式，搜索的入口变革（敲命令行——微软用视窗颠覆，鼠标实现所见即所得——Google搜索框——苹果触屏）,AI会继续做变革，在语音、视觉、自然语言变革之后，以助理的方式解决问题。微软拥抱很合理，应用很直接，对于入口的颠覆意愿很强，减少了用户自行选择信息的方式，有助理来收纳整理，“颠覆者”的动力最初最强。后期“被颠覆者”的动力也会逐步增强，比如苹果，目前滑屏搜索比较便捷，如果有更便捷的方式问世，也会相应拥抱新技术。 l 颠覆内容：AIDC，以丰富、更个性化的方式来生成内容。因此，微软拥抱chatGPT很合理，应用很直接；苹果在Siri上做加强也是不错的应用，；mask作为OpenAI的创始投资人，也可能会迭代到bot上。 Q：云从科技等A股计算机公司受疫情影响，招标、实施有所延期，今年随着投资的增强、科技产业的复苏，是否在逐步复苏？目前港股、四小龙、AI公司春节期间表现较好，今年的发展趋势和节奏如何？大模型的预训练、 chatGBT、AIGC的底层算法的发展是否对业务有中长期促进? A：技术：1）坚持投入，在正确赛道上长期布局。AI的未来发展一定会对场景和产业形成效率和体验的全面提升，长期会坚持数据结合知识的趋势，坚持整个大模型、预训练、下游任务迁移的逻辑，自2020年便在预训练、业务迁移上，视觉、语音、NLP的大模型上持续加大投入，沿袭chatGPT的范式。2）倡导人机协同，NLP已经被人类高度抽象过，处理难度相对较少；而视觉、语音堆数据达到的成果会更难，属于原始数据，处理难度更大，后续会需要更多人的参与。3）技术平台化、应用场景差异化：要从Tier3逐步走到Tier1，逐渐成为AI平台公司，不能只做平台，也要在行业做一些落地，一方面是用行业 Know-how提升算法模型水平；另一方面形成范式，后期与第三方的公司和合作伙伴一起使用时，形成更好的生态。业务：1）ToG业务在2022年受疫情影响，招投标延迟、预算减少、规模减小；今年政府明确在新基建等方面加大投入，前期未招的标会后续落实，业绩有保障；2）ToB业务加强布局，随着AI在ToB行业解决问题增多，标准化程度上升，可复制性变强，公司在ToB行业业绩的增速也会较为可观；3）数字人在ToB和ToC业务会有更大应用空间。 Q：今年在ToB上主要哪些行业会有订单落地？销售价格、收入确认节奏如何？ A：最大行业是金融，目前来看比2022年增速有明显提升。金融的应用场景快速变多，除了IT，存贷汇的业务里也引入数字人，此类订单快速释放；确认节奏比较好，项目周期不太长，回款有保障。其他行业：智能制造、医院等行业有大量需求，底层逻辑上有良好通用性，对发展速度比较有信心。 Q：政府上主要落地的业务？ A：AI赋能数字城市治理，大逻辑有三个部分：1）数据要素：是政府未来重要资助方向，各地数交所和大数据平台在部署，公司正在与多地政府和云从沟通如何通过AI能力打通、为数据赋能，并且公司是科技部和发改委的国家的开放平台；2）提升智慧治理水平：数据金融屋，城市管理、应急管理等；3）当地支柱产业的智能制造：也在与政府沟通合作，提升制造业水平。 Q：今年的业绩预测、净利率指引？ A：今年业绩增速相较2022年会有较大的提升。 Q：ChatGPT是否会拉动算力资源的提升？目前中国算力能否满足？ A：算力分为训练侧和推理侧，训练侧只有AI公司需要大量数据和算力来做支撑，一次算力耗费1亿人民币，但是次数相对有限，公司数目也相对有限；推理测，如果广泛在生活中应用，每个人需要的助理以10个计，每个数字人/实体机器人需要一套算力支撑计算，按中国的人口规模来算会非常大。前期主要是科技公司训练，算力部署足够；当场景落地且普及，肯定会大范围扩建。 Q：ChatGPT产生的新应用在哪几个场景会更多？ A：目前没有一个模型能完全打通视觉、语音和自然语言理解的模型，几千亿的数据不足以描述视觉和语音。ChatGPT最有价值的是范式，未来视觉、语音模型等可以参考。需要用自然语言问答的场景会对ChatGPT更迫切，比如搜索引擎。如果未来几年将多个逻辑结合，不受逻辑限制，能打通线上和线下，打通实时和非实时，助理的形式对应的空间会完全不同。云从会从ToG、ToB的多个应用场景，通过算法效果和平台通用化后的综合技术能力，在政府、工业、金融领域提升业务、降本增效，逐渐渗透得对行业进行改造，是您前面讲的一个问题。第二个问题就是你问他最后的范式会是少数公司占据，还是逐渐会更多的公司来做这件事？哈，这个也是取决于我们讲的什么模型。如果是一个通用的聊天机器人，在这一块上面，它需要有一个大的模型做基础，可能就是几千亿个参数。首先会有几个大公司来发布，但是通用的大模型，它其实不能解决我刚才讲的各个场景里面的专业的问题。所以它会有一系列的，也是要中等规模的一些基础公司来对做，把场景的 Lo 耗，刚才讲的训练，再次训练，或者是教练模型跟它进行结合，会有一系列的中等规模的公司来一起来做这件事情。 Q：百度3月底会发类似的模型，未来会形成怎样的格局？是由几个公司来发布通用型工具吗？云从科技是不是也会发布类似的？ A：最后的范式会是少数公司占据还是更多的竞争者格局，取决于是什么模型。如果是通用的聊天机器人，需要几千亿个参数，会有几个大公司发布通用大模型，在具体场景上需要中等规模公司借助行业Know-how来做。但是对于语音和视觉模型，需要专业的公司，不会因为有了通用大模型就降低门槛，Tier1-3都不会降低门槛，只会降低最上层场景应用的门槛。 Q：高算力上是否会被美国卡脖子？中国算力上是否有担心？ A：会有一定影响，但不是决定性的影响，核心企业的算力不会因此无法训练，会增大使用成本，但是AI属于颠覆性技术，不会因为成本问题不发展。另一方面，中国芯片未来也会同步发展。 Q：与商汤、依图、旷视等的优势和差别？ A：AI赛道很广，AI是技术而非产业，类似互联网，形成竞争的会是搜索、电商领域，AI可能性很多，会各自赋能各行各业。依图做AI芯片，旷视做AIOT，而云从做人机协同操作系统，打通逻辑，从Tier3做到Tier1，以数字人作为灵魂，赋能各个场景和行业。 Q：AI公司是否会与BAT等大厂合作来做场景、生态的协同？ A：会与一系列公司做合作，但不一定和BAT合作，因为BAT优势在于ToC，会和国央企、B端公司做更多联结。 AI公司业绩增速达不到移动互联网前两年的快速增速，移动互联网公司依靠商业模式，而AI公司存在技术和场景应用的临界点问题，需要等数字人的体验达到一定程度，使得大众接受，才会迎来爆点，技术的积累使得AI公司的发展相对较慢。 Q：公司的技术优势？ A：视觉是云从起家的技术点，优势最强。

作者利益披露：转载，不作为证券推荐或投资建议，旨在提供更多信息，作者不保证其内容准确性。

声明：文章观点来自网友，仅为作者个人研究意见，不代表韭研公社观点及立场，站内所有文章均不构成投资建议，请投资者注意风险，独立审慎决策。

云从科技

工分