登录注册
AI ChatGPT详解
剑阙
2023-02-16 11:34:58

 ChatGPT 专家 1. ChatGPT算力、研发、进展情况• 初始是谷歌做的transformer。

ChatGPT一代就有40几亿个参数。

参数可以理解为深度学习的时候讲到的神经网络,一层有1000个节点,节点互联,是1兆个参数。

ChatGPT是1750亿个参数。

我们实验中做过的最大的模型是10亿个参数,所以大概是我们的175倍。

• Transformer核心就是用大量的语料进行训练,做出理解力很强的AI。

语言理解力是我们长期攻克的难题。

中文是最难的,首先要做断句分词、根据上下文研究语法模型。

但从Transformer开始,不需要做断句分词,所有都从语料库来,实现理解。

统一了所有语言的学习方法。

• OpenAI从1代到3代,模型不断放大,从43亿到1750亿。

网络复杂度是几何级数的增加,我们估算是2-3次方之间。

• 不能光看参数大小,参数很多,但是节点互联很简单也没有意义。

算力投入一方面是规模,另一方面是迭代次数和时间。

• chatGPT此次是用了5000块A100,每块节点是8块A100全互联。

美国对我们禁运的首先就是A100。

用NV link进行互传。

如果不用NV link的话只能用CPU,传输时间会变长。

国内不会很快追上open AI 的算力投入。

• 截止到2021年底:因为新知识可能会产生矛盾,出现之后需要人为处理。

知识还需要进行重新校验的,所以不能接入在线数据。

2. 中国的ChatGPT有哪些瓶颈• 从处理器的角度,我们有很多可以支持计算的处理器,例如海光、飞腾、寒武纪等。

最大的问题是做不了高制成,只能做到28nm,28nm会导致芯片密度低,能耗更高。

导致NVIDIA一块卡我们要用2-3块。

• 第二个问题是互联,有一些机器的互联可以,例如飞腾等,但是有产能问题。

缺乏NV link的互联设备,我们在做大语言模型的时候问题就很大。

• 海光有不到3000块的A100。

• ChatGPT能够做到99.9几的理解能力,我们如果降低要求到97-98之间,阿里京东百度等自身的算力就可以在1-1.5年内做到这个水平。

短时间追上openAI是很困难的。

微软的投入不光是钱,更多是云计算的基础设施,例如5000块的A100,按照市价,算力投入在3000万。

但如果降低要求,现在相关领域做应用的话还是有机会的。

• 瓶颈最主要的还是在数据交换上,如果互联不好的话,5000块卡和100块卡的效果是一样的。

3. 商业应用价值• 国外很快就会淘汰数据程序员,可能会淘汰一半,交一部分的工作给chatGPT。

• 国内程序员供应量多,如果用chatGPT取代反而成本会更多。

但另一方面,国内有些行业,例如3D建模的人才,我们目前是缺乏的,3D建模本身门槛不高,但没有办法跟机器比速度。

CG图片、特效成本可能会迅速降低。

另一个就是销售客服。

现在很多地方都是机器客服为主,国内做外贸的很多公司都需要英语销售客服,但他们跟外商的交流很不畅通,如果换成chatGPT,可以看到工厂的实时库存、帮助下订单。

ChatGPT计费标准来说,这样的替代也是很便宜的。

4. 中美竞争• 如果看大模型的话,中美的差距有可能会拉大。

AI模型、芯片产业链都需要投入。

• 如果降低NLP的理解能力,不影响后续工作的话,也是一个方向。

5. 数据分工• 国内主要问题在于复制性的内容太多,国外相对而言能够找到一些权威的语料。

这是中文和英语的最大差别。

权威就是可以告诉机器,从nature science上面找到的文章,权威值就是99%,我们在万方知网上面能够找到的权威数据有限,这些论文发了中文也都会发英文,我们是比较吃亏的。

中文语料训练上没有问题,但是在知识质量上我们会低一些。

• 微软数据标注团队质量很高,我们的劣势:有劣势但是不大。

人工标注的话不会具体到每一篇文章,只会是标注刊物、高引的文章等。

例如知乎的高赞文章是不是高质量的需要人为来进行鉴定。

6. 确权的问题• ChatGPT的创作思路跟我们所说的洗稿很像,据说openAI会给以后生成的文章里面打技术性水印。

• 少数作者会启动防止被引用的开关,大部分作者不会启动。

• New bing会生成来源。

• 175G的参数需要1T的内存才可以运行,开源是不太可能的。

7. 审核• 现在是基于关键字和简单语义识别。

但如果变成80%的ChatGPT水平,发出违规文字的可能性就没有了。

8. 公司竞争力• 做类似chatGPT需要几个元素:1)语料。

自有平台或者爬取网页。

微信有公众号朋友圈,百度是爬取,京东是产品和用户咨询评价,相对比较少。

360和腾讯有搜索引擎,应该还在爬取。

自有平台大一点就是知乎、腾讯、网络小说、门户网站等;2)算力。

一个是看自有平台的CPU和GPU,现在比较强的是阿里腾讯,都有GPU的云。

地方的数据超算中心都有一定的算力资源;3)钱。

openAI拿到了很多投资。

4)人。

• 京东淘宝可能需要的是智能客服。

百度可能需要的是自动驾驶和AI 的联动。

腾讯可能就是游戏的开发。

9. 搜索成本• 谷歌的首次搜索的成本高,但是重复搜索的单次成本不高。

谷歌主要成本是不断爬取数据的成本。

• 如果放到搜索引擎上,直接的问题就是广告放在哪里。

• 搜索引擎市占率低的公司可以通过chatGPT来抢市场,但是市占率高的公司如果运用的话会把最赚钱的广告业务挤掉。

10. AI方向• 国内可能会在3D建模、网络小说方面发展。

下游的游戏影视也会有变化。

声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
昆仑万维
S
天娱数科
S
海天瑞声
S
科大讯飞
工分
1.33
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-02-16 12:27
    挺好的
    0
    0
    打赏
    回复
    投诉
  • 1
前往