国外大模型训练已经不用文本数据了,因为文本数据可训练差不多达到了顶峰,但是国内还没有因此还在用文本数据训练,这就是为啥出版公司能继续涨内在逻辑。国外公司因为多模态关系开始使用非文本数据训练,比如图片视频数据。国内下一站应该也会用这些数据,广电系这个传媒属于这波滞胀版块,因此今天会炒作。
目前广电系实锤的有非文本数据训练业务的是华数传媒,政府把一些政府独有的数据拿给它,然后它再把这些数据出售给阿里百度之类的大模型公司。
此外视频数据训练的话预期差非常大的是捷成股份,应该是拥有行业里面最多的视频一个公司,如果还有别的请老师们指导。谢谢啦!
S华数传媒(sz000156)SS捷成股份(sz300182)SS歌华有线(sh600037)S