💐12页深度,6大预期差。一文看懂看透跨模态基础技术
💐近期巨头加码,更多应用可能性。google展示除文生图外,人机互动、图片搜索等。微软可能本周发布跨模态的GPT-4。
💐国内AI大模型相比美国落后很多吗?
跨模态差距小。百度、华为、腾讯、商汤等都CV跨模态大模型。
💐跨模态比纯语言大模型更难吗?
不一定。跨模态降低语言单点技术难度,对视觉特征提取和数据融合有要求,这是国内AI公司擅长的。
💐改变语言大模型的transformer没办法用在视觉/跨模态上?
并不是。出现了新方法论,CV大模型参数也到百亿规模了
💐核心建议关注
💎视频、图像、文本素材:大华股份(2月底独家!)、海天瑞声、AI领军、当虹
💎算力和基础:中科曙光、拓维信息等
💎多模态应用:1)文生图:新国都(2月底推)、创达;2)机器人:三花智控等;3)其他应用:汤姆猫(传媒)、万兴、昆仑万维(传媒)、风语筑(传媒)。
💎视觉和跨模态算法:商汤(港股)、云从、虹软、科大讯飞