登录注册
【东方计算机】多模态大模型近期进展不断,有望拉动AI产业进一步向上
股海鱼
明天一定赚的公社达人
2023-12-08 09:11:44

【东方计算机】多模态大模型近期进展不断,有望拉动AI产业进一步向上

近期Pika的出圈,以及谷歌Gemini 1.0效果全面超越GPT-4,以及国内众多厂商基于大模型推出各类应用,引发市场对AI板块的新一轮热情,我们继续看好AI板块接下来表现。
#大语言模型技术路径已收敛,而视频生成模型仍处于探索期

在OpenAI的技术方向引领下,目前语言模型的技术路径基本就是GPT这一条路。而多模态技术方面,目前没有一家公司处于绝对领先地位,技术路径仍存在探索的可能。AI视频的生成面临流畅性、帧生成逻辑、协调性等等问题,模型需要生成每一帧发生的事情,而用户的prompt往往非常简略,无法像图像生成一样为每一帧提供详细的描述,种种原因都导致了目前AI视频生成技术仍无法做到非常完美,技术路线也多种多样。
#多模态数据能够更真实反映物理世界属性,能感知真实物理世界的多模态模型应用前景更加广阔

语言作为一种精炼的表述载体,可以对物理世界进行抽象描述,例如文生图和文生视频中,用户都可以用简短的一句话或者几句话来对想要生成的图像或视频进行描述。但是从承载的信息量来讲,语言所能承载的信息是远远不及图像和视频的。而多模态的数据例如图像、视频、音频、振动等信息,则更加能反映出物理世界的真实属性,是真正对于物理世界状态的感知,与人类感知世界的方式更加接近。我们认为,未来的多模态模型将能够真正实现对世界状态的完整感知,也因此能具备更多的应用场景。
#多模态是生成式AI下一步重点方向,百花齐放的应用场景有望探索

现阶段大语言模型的竞争已经非常激烈,从技术突破的角度来看,我们认为,下一阶段的重点攻克方向必然会是多模态技术。能够真正处理和应用好多模态AI能力,才能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互。因此,基于多模态的应用场景仍需不断探索,AI视频生成仅仅是多模态技术路径中的一个小方向,多模态领域的ChatGPT时刻还未到来。
投资建议与投资标的

我们认为,在多模态模型应用场景上具备良好布局和卡位的公司值得关注。建议关注虹软科技、科大讯飞、万兴科技、中科创达、海康威视、大华股份、萤石网络等公司。
提示:以上内容来自于《Pika 1.0再掀AI视频热潮,多模态技术路径仍有探索空间》,请阅读风险提示等内容。
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
虹软科技
S
万兴科技
工分
0.40
转发
收藏
投诉
复制链接
分享到微信
有用 1
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据