登录注册
中信证券:Sora的突破性登场预示AI大模型的快速进化,三大投资趋势值得关注
薛定谔的奶牛猫
无师自通的半棵韭菜
2024-02-23 14:55:40
中信证券最新研究报告指出,Sora的惊艳亮相象征着AI大模型领域正在经历一个高速的迭代与升级时期,特别是在泛化能力和特化应用两方面都实现了显著的进步。OpenAI通过推出这一行业革命性的新产品——Sora,再次证明了自己的创新力。Sora作为当前文生视频技术中的最佳模型,无论是在视频时长、分镜头设计、物理引擎运用、视频格式兼容性,还是在语义理解能力上,都明显超越了市场上的其他同类产品。

随着对未来行业发展方向的预测,中信证券认为,Sora的成功再次展现了AI大模型领域的规模效应和算力作为AIGC行业发展基石的重要性。特别是以AI芯片为中心的算力产业链,预计将继续保持其增长潜力。此外,报告预测Sora很可能首先在短视频领域得到广泛应用。鉴于短视频的典型长度不超过60秒,Sora的高效内容生成能力与短视频的需求和场景高度匹配,这将极大地提高内容创作的效率并降低门槛。同时,随着Sora等AI工具的普及,大众制作高质量AI合成视频的难度将大幅降低,但这也意味着AIGC内容滥用的风险可能会进一步加剧。因此,中信证券强调了加强AIGC内容监管的紧迫性。

基于这些观察和分析,报告梳理出三大投资主线供投资者参考:1) 由于算力产业链持续高景气而受益的硬件支持领域;2) 随AI大模型技术升级而受益的AI应用领域;3) 随AIGC内容滥用风险增大而产生的AI监管需求。

中信证券最新分析

OpenAI最近推出的Sora模型为文生视频领域带来了革命性的进步,标志着AIGC技术的一次重大突破。根据OpenAI提供的信息,Sora能够创造出长达一分钟的高清视频,并已开始掌握对现实世界物理规律的模拟。自2023年以来,无论是文本、图像还是视频生成,AIGC领域都经历了飞跃发展。中信证券认为,Sora目前是文生视频技术中的领先模型,无论在视频持续时间、场景布局、物理模拟、视频格式兼容性,还是语义理解能力上,Sora都明显胜过了市场上其他同类产品:

在视频持续时间方面,相较于其它模型如Pika和Gen-2video分别只能生成3秒和4秒视频的能力,Sora能够在相同提示下生成接近一分钟的视频内容。

在场景布局设计方面,中信证券评估Sora拥有接近人类的创作能力,能够直接产出包含多角色、多场景和动态摄像头移动的视频内容。

关于物理模拟能力,从OpenAI官方发布的样例来看,Sora已经能够模拟现实世界的物理运动,特别是在物体纹理和运动轨迹的模拟上超越了其他同类产品。

在视频格式的支持上,Sora展示了较高的灵活性,支持从宽屏1920x1080p到竖屏1080x1920以及这两者之间所有格式的视频,增强了其适用性。

在语义理解方面,Sora展现出对提示词更深层的理解,能够精准捕捉用户的意图,并在视频的不同画面中维持一致的视觉风格和逻辑连贯性。

通过整合多种技术手段,OpenAI正引领着AIGC技术的全面升级。

OpenAI在推进AIGC领域的创新上不遗余力,其最新力作Sora的问世标志着公司将在文本和图像生成技术上的先进成就成功扩展至视频生成领域。根据OpenAI提供的资料,公司采纳了包括时空补丁和扩散转换器在内的先进技术,实现了将多种视觉数据统一编码,为生成式模型提供大规模训练的可能,并能生产出各种时长、比例和分辨率的视频与图像。此外,Sora集成了DALL.E3和GPT等技术,利用DALL.E3中的重新描述(re-captioning)技术对视频进行高度描述性的转译训练,显著提升了文本的真实性和视频的整体质量。通过GPT技术,OpenAI将用户的简短提示转化成详细的转译,使得Sora能够根据用户的具体指示产生高质量视频。

在AI大模型的研发过程中,规模效应依然显著,算力的重要性不减。AI模型展现出一种“突变能力”,即在训练量达到一定阈值后,模型的准确性会急剧提升。Sora的开发团队观察到,扩散转换器技术在视频生成方面展现出极大潜力。随训练量增加,即使是相同输入和种子下,视频样本的质量也会明显提升。这一发现再次验证了在当前AI技术架构下,规模化训练是提升模型性能的有效方法之一,算力成为提高训练规模和进一步升级AI模型性能的关键。因此,随着AIGC技术的进步,AI大模型正沿着泛化和特化两个方向发展,预计顶尖科技公司将继续在“算力竞赛”中争先恐后,推动AI模型能力的持续提升,以AI芯片为中心的算力产业链的发展潜力巨大。预计在未来,特别是到2025年,文生视频技术将首先在短视频领域得到应用,预估市场潜力可达80亿元人民币。

中信证券的分析还显示,OpenAI的Sora模型凭借其卓越的理解能力和视频生成技术,开辟了创作新领域,预计将推动文生视频技术在多个行业的广泛应用。特别是在短视频领域,Sora的高效内容生成能力完美契合当前市场对60秒及以下视频内容的需求,预期将极大提升内容创作的效率和降低入门门槛。目前,中国的短视频市场正处于迅猛发展之中,据《2023年中国网络视听发展研究报告》(由中国互联网络信息中心发布)显示,2022年短视频市场规模已接近3000亿元人民币。假设视频创作成本占市场总规模的10%,并在AI视频应用渗透率为5%-35%的情况下,预测2025年国内文生视频技术在短视频领域的潜在市场规模中值将达到80亿元人民币。

随着Sora技术的普及,AI合成高质量视频变得更加容易,这也带来了AIGC内容滥用的风险,如生成包含有害内容或不实信息的文本、图片和视频等,对个人、组织和社会构成了新的挑战。量子位智库的预测表明,到2030年,中国AIGC市场规模有望达到11491亿元人民币。通常,信息化建设中安全投入占比在5%-10%。鉴于AI大模型的特性,AI安全投入将覆盖数据标注、模型训练、内容生成到应用开发的全过程,预计占比较高。基于此,中信证券预估,如果将AIGC监管成本占产业链总成本的5%-10%,那么到2030年,中国AIGC监管市场规模可能达到575亿元至1149亿元人民币。

潜在风险因素

Sora以及其他文生视频技术的商业化步伐可能落后于预期;实际应用中,Sora及类似模型的用户体验可能不达标;算力资源的成本优化可能未能达到预期水平;政府政策的进一步严格监管;在该领域内的竞争愈发激烈;对AI相关监管措施的发展速度未能满足预期;以及地缘政治局势的不确定性可能带来的风险。

对未来的展望

尽管面临上述潜在风险,但文生视频技术,特别是像Sora这样的先进模型,预计将继续推动媒体和娱乐行业的革命,为创作者提供前所未有的创作自由和效率。随着技术的进一步成熟和成本的逐渐降低,预计这些模型将在教育、营销、游戏设计等更广泛的领域找到应用。此外,随着算力技术的发展和政策框架的逐步完善,长期来看,文生视频技术的商业化前景和社会影响力仍具有巨大潜力。未来,通过持续的创新和合作,我们有理由期待这一领域将克服当前的挑战,实现更加广泛和深入的市场渗透。
作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
中兴通讯
S
中国移动
S
中国联通
S
中科曙光
S
中国电信
工分
1.65
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据