此外,Sora令人惊艳的连续光照,水体变化效果,很难不让人联想到游戏引擎:
水体效果,对比使用UE4制作的盗贼之海:
街景,尤其是地面反射,对比UE5街景建模:
以上这些,都说明Sora在训练过程中和物理引擎存在一定的关系。因为Sora的演示中,除了一定的物理学特性,物体的一致性保持非常稳定,仅通过二维的图像或者视频,很难训练出建模稳定的主体;那3D图像引擎的引入,就是有必要而且非常自然的选择了。
对应到A股,那就是两条线,一条是虚幻引擎,这个其实游戏公司在使用虚幻引擎上都有经验,当然具体到训练大模型的实操上能提供多少技术支持就是另一回事了;第二条就是自有引擎,自家的引擎必然是可以更好的理解和应用并帮助训练出效果更好的文生视频模型;
掌趣科技有丰富的虚幻引擎使用经验:
更牛逼的是,掌趣科技是A股唯一一家与国产引擎合作的公司,掌趣科技是Laya引擎的独家代理,如果图像引擎逻辑得到认可,掌趣科技将会是最受益的公司!
如果说2023年是大语言模型的爆发元年,语料库成为训练大语言模型核心要素之一;那在Sora发布的2024年,Sora有可能成为引爆多模态,文生视频的导火索,在这个过程中,图像引擎将会是其中最重要的一环!
当下市场的选择是更简单的降本增效逻辑,如果深入思考和挖掘的话,目前最核心、最值得布局的就是图像引擎这个方向,掌趣科技首当其冲。
让我们拭目以待!