登录注册
Openai Sora 详细解读!
轻点一支烟
奉旨割肉的剁手专业户
2024-02-17 08:40:14

1)效果:远超所有此前文生视频方案,几乎实现了两个代际的提升,接近消费者/工业生产需要。60S的内容长度远超此前文生视频的10S长度,达到了短视频的爆款长度;极度稳定的镜头;模型不仅理解用户在提示中要求的内容,还理解这些东西在物理世界中的存在方式,实现不少物理交互(不仅可以生成完整流畅的走路和划船,甚至可以生成非常真实的猫踩睡觉的人,船在波涛里旋转的接近物理世界镜头),其它握手拥抱这些还不太行。2)能力提升根源:白皮书还没发,OpenAI认为Sora作为Diffusion模型能力提升的很大来自于,更多的视频(甚至可能有3D)作为训练集、准确深入的语言理解能力、世界构造能力。从研究人员来看,真正研发Sora的人员仅有三人,其它均为支持性工作,我觉得大幅提升可能主要来自于三方面:

Diffusion-Transformer架构
可能通过UE5、Unity、Nerf等大量生成了合成数据作为训练集大语言模型的能力提升(OpenAI说了正在教AI理解和模拟运动中的物理世界,目标是训练能帮助人们解决需要真实世界交互的问题的模型)3)目前商业化进度:OpenAI尚未公开开放Sora权限,表示Sora目前仅为研究项目的开始,CEO Altman在Twitter邀请留言生成视频展示能力,并表示OpenAI已经在和安全测试机构、电影和视频创作者合作,以改进产品。我觉得6个月内就会商业化和GA。4)未来市场展望:2千亿美金的短视频市场、3D、游戏、商业拍摄、特效、IP转化等内容创作工作流,都有望被颠覆,可以增强用户体验、极大降低用户使用壁垒、极大降低创作成本、并极大拓展创作者能力边界。看到了下一个亿级用户超级应用的雏形。

作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
科大讯飞
工分
20.76
转发
收藏
投诉
复制链接
分享到微信
有用 15
打赏作者
无用
真知无价,用钱说话
1个人打赏
同时转发
评论(4)
只看楼主
热度排序
最新发布
最新互动
  • 加油奥利给
    下海干活的韭菜种子
    只看TA
    02-18 18:03
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    02-19 08:11
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    02-17 16:23
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 韭久为功
    蜜汁自信的老韭菜
    只看TA
    02-17 09:36
    谢谢分享!
    0
    0
    打赏
    回复
    投诉
  • 1
前往