OpenAI经过一天发酵后,今天有了更多讨论,本篇更新几个Sora新生成的视频,及补充一些增量信息。
1、新视频(略)
目前Sora还没有向C端开放,但是OpenAI CEO Altman 在X上回应一些用户诉求,用Sora生成不少新视频。
这里发不了视频,感兴趣可以去隔壁“林不再的选股思路”看。
2、增量信息
news
Sora技术文档已经公开,网上有很多翻译版本。但OpenAI 拒绝公开更多细节,包括用什么语料训练,声称是“竞争原因”。
有人猜测使用视频游戏引擎中生成的合成视频数据。英伟达的Jim Fan 博士是使用合成数据训练人工智能的专家,他在 X 上写:“如果 Sora 使用虚幻引擎 5 接受大量合成数据的训练,我不会感到惊讶。一定是这样!”
OpenAI已经向红队以及选定的视觉艺术家、设计师和电影制作人开放Sora权限。红队人员主要是错误信息、仇恨内容和偏见等领域的领域专家,将以对抗性方式测试该模型。另外,OpenAI说,“我们还在构建工具来帮助检测误导性内容,例如检测分类器,可以判断 Sora 何时生成视频。”
DEX Screener 上已经有了名为Sora的Meme Coin(基于社交媒体和互联网文化的数字货币) 。
说到利好谁,之前认为利好算力,现在认为利好CPO。
评价
X上有人将一年前做的AI视频(左)和Sora视频(右)做对比,明显看到左侧人脸变形了,右侧精细度和颗粒感完胜。
还有一个小狗对比视频(Sora vs Pika vs Runway),均是相同提示语,“一窝金毛小狗在雪地里玩耍。他们的头从雪中探出头来,被雪覆盖。"
AI文生视频企业Runway联合创始人兼CEO Cristóbal Valenzuela,“一年的进展现在只需几个月即可实现。几个月的进展将在几天内开始发生。几天的进展很快就会在几个小时内开始发生。”
The Verge 的Tom Warren,“这可能是人工智能的‘神圣’时刻。”
国外媒体的兴奋让人想起2022 年围绕图像创作者DALL-E或 ChatGPT 的讨论:Sora 被描述为“令人瞠目结舌”、“改变世界”和“令人惊叹,但又令人恐惧”。(“eye-popping,” “world-changing,” and “breathtaking, yet terrifying.)
Sora 不仅有可能颠覆艺术和电影等行业,而且有可能彻底消灭它们。科技情报公司 ABI Research 高级分析师 Reece Hayden 认为,“对于营销或创意等职业来说,多模式可能会改变游戏规则,可以为电影和电视制作人节省大量成本,并且可能有助于人工智能生成内容的扩散,而不是使用演员。”
创意行业有人担心 Sora 和视频生成模型的兴起将影响他们的工作。“我从事电影视觉特效工作,几乎我认识的每个人都感到沮丧和沮丧,对现在该怎么办感到恐慌。”
大家讨论比较多的是安全问题,TruMedia.org 创始人奥伦·埃齐奥尼担忧可能影响到2024年选股——比如,如果拜登给新罕布什尔州选民的深度伪造电话是来自椭圆形办公室的逼真信息?
另外,Sora对银行业也有影响。身份验证公司iProov首席科学官 Andrew Newell 博士表示:“Sora将使恶意行为者更容易生成高质量的深度伪造视频,并为他们提供更大的灵活性来创建可用于攻击目的的视频。依赖视频身份验证安全措施的银行暴露的风险最大。
Arstechnica作者BENJ EDWARDS,“很快,你在网上看到的每个逼真视频都可能在各个方面都是百分之百虚假的。而且,你看到的每个历史视频也可能是假的。我们作为一个社会如何面对这一点,并在保持远程通信的信任的同时解决问题,远远超出了本文的范围……我将媒体中的真实与虚构变得难以区分的时刻称为‘文化奇点’看来 OpenAI 有望比我们预期早一点实现这一预测……如果信任社交媒体上匿名来源的视频以前是一个坏主意,那么现在更是一个更糟糕的主意。”
下面这些推有大几十万查看次数,还是能代表不少人看法。
最后,引用英伟达 Jim Fan 博士的话作为结尾:
“Sora 是 GPT-3 时刻。早在 2020 年,GPT-3 是一个相当糟糕的模型,需要大量的即时工程和照顾。但这是情境学习作为一种新兴属性的首次引人注目的展示。不要过于关注 GPT-3 的缺陷。考虑在不久的将来推断到 GPT-4。”
以上,感谢阅读,祝好!