登录注册
OpenAI发布扩展视频生成模型Sora,算力基建加速
金融民工1990
长线持有
2024-02-19 21:45:05

会议要点

1. AI视频生成新篇章

OpenAI推出了新模型sora,其引人注目的点主要在于它能够基于自然语言输入,生成时长大约一分钟且连贯性强的角色和背景视频。尽管在模拟一些具有物理变化的物体时,还存在一些问题,但整体上,它在视频剪辑和扩充等方面具备了非常强的能力,其性能明显优于其他模型。

sora模型的核心创新在于,它将视频中的每一帧图像视为一连串的标记进行训练,这让模型能够根据输入,生成高质量的视频。

OpenAI的技术报告中,他们考虑将扩展视频生成模型作为构建通用物理世界模拟器的一条有前景的方法,即便在模拟完整物理世界上还面临一些挑战,但OpenAI看好其发展潜力并坚决推进。

2. OpenAI宣布投资7万亿,AI算力基建瞩目

AI算力基建:OpenAI表示将进行大规模AI算力基础建设投资,涵盖芯片制造能力、set能源、数据中心等,其预计投资总额达到7万亿美金,并且可能趋向大幅度超过当前市场的供给量。

芯片制造:既然公司根据目前的芯片制造成本,7万亿美金大致可以建立出月产10万片的3纳米工艺的芯片工厂,且能够产出的GPU数量大约有3亿颗,所以这一投资可能会显著提升全球GPU的生产,此生产能力与目前相比有将近50倍的增长。

影响:通过这一投资,GPU的供应量大幅增长,将会满足AI、自动驾驶和机器人等领域的需求。OpenAI的又一次超前的投资决策有力地推动了泛人工智能(AGI)的方法论进程。

3. OpenAI视频模型Sora解析

AGI方法论过程中,重要的基础原则包括:强大的算力,足够大的模型以及参数量,以及大量的数据。这三个要素都对于模型的发展和训练效果具有关键性影响。

模型的效果与数据量呈现关联性,即数据量越多,效果越好。一旦选择了一个良好且通用的数据表示,数据标注,以及算法,模型的训练效果会随着数据的增多、模型的增大而变好。

模型在算力不断增加、数据不断多样化、模型不断扩大的条件下,其效果的提升是可以预测的。针对此,OpenAI在设计模型时即使知道当前的参数量、规模、算力不够,也可以预测随着这些要素的增加,模型的效果在达到一定规模之后会变好。

4. AI算力基建崭新机遇,投资市场待反弹

嘉宾认为AI技术尚处于早期阶段,其应用在生产或生活中并未广泛融入,使用上存在限制。但此背景下,算力需求却较大,对AI或AI算力基建有巨大的产业投资机会。尽管当前产业状态,投资机会仍然巨大。

嘉宾提到,市场行情方面,一月份市场表现疲软。许多公司股价跌幅在50%以上,即便节前有反弹,跌幅仍在50%左右。嘉宾看好两个方向:一是AI算力基建这条线,二是一些超跌股的反弹机会

嘉宾提到,今后半年,基于AI算力基建和市场行情的角度,头部企业,如光模块的AI的服务器代工,及国产深层链公司,都将有优秀的投资机会。同时,由于交易结构的变化,一些在短时间内跌幅超过50%以上的公司可能出现交易性反弹机会。

会议实录

1. AI视频生成新篇章

大家好,我是苏迪,欢迎参加今晚的交流会议。今天我们主要讨论春节假期里发生的两项海外重要事件,一是OpenAI发布了视频生成模型Sora,这无疑会对整个行业带来一些改变;二是我们收到了Otterman在春节期间筹集约7万亿美元资金建设AI算力基础设施的消息。这两事件都有一定的代表性。

 

首先,关于Sora模型,大部分的官方信息来源于OpenAI的官网和他们公开给市场的技术报告,而部分信息来自推特上的相关回复和一些视频。Sora模型所能引起的广泛社会讨论,都是因为其出色的纹身图效果。在技术报告中,他们强调了一些重要的观点。对于Sora模型的效果,简单概括就是:它可以通过自然语言输入生成长达一分钟的连贯人物和背景。即使镜头切换不同角度,画面的表达也能保持一致。在这方面,Sora展现出了强大的能力。但是这个模型是否能准确的生成内容,如根据小说的一段文字生成场景,可能需要进一步迭代以得出结论。

 

Sora模型的创新之处在于其排线处理方式,将每一帧画面按时间轴切割,切成一块块的小片段,将这些统一为排序概念去进行训练。整个架构采用了“扩散”和“诠释”这两种模型的结合。基本上,这个模型的优秀表现是因为它对大量、高质量的标注,以及某些灵活编码方式的有效利用。根据他们的技术报告,Sora模型的核心创新主要体现在其处理视频输入方法,即把各个源文件的视频统一进行排序,作为诠释模型的token去进行训练。这种方式让Sora模型的效果,比其它模型具备更强的视觉冲击力。

 

OpenAI的目标不仅是制作视频生成模型,而是打造一个全球系统模拟器。他们认为,扩展视频生成模型是建立通用物理世界模拟器的一条有前景的途径。但是目前Sora模型还有一些问题,它在模拟某些特定场景时仍然存在着错误,如模拟玻璃破碎和流体动作存在很多bug,一些物体的物理变化也没有被完整表达出来。但这同样也论证了扩展视频模型构建物理世界(或数字世界)模拟器的可能性。

 

2. OpenAI宣布投资7万亿,AI算力基建瞩目

这个我认为至关重要,是关于收入模型的基础介绍。众所周知,最近大家都在讨论关于OpenAI发布的扩展视频生成模型Sora,下面我简单讲解一遍。其次,公司表示他们想要扩张AI的算力基础建设,这包括了像芯片的制造能力,可再生能源,以及数据中心,都是AI基础设施的一部分。这个基础建设,他们计划投入7万亿美金,这是一个相比于现在这个体量来讲很庞大的数字。这个7万亿美金代表了多少的量?我们可以简单算一下,7万亿美金如果用于发展AI基础建设,最直接的支出是建厂和购买GPU。

 

台积电的数据显示,建设一个月产10万片的3纳米级别的生产线,成本大概在300到400亿美金,以400亿美金计算。而在GPU的成本占比上,大约占40%到50%,因为还有其他的HPM等成本没有计算在内,所以如果我们用这7万亿,计入配套资金,大约可以建设一个月产10万片的3纳米级别的生产线,总投入在700亿美金左右。考虑到某些配套情况,这个数据大约能产生30颗GPU的良品率,算下来,这个生产线每年可以产出大约300万颗GPU。

 

另一种计算方式更加简单。按照当前市场售价,H100芯片大概三四万块美金一颗,然后用7万亿美金除以3万美金一颗,就得到了2.5亿颗H100芯片。不管是自建生产线还是直接购买H100芯片,7万亿美金可以产生的GPU大概在2.5亿颗左右。目前的全球GPU供给大约是400万颗,可能会有点浮动。因此,奥特曼给出的7万亿美金的投资,可以使得GPU的供给扩大近50倍。

 

这个数据是怎么来的,可能没有准确的推断,但这个数量级和倍数毫无疑问。奥特曼的7万亿美金,对应到2.5亿颗GPU,比现在的供应量多了50倍。我们需要思考的是,为什么OpenAI能在GPT发布之后,又在视频生成模型Sora中领先其它公司这么多步?这可能因为OpenAI在AGI方法论过程中,验证了三个基本公理,这也是我最想和大家分享的。而OpenAI在Sora中的成功,更加验证了这三个公理。

 

3. OpenAI视频模型Sora解析

首先,AGI(人工通用智能)扮演了极为重要的角色在这个过程中,它为我们理解未来模型的发展方向提供了基本原理。在这个方法论过程中,我们参考了知乎博主SIY点Z的一篇回答,我们认为这篇回答涵盖了重要且精准的观点。

 

基本上,对于研究AI的人来说,目前的理论认为:所有的奇技淫巧都比不过强大的算力和庞大的数据。对于这个理论,典型的例子是进行一个简单的加法计算,比如我们用首项加尾项乘以项数除以2的公式计算100个有规律的数的和,但对于计算机来说,直接将这100个数相加就可以了。因此,在AI领域,如果一个模型构建过程中混杂了太多的特异性或者人为因素,其拓展性可能会受到限制。相比之下,更容易发展和实践的模式通常包括三个最基本的因素:足够大的参数量,足够大的模型,以及足够大的算力,这可能是大型模型发展最关键的一方面。

 

第二个公理,或者我们可以称之为skin诺模式,它表明,如果模型参数不再增加,其表现和数据量呈正相关。一旦我们选择了一个良好且通用的数据表示,并且良好地标注了数据,采用合适的算法,我们便可以发现一个通用的规律。随着数据和模型的增多,模型的效果就会逐渐提高。

 

那我们回观Sora这个模型,比较一个年前生成的数据,以及现在生成的一些优质视频,就可以了解此公理的意义。在模型初始搭建时,由于数据不足和训练量不足,效果并不理想。但是,随着算力不断增加,数据持续积累,模型不断扩大,训练效果预计会持续改善。OpenAI在搭建模型的初期,即便模型参数量和算力不够,他们已经可以预见到,随着数据模型和支撑技术的持续增强,整个模型的性能会逐步提高,数据量达到一定规模后,模型的表现会有明显的改善。

 

这正是这个模型的可预测性,也是AGI理论支配下的涌现性。一旦数据量增大至一定程度,系统可能会产生质变,生成的结果会与原状态有本质的改变。对比GPT-3和现在的GPT-4,这种有限性和涌现性表现得尤为明显。

 

总结来说,不论是OpenAI的GPT系列文字模型,还是他们新推出的Sora模型,他们从始至终都坚持一个理念,那就是通过增加数据量和算力,用通用的模型实现AI的世界链路。这种理念是有充分验证的,这也是我们对Sora模型充满期待的重要理由。我们相信,只要给这些模型注入足够的算力、足够多的数据和参数,模型的实现效果或者智能程度会明显提升,甚至可能达到我们无法预见的效果阶段。

 

因此,无论是自然语言处理,还是视频生成,或者未来构建一个世界模型,决定这一切的关键在于:增加数据量,增加模型参数,并提高算力。通过Sora模型我们可以看到,AI的未来发展,仍然将沿着加数据,加模型参数,增加算力的道路前进。无论如何发展,我们都可以看到,当前的算力仍然远远不够。

 

4. AI算力基建崭新机遇,投资市场待反弹

我们现在来探讨AI技术的发展现状。相对来说,这仍然是一个早期阶段,AI技术并未真正融入到人们的生产生活中。以ChatGPT等为例,它们的使用仍然存在着许多限制。因此,对于算力的需求我们认为还是非常大的。就算在当前的科技发展线,我们仍然看好AI和算力基建这条线,我们坚信即便在当前的位置和产业状态,仍存在非常大的投资机会。这是关于今天OpenAI发布扩展视频生成模型Sora的主要报告。

 

接下来,让我们回顾一下市场的一些动态。整个一月份,市场表现不佳,无论从行业基本面的变化或者大家对未来的预期变化来看,许多公司的股价在一月份都有较大幅度的下滑。年初至今,虽然中间有一个较长的假期,但许多公司的股价跌幅在50%以上,甚至达到60%多。即使在节前一两天,反弹了十几个点,20个点之后,跌幅仍在50%附近。因此,对于未来的市场动向,我们主要看好两个方向。

 

第一个是AI和算力基建这条线。在整个假期中,这方面的催化因素颇多,关注度较高。包括如各种AI模型的实际效果,以及OpenAI自己的7万亿美元的规划,对此产业的影响都具有正向催化作用。因此,从产业趋势来看,我们认为AI算力基建的发展前景十分看好。二三年来全线有大量研究、产业变革,基本每个核心环节的同步企业市场都充分挖掘过。因此,我们认为在经过长达半年的调整后,市场已经选出的头部企业,包括AI代工模块,以及一些国产的深层链公司等,都有良好的投资机会。

 

第二个方向是那些在一月份股价下跌50%到60%的公司。这些公司,在交易结构修正后,可能会有一些交易性的反弹机会。因此,农历新年后,我们看好的两个方向是:一是AI的算力基建这条产业链,二是一些超跌的,跌幅百分之五六十以上的公司的反弹机会。


作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
HMVOD视频
工分
8.08
转发
收藏
投诉
复制链接
分享到微信
有用 6
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(3)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    02-20 21:42
    算力自主可控!
    0
    0
    打赏
    回复
    投诉
  • 加油奥利给
    下海干活的韭菜种子
    只看TA
    02-20 21:35
    0
    0
    打赏
    回复
    投诉
  • 离离原上草
    不要怂的老韭菜
    只看TA
    02-20 19:05
    感谢
    0
    0
    打赏
    回复
    投诉
  • 1
前往