➢2022年,从引爆AI作画领域的DALL-E 2、StableDiffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。
一、基础的生成算法模型不断突破创新
➢比如为人熟知的GAN、Transformer、扩散模型等,这些模型的性能、稳定性、生成内容质量等不断提升。得益于生成算法的进步,AIGC现在已经能够生成文字、代码、图像、语音、视频、3D物体等各种类型的内容和数据。
二、预训练模型,也即基础模型、大模型,引发了AIGC技术能力的质变。
➢AIGC 的大进步得益于底层预训练模型的进步,首先是认知智能(NLP 自然语言处)基于互联网公开的海量数据,可以做到无监督或者次监督学习,不需要人工打标;比如识别一只猫、一只狗,或者说这是一个名词还是动词等,都是通过机器自己的无监督学习,让模型 AI 有了基本的阅读理解、分类和分词的能力。
-图像生成比文本生成的进度稍微慢一些,还有一些细节问题待解决,比如人脸和手部的细节真实度等,脸部有扭曲或者六指这样的问题还有待去解决。
-相比较文本生成和图片生成这种背靠开源红利,视频生成目前还存在不少门槛,至少有两个问题需要解决,首先是 AI 需要能够识别图片中的内容,然后基于此做一些插帧,才能让生成的视频是一个比较真实连贯的视频。不过不管是视频,还是文本生成,对于输入长度都会有限制,几百字的文本还行,再长可控性难度就比较高了。
➢3D 内容生成是现在的游戏、动画以及未来的 AR/VR 场景下的痛点。
如果 3D 内容生成可用,将极大颠覆游戏、动画乃至未来世界的叙事方式,现在图片生成还是 2D ,要生成 3D是一个自由度更高的挑战,不仅要改变形状和呈现形式,还要考虑移动方式等,而到了视频时代,还要考虑不同的角度,以及光影等,难度更大,但也会更加震撼。未来或许可以直接输入文本生成 3D 内容,用一种human friendly 的方式去生成,也不需要很多工程师。
四、AIGC在消费互联网、产业互联网和社会价值领域持续产生变革性影响
五、ChatGPT
➢ChatGPT是OpenAI推出的新型AI聊天机器人,可以像和真人聊天一样解释各种问题,并且完成一些简单的写作任务。ChatGPT自发布后便获得了广泛关注:1)在发布短短5天后就累积了超过100万用户;2)微软将向OpenAI投资数十亿美元,并将迅速推进ChatGPT商业化,计划将其整合进Bing搜索引擎、Office全家桶、Azure云服务、Teams聊天程序等一系列产品中;3)“美版今日头条”BuzzFeed在宣布和OpenAI合作,未来将使用ChatGPT帮助其创作内容后股价2天累计涨幅超300%。
➢作为高效的AIGC文字内容生产工具,被认为将在智能客服、虚拟人、游戏等领域得到更大落地应用,也对很多算力、数据标注、自然语言处理等底层技术公司利好。
六、产业链
➢AIGC使得创作门槛大大降低,这意味着AI技术可触达的场景大幅延展。此前,由于成本原因,AI技术往往难以覆盖长尾市场,而社区化将使得这些市场能够通过“聚沙成塔”的方式得到触达;同时,相对于把AI技术集成在安防、智慧城市等大型项目中,新的商业模式也使得AI技术的价值更加显性。
➢下游应用场景的拓展与大模型的快速发展也将有力地推动行业上游发展,无论是算力还是数据标注的需求都将大幅增加。ChatGPT在参数规模上已经达到了千亿级别,对于AI大模型而言,不论是训练还是推理,对于算力等基础设施都有着极大的需求。
推荐标的
➢AIGC进一步推升算力需求,而AI/HPC对于算力的紧迫需求,对于光通信行业的影响,未来可能会体现在硅光/CPO的上量(考虑到功耗/大规模封装等),建议关注天孚通信等厂商。
➢AI技术领域领先的技术公司。建议关注:科大讯飞、海天瑞声、拓尔思、商汤、云从科技等
➢应用领域,建议关注:中文在线、掌阅科技、视觉中国、金山办公、昆仑万维、阅文集团、万兴科技、汉仪股份等。