【OpenAI带来视频生成模型开年王炸!】OpenAI在昨日凌晨再亮出大招,其发布了首个文生视频模型Sora。据OpenAI介绍,该人工智能系统可以快速制作长达一分钟的视频,这些视频可以呈现具有多个角色、特定类型的动作、以及主题和背景的准确细节的复杂场景。从公司官网上更新的48个视频demo来看,Sora不仅能准确呈现细节,还能生成具有丰富情感的角色。
2月17日消息,OpenAI据悉已经完成了一笔交易,这家人工智能公司的估值达到了800亿美元,在不到10个月的时间里,其估值增长了近两倍。
周鸿祎谈Sora重大影响:AGI很快就会实现,可能就这一两年的事[视频]_界面新闻
业内专家分析指出,具备文生视频功能的视频类生成式AI在领域,能够有效降低创作者的创作门槛。国海证券陈梦竹在11月8日研报中提到,据量子位发布的《AIGC/AI生成内容产业展望报告》,视频生成将成为近期跨模态生成领域的中高潜力场景,其背后逻辑是不同技术带来的主流内容形式的变化。英伟达高级科学家Jim Fan评论认为,2022年是影像之年,2023是声波之年,而2024是视频之年。
随海外OpenAI、谷歌等纷纷推出各自的文生视频模型,东方证券蒯剑等人在12月18日研报中提到,国内领先厂商已入局,其中,海康威视、大华股份、萤石网络等视频分析行业领先厂商纷纷投入到多模态大模型研究和行业应用落地进程。具体来看,海康威视现已处于多模态大模型的研发阶段,包括视觉、语音、文本等多模态信号的融合训练及处理。大华股份于23年10月发布“星汉大模型”,该模型融合点云、语音、图像等输入,构建了多模态融合的行业视觉大模型。值得一提的是,信雅达凭借“天才女儿”设立Pika的消息刺激曾在去年11月30日至12月7日录得6连板,公司表示,其已围绕图像识别、 AI 定制化建模等能力开展深入研究。
据财联社不完全统计,包括万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信、神思电子、因赛集团、拓尔思、国脉文化、佳都科技在内的超10家A股上市公司近三个月以来在互动平台披露视频生成模型领域的业务情况。其中,当虹科技1月5日互动平台表示,公司拥有自研的AIGC工具集,发布了以静态照片生成三维体积视频的方案,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩,实现不同模态之间相互切换。因赛集团旗下InsightGPT目前可生成20秒以上的视频,能够结合图像、视频大模型,融合抠图等多种算法,再结合音频模型,整体渲染后最终合成完整视频。