事件:北京时间2月16日凌晨,Open AI发布旗下首个文生视频模型Sora。Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,对语言有深刻理解,能够准确领会用户的提示。
Open AI发布首个文生视频模型Sora。Sora是基于difussion扩散的transformer 模型,凭借其强大的通用视觉数据处理,可以生成跨越不同持续时间、纵横比和分辨率的图像视频,最多可以连续生成60秒(一分钟)的高清视频。Sora是Open AI在GPT-4及DALL-E等语言和图像模型的基础上进一步的创新突破,该模型能够从类似于静态噪音的视频开始,逐渐去除噪音生成视频。此外,该模型能够生成包含多个角色、特定类型运动和主体及背景精确细节的复杂场景,能在单个生成的视频中创建多个镜头,使角色和视觉风格保持准确一致。
AIGC应用之视频生成的思维导图