近日,阿里达摩院低调地在魔搭社区(ModelScope)放出了“文本生成视频大模型”。
据了解。目前文本生成视频大模型,由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。
阿里巴巴达摩院多模态对话专利公布:可丰富人机对话方式
摘要显示,本公开涉及一种多模态对话方法、装置、设备及存储介质。本公开通过获取与同一问题关联的多模态信息,对所述多模态信息进行意图识别,得到意图信息,并对所述多模态信息进行槽位识别,得到一个或多个槽位值。阿里大模型(达摩院)概念股
创业黑马 (300688):旗下数智云科与达摩院合作将基于达摩院AI开源社区“魔搭社区”;
南威软件(603636):公司联合阿里达摩院持续深化具有视频图像AI中台建设;
天源迪科 (300047):阿里云生态合作伙伴,近期公司与达摩院合作开发“疫情智能助理机器人”;
易点天下 (301171):公司很早已经在人工智能领域进行探索和布局,合作方包括阿里达摩院;
千方科技 (002373):阿里入股更多体现在技术赋能(达摩院)与数据赋能(高德);
蓝色光标 (300058):与达摩院基于达摩院虚拟直播解决方案的战略合作;
万东医疗 (600055):万里云与阿里达摩院在影像AI技术方面一直保持着良好的合作关系;
卫宁健康 (300253):与达摩院合作研发新冠肺炎云端AI辅诊助手等;