登录注册
【元宇宙建设添利器 Meta强推视觉大模型 多模态AI有望加速发展
降龙罗汉㊙️暴力龙头
孤独求败的大户
2023-04-21 13:09:01

【元宇宙建设添利器 Meta强推视觉大模型 多模态AI有望加速发展】在AI大模型竞赛中,Meta选择重押视觉模型,继推出零样本分割一切的SAM后,扎克伯格亲自官宣了重量级开源项目DINOv2。据介绍,DINOv2是计算机视觉领域的预训练大模型,模型参数量是10亿级,采用Transformer架构,能在语义分割、图像检索和深度估计等方面实现自监督训练,不需微调即可用于多种下游任务,可以被用于改善医学成像、粮食作物生长、地图绘制等。DINOv2可以为大语言模型提供丰富的图像特征,有助于完善多模态GPT应用;其蒸馏成小模型后效果依然优秀,便于在各种边缘场景及本地化落地。Meta已表示计划将DINOv2集成到更大、更复杂的AI系统中,作为视觉主干提供丰富的图像特征与大型语言模型进行交互。国盛证券分析师刘高畅表示,DINOv2能比用图像文本对做训练的模型得到更丰富的图像特征,这将让整个系统能更好地理解图像,对多模态AI的发展起到加速作用。值得注意的是,多模态技术还能助力游戏内容与元宇宙构造,随着AR/VR技术的发展,未来将能构建逼真的虚拟现实。扎克伯格就强调,DINOv2可以极大地加持元宇宙的建设,让用户在元宇宙中的沉浸体验更出色。上述分析师大胆预测,1-5年内,随着多模态的发展带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。未来5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
科蓝软件
工分
2.69
转发
收藏
投诉
复制链接
分享到微信
有用 1
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据