登录注册
【国盛计算机】多模态GPT,朝着科幻前进
柴尔德
满仓搞的剁手专业户
2023-04-18 21:36:09

继零样本分割一切的SAM,Meta又迅速开源DINOv2模型,DEMO网址:https://dinov2.metademolab.com/

DINOv2 能产生高性能的视觉特征,用于不同下游视觉任务如分类、分割、图像检索和深度估计,不需要微调。
其创新点和优秀性能来源于使用图像自监督学习的方式训练,不需要图像和文本对应的训练数据,克服了文本对图像描述不够全面的局限性。

DINOv2蒸馏成小模型后效果依然优秀,能在大部分测试基准超过之前最好的模型OpenCLIP。Meta表示正计划将DINOv2集成到更大的人工智能系统中,提供丰富图像特征与大语言模型交互。


影响:1)不需要微调即可胜任玩成图生文前期任务,提升整个方案的泛化能力,为后续识别的泛化能力提高打下基础。

2)能蒸馏成小模型,便于在各种边缘场景及本地话落地。3)为大语言模型提供图像特征,加速多模态人工智能的发展。


朝着科幻前进。预计1~5年内,随着多模态的发展带来AI泛化能力提升,通用视觉、通用机械臂、通用通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活。预计5~10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

相关标的:大华股份、海康威视、云从科技、千方科技、商汤科技、萤石网络等及算力产业链公司。
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
千方科技
工分
1.68
转发
收藏
投诉
复制链接
分享到微信
有用 8
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(4)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-04-18 22:54
    格林深瞳,机器视觉,年报盈利摘U
    0
    0
    打赏
    回复
    投诉
    于2023-04-18 23:00:15更新
    查看1条回复
  • 只看TA
    2023-04-18 21:55
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-04-18 21:43
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往