Meta AI在官网发布了基础模型Segment Anything Model(SAM)并开源,该模型在图片元素识别与分割上的表现远超预期。英伟达AI科学家Jim Fan在社交媒体上感叹道,SAM让计算机视觉(CV)迎来“GPT-3时刻”。
与以ChatGPT为代表的NLP(自然语言处理)不同,SAM专攻的计算机视觉是一门研究如何使机器“看”的科学,是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
Meta AI“超车”
类似于ChatGPT可以回答一切问题,SAM则是可以“分割”一切,用更通俗易懂的词来说便是“抠图”。
Meta在官网演示了三种使用方法,用户可以通过悬停和点击、方框、全选等方式给出指令,SAM会根据指令自动识别图像内的所有物体。如视频所示,SAM可以根据鼠标滑动方向,精准实现物体的分割。
除了直接动手“抠图”,SAM还可以根据文本来识别对象。当用户在文本框中输入“cat(猫)”的单词时,SAM会进行识别并框选图片中所有的猫,还能精准描摹出猫的轮廓。
不仅仅是静态的图片,SAM还能识别出视频中的物体。Meta展示了一个SAM与VR、AR进行结合的示例,用户可以在使用VR、AR设备时,借助SAM实现对3D物体的精准识别与分类。
这是计算机视觉领域的GPT-3时刻之一。
新上市的深圳AI“第一股”云天励飞,大幅下跌15%,恐龙认为尾盘杀入是绝良机。
在重点布局计算机视觉领域,云天励飞成立于2014年8月,是一家专注于计算机视觉领域的人工智能企业,也是“AI+安防”赛道的独角兽公司。公司以人工智能算法、芯片技术为核心,为客户提供算法软件、芯片等自研核心产品等。
展望后市,随着软硬件技术的不断突破,计算机视觉商业化也将加速。根据高工机器人产业研究所(GGII)数据,2021年中国机器视觉市场规模达到138.16亿元,同比增长46.8%;其中2D视觉市场规模126.65亿元,3D视觉市场约为11.51亿元。GGII预测,到2025年我国机器视觉市场规模将达到468.74亿元,2021-2025年复合增速达到36%。