登录注册
【申万宏源计算机】AI时代,重要的底层软件——向量数据库
柴尔德
满仓搞的剁手专业户
2023-05-08 10:49:39
【申万宏源计算机】AI时代,重要的底层软件——向量数据库


#为什么? 【大模型数据向量化表示】 AI大模型在训练过程中,不是理解独立的个体文字符号,而是向量化的表示。向量数据是由表示特征或者属性的一组数值组成,比如图片可以由多个像素值组成的向量表示,在“图搜图”过程中,在数据库中存储和对比的并不是完整图片,实际是通过DL等算法提取出来的“特征”。


#区别是?

【模糊计算、数据规模大、高效检索和分析】 与此前数据库“精确匹配”不同,向量数据库采用模糊匹配,选择最近似答案,实际上匹配无监督聚类的底层逻辑,因此在AI大模型中的训练和推理过程中将有更明显的需求。此外,数据规模远超传统关系型数据库,并且计算密集型的计算方式对计算能力要求很高。在图片检索图片、音频检索非结构化文本等领域,将实现更高效应用。

#海外进展?

【AutoGPT已经集成】 AutoGPT集成的是向量数据库Pinecone(封闭源代码),海外较积极的向量数据库还有Milvus、Vespa、Weaviate、Vald、GSI 和 Qdrant等。将在推荐系统、图像搜索和类似应用程序中有更多应用。


推荐关注:太极股份、星环科技-U、海量数据、创意信息等

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
星环科技
S
太极股份
工分
6.45
转发
收藏
投诉
复制链接
分享到微信
有用 7
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(1)
只看楼主
热度排序
最新发布
最新互动
  • 1
前往