登录注册
人人能打造类ChatGPT“对话搜索引擎”,Vectara获得2亿元融资
Jiangang Yang
2023-05-31 08:53:27
北美时间5月30日,生成式AI平台Vectara宣布获得2850万美元(约2亿元)种子轮融资,本次由Race Capital领投。
Vectara提供了类ChatGPT对话式服务,用户可以将PDF、Word、PPT、RTF等文件数据上传至Vectara平台中,构建独一无二的数据搜索引擎。例如,你上传了一份50页PDF的员工手册,然后通过对话框可以对整个内容进行提问,如新入职的员工需要遵守哪些规则?Vectara会根据上传的内容给出答案。
目前,Vectara已经全面开放,注册即可使用。「AIGC开放社区」注册账号体验了一下,该平台简单、易用、生成内容效率高,非常适用于查看上百页PDF的文献资料,并且所有生成的内容都真实可靠。(免费体验地址:https://vectara.com/grounded-generation/
ImageAIGC开放社区申请的账号
前几天,一位律师通过ChatGPT协助办案被坑的事件风靡全球。纽约资深律师施瓦茨在提交的法庭文件中,使用了ChatGPT提供的6个类似裁决成功的案例,但其中很多都是假的让这位律师非常懊悔。
像这种事件并不少见,主要是因为ChatGPT在预训练过程中使用了很多“黑箱数据”,包括歧视、虚假、非法等内容,所以,会看到ChatGPT出现“胡说八道”的行为。
Image
而Vectara只提供了类ChatGPT的容器,至于里面装的数据内容完全由用户自己决定,这保证了生成的内容100%正确,避免虚假内容的出现。事实上,很多大型企业例如,律商联讯、摩根大通、LG等,开始通过这种方式训练自己的类ChatGPT机器人,用于提升工作效率。
Vectara产品展示
产品方面,Vectara是基于大语言模型和布尔精确匹配的产品,可根据用户上传的文档数据结合上下文理解,提供与类ChatGPT类似的问答服务。支持中文、英文、韩文、西班牙、法语、德语等多国语言。
Image
使用流程非常简单,简单4步就能完成。1)登录Vectara平台后,选择创建语料数据库。
Image
2)为数据库起一个名字、描述和过滤器选项。其中,过滤器可以隐藏、过滤一些特定内容,使得生成内容更符合用户需求。
Image
3)上传文档数据,用户可上传PDF、Word、PPT、RTF、txt、邮件等格式文档内容。
Image
4)建立语料库后,通过对话框开始提问内容。例如,我能把医院账单记在税上吗?Vectara会根据用户上传的内容,自动生成答案。
需要注意的是,Vectara会生成一系列答案,对生成的内容进行评分,排名最高的会在前面并且会标注数据来源。
Image
Vectara表示,对于用户上传的数据资料会保证其安全,不会用于训练模型。Vectara本身应用的大语言模型已经使用海量数据进行训练,可以理解不同类型数据以及提问输出的内容格式。
此外,Vectara会将每一位用户的语料库,使用不同的对称密钥保护和数据加密。会使用TLS对传输中的数据进行加密,甚至大型用户可以创建和管理自己的数据加密密钥。
Image
目前,小型企业、个人用户可以免费使用Vectara的产品。如果大型企业需要特定业务场景,例如,法律、金融、保险等,Vectara可以提供量身定制服务。

https://mp.weixin.qq.com/s/aO59zJkWdxKTnvdW2BcnSg

作者在2023-05-31 09:00:33修改文章
作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
云创数据
工分
0.63
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 大时代
    为国接盘的老司机
    只看TA
    2023-05-31 11:52
    这和云创没啥关系吧
    0
    0
    打赏
    回复
    投诉
    于2023-05-31 21:05:16更新
    查看1条回复
  • 1
前往