登录注册
360大模型评分排名第一
neophyte
下海干活的公社达人
2023-05-26 12:05:55
5月23日,JioNLP大语言模型评测发布最新测试结果,360版GPT——认知智能通用大模型“360智慧大脑”(简称“360智脑”)成为“国内大语言模型目前最好的”。此前,360智脑在中文通用大模型基准(SuperCLUE)评测结果中,多项能力也是位列国产大模型第一。

近期国内众多公司的大模型产品集中涌现,为把所有公测大模型拉齐到同一个水平线上进行横向比较, JioNLP制作了一份大语言模型评测数据集,用于考察各个大语言模型的实际效果。在其最新一次评测结果中,360智脑得分68分,仅次于ChatGPT和GPT4,高于科大讯飞 等国产大模型,属于国产大模型之首。
JioNLP表示360智脑的表现超出预期,“相比其它国内模型,优势主要体现在客观题回答准确率相对较高,问答类题型准确性较好,说明模型训练的文本数据分布较广,最值得一提的是模型对于编程题目的准确性较高,测试题共3道程序题目,全部答对,没有出现明显的偏离和瞎答。”
专业人士分析,作为搜索引擎厂商,360做大模型有天然优势,其海量多样高质量的训练语料和工程化的调度能力,是很多厂商不具备的。同时,搜索引擎数据实时更新、知识校对准确,而大模型能自动剔除垃圾信息,因此两者融合相互增强,形成良性循环。因此JioNLP认为“360智脑准确性较高”是有原因的。
据360相关负责人介绍,未来,360集团将依托多年人工智能技术积累及搜索、浏览器等场景优势,进一步布局“两翼齐飞+四路并发”大模型战略,一方面坚持核心技术研发,另一方面做大优势场景,在场景中不断提升大模型的核心技术能力。
作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内没有卖出计划。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
三六零
S
易华录
S
剑桥科技
S
寒武纪
S
拓尔思
工分
0.40
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(4)
只看楼主
热度排序
最新发布
最新互动
  • neophyte
    下海干活的公社达人
    只看TA
    2023-06-20 13:42
    赶紧换新一批资金来做,需要有远见的资金
    0
    0
    打赏
    回复
    投诉
  • neophyte
    下海干活的公社达人
    只看TA
    2023-06-16 13:51
    A股科技里还没有万亿市值的公司,新能源有宁德,消费有茅台 ,做为世界第二大科技大国,A股万亿市值的科技股将在人工智能大模型的核心公司里竞争胜者
    0
    0
    打赏
    回复
    投诉
  • neophyte
    下海干活的公社达人
    只看TA
    2023-05-26 12:33
    推出仅仅六天,ChatGPT手机APP在苹果应用商店已经获得超过50万次下载,一举成为今年和去年表现最好的新应用程序之一(图1),这还是iOS版ChatGPT仅在美国上线的成绩。

    从“最佳五天”下载量来看,ChatGPT手机应用也超过了Bing和微软Edge浏览器在2月份整合了GPT-4功能后的下载量,当时Bing和Edge分别获得了34万次和33.5万次下载(图2)。值得一提的是Bing和Edge的下载量包括了iOS和安卓商店的下载,而ChatGPT目前仅有iOS版。如果单看iOS版下载数据,ChatGPT的领先又多了一大截
    0
    0
    打赏
    回复
    投诉
  • 1
前往