登录注册
幻方大模型概念股小表哥
风清扬大侠
2024-05-10 12:06:36
幻方大模型概念股小表哥

幻方发布全球最强MoE模型DeepSeek-V2:超低成本,性能媲美GPT4


 

 继今年1月份开源国内首个MoE模型后,幻方人工智能公司最新推出了第二代MoE模型——DeepSeek-V2。这款新模型不仅参数更多、性能更强,训练成本更低的特点,令其在业界引起广泛关注。 DeepSeek-V2采用了创新的模型架构和训练方法,在多项综合评测中均表现出色,有些指标甚至媲美或超越目前最强的GPT-4模型。同时,它的推理效率和部署成本也大幅优于同类大模型,可谓是性能与成本的完美结合。

媲美GPT-4,价格为其百分之一

先看性能。

和当前主流大模型相比,DeepSeek-V2毫不逊色。

据悉,DeepSeek-V2拥有2360亿参数,其中每个token210亿个活跃参数,相对较少,但仍然达到了开源模型中顶级的性能,称得上是最强的开源MoE语言模型。

研究团队构建了由8.1T token组成的高质量、多源预训练语料库。与DeepSeek 67B使用的语料库相比,该语料库的数据量特别是中文数据量更大,数据质量更高。

据官网介绍,DeepSeek-V2的中文综合能力(AlignBench)在众多开源模型中最强,超过GPT-4,与GPT-4-Turbo,文心 4.0等闭源模型在评测中处于同一梯队。

其次,DeepSeek-V2英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B处于同一梯队,超过最强MoE开源模型Mixtral8x22B。


作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
每日互动
工分
1.83
转发
收藏
投诉
复制链接
分享到微信
有用 4
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    05-10 12:11
    1
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    05-11 11:46
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往