登录注册
【华福电子】商汤日日新5.0重磅推出,长文本+多模态趋势驱动算力需求
戈壁淘金
只买龙头的老司机
2024-04-24 22:06:10

商汤4月23日推出日日新SenseNova 5.0大模型体系,基于超过10TB tokens训练,综合能力“全面对标GPT-4 Turbo”

长文本+多模态趋势确认,AI推理算力需求如火如荼

【长文本]趋势确认,AI推理侧标配200K。日日新5.0推理时上下文窗口可以有效到200K左右,Kimi为20万字(约250K),Claude3为200K,GPT-4 Turbo为128K
日日新5.0新增【多模态]交互能力,支持高清长图解析和理解以及文生图交互式生成

参数量持续爆发,AI训练持续支撑算力芯片出货

AI训练对算力芯片需求驱动力不减。此次5.0大模型达到6000亿参数,据澎湃新闻,训练一个千亿参数的模型大约需要10830个英伟达 A100 GPU。若线性外推,以H100 GPU训练6000亿参数大模型,大约需要18940个H100 GPU

持续看好国产算力芯片渗透。2023年报显示,商汤大模型基础设施大装置SenseCore总算力规模突破性增长至12000 petaFLOPS,运营 GPU数量达4.5万卡,其中国产算力2000P,国产化率约17%。

AI大模型加速竞赛,AI训练侧算力需求层出不穷

上周(4.18)Meta推出最强开源LLaMA-3大模型,基于15T个token,含8B和70B两个版本,另有400B+参数版本持续训练中

此前(3.19) OpenAl CEO对外披露GPT-5性能改进幅度或超预期,一系列重要产品亟待发布

产业链相关公司:

- CPU/GPU:寒武纪海光信息
- 服务器:工业富联
- PCB:沪电股份胜宏科技
-铜链接沃尔核材精达股份等

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
沃尔核材
S
胜宏科技
S
寒武纪
工分
6.46
转发
收藏
投诉
复制链接
分享到微信
有用 8
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(4)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    04-27 16:12
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 交易者奋斗
    全梭哈的散户
    只看TA
    04-25 08:49
    沃尔核材是算力概念。
    0
    0
    打赏
    回复
    投诉
  • 斯武
    中线波段的散户
    只看TA
    04-24 22:17
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    04-24 22:10
    meta前脚刚开源
    0
    0
    打赏
    回复
    投诉
  • 1
前往