异动
登录注册
实战赋能
自学成才的散户
2026-01-21 14:51:31
静等新模型
@妮可韭韭: 新智元这篇文章要点:1、DeepSeek-R1一年了,但DeepSeek-R2还没来。而这个被爆出的MODEL1,极有可能就是R2!2、项目里,大约有28处提到model 1。MODEL1即便不是R2,也意义非凡,毕竟FlashMLA是DeepSeek优化的注意力核心算法库。FlashMLA是Dee
25 赞同-8 评论
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
工分
0.00
转发
收藏
投诉
复制链接
分享到微信
有用 0
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据