登录注册
【黄河计算机】微软开源Deep Speed Chat,重视具有场景数据厂商
戈壁淘金
只买龙头的老司机
2023-04-13 21:53:45

Deep Speed Chat主要什么意义?

(1)拉低端到端门槛,用户可直接用自身数据进行RLHF调参,用户数据、场景数据成为重中之重
(2)从通用大模型到行业/用户专属模型成本初步被定义,在Azure云上只需9小时即可训练一个OPT-13B模型,只需18小时即可训练一个 OPT-30B模型。这两种训练分别花费不到300美元和600 美元。(这里训练非pre-train,而是fine-tune)
(3)训练效率提升可大幅优化训练成本,这是一项系统性工程

Deep Speed Chat有什么影响?

(1)小模型由于成本高、效果未来有望被超越,长期生存面临威胁,拥抱大模型逐渐是必然之路,犹豫就会败北!!
(2)初步Chat功能模型门槛降低,手握场景数据话语权更加重要
我们当前应该关注什么?
(1)什么样的厂商可以做到GPT-4,不仅仅技术问题,团队更重要
(2)什么样的厂商可以占住市场,技术目前不是首要,渠道和数据更重要

建议关注科大讯飞(教育数据闭环+真正投入+预期产品落地)、税友股份(税务数据+有场景可结合)、广联达(建筑IT龙头,数据闭环)、同花顺(金融数据+市场化客户)、新点软件(招采数据、政务数据)

作者利益披露:转载,不作为证券推荐或投资建议,旨在提供更多信息,作者不保证其内容准确性。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
科大讯飞
S
同花顺
S
税友股份
S
新点软件
工分
1.15
转发
收藏
投诉
复制链接
分享到微信
有用 10
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(3)
只看楼主
热度排序
最新发布
最新互动
  • 1
前往