登录注册
中文Chatgpt需要中文世界的海量数据
花匠秀秀秀
蜜汁自信的游资
2023-02-08 15:24:38
ChatGPT的核心竞争力,就是“海量数据”与“海量训练”。“海量训练”的核心概念股“海天瑞声”已经成为Chatgpt概念的核心。而在“海量数据”层面英文数据库信息汇聚全球数据信息,这一优势相比中文数据库优势明显。

数据喂的越多,机器学的越快,回答的越准,尤其在通用范式下需要海量数据帮助机器进行学习,那么在哪找到中文海量数据的来源,并作为训练数据喂给机器呢?

中文海量数据来源应该主要有以下几个方面——

一、搜索引擎:

1、三六零

2、百度

3、昆仑万维

二、文字数据库:

1、知乎:

海量问答数据

2、中文在线

公司累积数字内容资源超510万种,网络原创驻站作者440余万名;与600余家版权机构合作,签约知名作家、畅销书作者2,000余位。在与其他平台合作方面,公司与头部阅读平台、音频平台、三大运营商以及手机厂商等销售渠道做分销,与业内付费及免费销售渠道广泛合作,合作渠道覆盖了微信读书、QQ阅读、手机百度、七猫小说、番茄小说、追书神器、阳光书城、掌中云、掌读等重点互联网阅读平台,以及喜马拉雅、蜻蜓FM、懒人畅听、酷我畅听、番茄畅听、华为音乐等音频平台。

3、同方股份

旗下同方知网,核心学术数据库



作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者持有相关标的,下一个交易日内可能择机卖出。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
海天瑞声
S
知乎-W
S
中文在线
S
三六零
S
同方股份
工分
26.89
转发
收藏
投诉
复制链接
分享到微信
有用 11
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(12)
只看楼主
热度排序
最新发布
最新互动
  • 考谷里的居民
    不要怂的散户
    只看TA
    2023-02-08 15:42
    今天知乎强势,主要是存储有海量数据,相当于ChatGPT的饵料,那么百度的饵料主要是国内的公司 掌阅科技 中信出版 中文在线 视觉中国 万兴科技 昆仑万维
    1
    0
    打赏
    回复
    投诉
    于2023-02-08 15:53:37更新
    查看1条回复
  • 只看TA
    2023-02-08 23:09
    每日互动
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-08 17:23
    昆仑万维,欧朋浏览器,对标360
    1
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-08 15:30
    还有值得买
    1
    0
    打赏
    回复
    投诉
  • 弘九
    超短追板
    只看TA
    2023-02-08 22:37
    拓尔思有搜索数据库,有大量数据;中文在线有大量网络创作数据。
    0
    0
    打赏
    回复
    投诉
  • 扶栏客(股林风)
    蜜汁自信的半棵韭菜
    只看TA
    2023-02-08 21:22
    逻辑比较硬
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-08 21:17
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-08 19:51
    感谢分享
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-08 17:05
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2023-02-08 16:27
    谢谢
    0
    0
    打赏
    回复
    投诉
  • 1
  • 2
前往