数据喂的越多,机器学的越快,回答的越准,尤其在通用范式下需要海量数据帮助机器进行学习,那么在哪找到中文海量数据的来源,并作为训练数据喂给机器呢?
中文海量数据来源应该主要有以下几个方面——
一、搜索引擎:
1、三六零
2、百度
3、昆仑万维
二、文字数据库:
1、知乎:
海量问答数据
2、中文在线
公司累积数字内容资源超510万种,网络原创驻站作者440余万名;与600余家版权机构合作,签约知名作家、畅销书作者2,000余位。在与其他平台合作方面,公司与头部阅读平台、音频平台、三大运营商以及手机厂商等销售渠道做分销,与业内付费及免费销售渠道广泛合作,合作渠道覆盖了微信读书、QQ阅读、手机百度、七猫小说、番茄小说、追书神器、阳光书城、掌中云、掌读等重点互联网阅读平台,以及喜马拉雅、蜻蜓FM、懒人畅听、酷我畅听、番茄畅听、华为音乐等音频平台。
3、同方股份
旗下同方知网,核心学术数据库