登录注册
从openAI的安全方案看AI安全的重点方向
我是闰土你是猹
2023-04-06 11:48:14
美国当地时间4月5日,ChatGPT研发者OpenAI在其官方博客中发布了题为《Our approach to AI safety》(《我们保障AI安全的方法》)的文章,介绍了该公司确保AI模型安全性的部署。该文章介绍了六个方面的部署,一是构建越来越安全的AI系统,二是从实际使用中积累经验以改善安全措施,三是保护儿童,四是尊重隐私,五是提高事实准确性,六是持续研究和参与。在隐私方面,OpenAI表示努力在可行的情况下从训练数据集中删除个人信息,微调模型以拒绝对私人信息的请求,而且能响应用户从OpenAI的系统中删除个人信息的请求。

OpenAI今天发布的保障AI的方法中,比较重要的是从训练数据居中删除个人信息,同时,其文中提出的保护儿童,尊重隐私,提高事实准确信共同指向了一个很重要的AI安全的细分方向——数据清洗

数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性

数据清洗从名字上也看的出就是把“脏”的“洗掉”,指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。因为数据仓库中的数据是面向某一主题的数据的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为“脏数据”。我们要按照一定的规则把“脏数据”“洗掉”,这就是数据清洗。而数据清洗的任务是过滤那些不符合要求的数据,将过滤的结果交给业务主管部门,确认是否过滤掉还是由业务单位修正之后再进行抽取。不符合要求的数据主要是有不完整的数据、错误的数据、重复的数据三大类。

通过数据清洗,可以对数据进行筛选,标注,甄别,提出有害数据和个人信息,加强隐私保护。

A股有数据清洗业务的企业:

1.三维天地

三维天地是专注于检验检测信息化和数据资产管理领域的软件开发服务商,在数据资产管理领域拥有领先地位,在数据清洗方面,他为客户提供的数据清洗平台可建立基于多对多关系数据模式的开放式数据清理功能,支持对原始数据的抽取、分词、语义识别、清洗与整合构建不同主题模型的主数据信息库,通过人工干预与确认,采用系统自动扫描清洗与人工干预相结合的模式进行数据清洗。是A股最正宗的数据清洗企业

2.拓尔思

从数据资源化的角度,公司具备完全自主研发的大数据基础平台,可提供采集、清洗、标注、管理等完整的数据闭环服务,具体产品包括海蜘分布式采集系统、海汇社交视频采集系统、海聚数据融合系统、海贝搜索数据库等。


作者利益披露:原创,不作为证券推荐或投资建议,截至发文时,作者不持有相关标的。
声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
三维天地
S
拓尔思
S
人民网
S
国投智能
S
海天瑞声
工分
4.13
转发
收藏
投诉
复制链接
分享到微信
有用 5
打赏作者
无用
真知无价,用钱说话
1个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2023-04-07 00:35
    0
    0
    打赏
    回复
    投诉
  • 你们玩吧,我没钱了
    已经腰斩的吃面达人
    只看TA
    2023-04-06 12:25
    可惜。小思也累了
    0
    0
    打赏
    回复
    投诉
  • 1
前往