登录注册
研究报告:中信建投-传媒行业AI政策系列(二):欧盟推动立法保护数据及版权-230501
无名小韭98931008
机构
2023-05-02 11:47:41
核心观点

  4月27日,据Euractive报道,欧洲议会成员(MEP)就《人工智能法案》达成提案,对AI模型提出更严格监管要求,旨在规范训练素材的合规使用、保持公平竞争、保护隐私等合法权利、降低风险等。https://www.hibor.com.cn【慧博投研资讯】其中关于训练素材的使用方面,提出模型开发商将会被要求披露在构建其模型时使用的任何版权材料。https://www.hibor.com.cn(慧博投研资讯)此外,据路透社报道,七国集团(G7)也将推出一项针对人工智能的监管法案。

  从国内和欧盟的相关监管提案/征求意见的思路来看,我们认为,数据/版权方在人工智能中的重要地位得到认可,其权益也获得进一步保护。

  目前来看,海外及国内都开始了“模型大战”,巨头互联网公司、创业企业、上市公司均进入战局。而各家模型厂商的数量越多、竞争越激烈,也都将有利于上游版权和数据资源方。在此阶段,我们应该系统性的看待拥有版权和数据资源的相关公司,其资源价值的重估。

  相关公司:

  1)中央级出版集团:中国科传,中国出版,中信出版。

  2)地方出版集团:凤凰传媒、中南传媒、中文传媒、长江传媒、新华文轩、浙版传媒、山东出版、南方传媒、中原传媒、出版传媒、读者传媒、龙版传媒、时代出版。

  3)网络文学版权方:中文在线、掌阅科技。

  4)图片/音视频公司:视觉中国、芒果超媒、华策影视、捷成股份、新媒股份。

  事件

  4月27日,据Euractive报道,4月27日欧洲议会成员(MEP)就《人工智能法案》达成提案,对AI模型提出更严格监管要求,包括:1)版权披露:模型开发商将被要求披露在构建其系统时使用的任何版权材料。2)公平竞争:生成式AI模型提供方不能单方面强加给中小企业和初创企业的不公平合同义务;3)保障合法权利:保障隐私、非歧视等基本权利;4)降低风险:模型发布之前需要在独立专家的参与下测试风险。

  简评

  《人工智能法案》逐步完善中,或产生全球性影响。《人工智能法案》由欧盟委员会在21年4月开始起草,涵盖AI系统的定义、禁止AI应用的领域、AI系统的高风险分类、与执法机关有关的范围和规定、支持创新的措施等方面,目前仍在完善中。若通过,则该法案将成全球首个AI法律监管框架。据National Law Review,该法案将产生全球影响,其适用在欧盟区内提供的所有AI系统,无论其供应方来自当地还是英美等第三方国家。

  此外,据路透社报道,七国集团(G7)的数字和技术部长也在4月30日提出,将“基于风险”推出一项针对人工智能的监管法案,未来将召开关于生成式人工智能的讨论,包括如何保障知识产权、促进透明度、解决虚假信息等主题。

  近期提案对模型的版权披露等提出监管要求,关注后续进展。22年12月,欧盟理事会通过了关于《人工智能法案》的共同立场,旨在确保在欧盟区使用的AI系统的安全。23年4月27日,据Euractive报道,欧洲议会成员(MEP)就《人工智能法案》达成提案,对生成式AI模型提出更严格监管要求,并表示无论AI模型采用何种分发渠道、开发方式、训练数据类型,都必须遵守。具体包括:

  1)版权披露:生成式AI模型开发商将被要求披露在构建其系统时使用的任何版权材料,且需要在审查数据来源的可持续性、可能的偏见等方面,采取数据治理措施。

  2)公平竞争:禁止生成式AI模型提供方单方面强加给中小企业和初创企业的不公平合同义务,以保障中小企业和初创企业的利益,无论是API方式还是训练模型转移的方式。

  3)保障合法权利:生成式AI模型应保护隐私,也单独提出禁止在执法、边境管理、工作场所和教育领域,使用情绪识别类人工智能软件;此外,要求模型遵守的原则包括人力代理和监督、技术稳健性和安全性、透明度、多样性、不歧视和公平、尊重言论自由等。

  4)降低风险:生成式AI模型必须在欧盟数据库中注册,在模型发布前需要在独立专家的参与下,测试减轻对健康、安全、基本权利等可预见风险,且在其整个生命周期中保持适当的性能、可纠正性、安全性等。

  后续,在5月11日的关键委员会投票前,该提案可能仍需在技术层面进行细微调整,全体投票则预计在6月中旬进行。

  我们认为,本次《人工智能法案》的提案中,最值得关注的要求在于“要求披露模型在构建其系统时使用的任何版权材料”,这是对数据/版权供应方在生成式AI产业链地位的进一步肯定,版权方的权利也将在未来获得法律的保护。

  1)地位得到法律确认和保护:生成式AI会从公开网站或专业数据库获取大量素材作为训练数据,素材的提供方理应当享有AI生成内容所带来的收益。但因素材来源庞杂、追溯确权困难、模型方版权保护意识尚未形成等原因,模型生成的内容并不会披露所依据素材的来源,容易引发侵权问题。此前全球最大的专业图片库公司Getty Images就起诉Stability AI从网站上窃取了数百万张图片。

  欧盟《人工智能法案》提案中的上述要求,意味着大模型调用训练素材的行为将得到监督,数据和版权方的权益将得到保护,他们也从而获得主张更多权利的机会。

  2)数据资源商业化有望得到法律支持:当数据供应公司、个人创作者等素材供应方,以单独个体被大模型公开披露时,其可在法律的保护下,向大模型寻求对生成内容收益的分成,实现数据资源变现。

  结合欧盟本次《人工智能法案》提案、Reddit等互联网平台对大模型公司调用API收费,及网信办《生成式AI服务管理办法(意见征求稿)》,可以看到从政策法规到实际产业界的探索,在人工智能大模型火爆的当下,数据及版权保护成为重要议题。我们认为,大模型为具有版权的数据资源进行付费,将成为生成式AI的产业趋势。具有海量优质版权、数据资源的公司将充分受益。从产业优先级来看,基于大语言模型训练,文字类版权将率先受益。后续则为图片、视频类版权。

  具体以下几类公司有望受益:

  1)中央级出版集团:中国科传,中国出版,中信出版。

  2)地方出版集团:凤凰传媒、中南传媒、中文传媒、长江传媒、新华文轩、浙版传媒、山东出版、南方传媒、中原传媒、出版传媒、读者传媒、龙版传媒、时代出版。

  3)网络文学版权方:中文在线、掌阅科技。

  4)图片/音视频公司:视觉中国、芒果超媒、华策影视、捷成股份、新媒股份。

  3)网络文学公司:中文在线、掌阅科技

声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
工分
1.02
转发
收藏
投诉
复制链接
分享到微信
有用 1
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
暂无数据