国家网信办出手:《生成式人工智能服务管理办法(征求意见稿)》要点解读

4月11日,为促进生成式人工智能技术健康发展和规范应用,根据《中华人民共和国网络安全法》等法律法规,国家互联网信息办公室发布关于《生成式人工智能服务管理办法(征求意见稿)》(下称《办法》)公开征求意见的通知。这是国家首次针对现下爆火的生成式人工智能产业发布规范性政策。

按照《办法》的定义,生成式人工智能,是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。

随着生成式人工智能持续获得市场关注,互联网巨头集中发布大语言模型,外有微软、谷歌、Meta,内有百度、华为、阿里、昆仑万维,然而各路巨头训练数据参差不齐,数据来源及涉及的著作权不甚明了。

网信办在此时发布管理办法,对生成式人工智能服务提出了多项规制,强调生成式人工智能产品提供者的责任、突出个人信息的保护、明确向监管部门备案和申报安全评估的硬性要求,以及多次重申要从数据源开始确保“生成内容”的真实准确等,开启了中国对生成式人工智能产业的监管之路。

冰鉴科技研究院将从《办法》征求意见稿中择要进行解读。

《办法》第二条规定了适用和管辖范围,只要是“面向中华人民共和国境内公众提供服务的”,无论是国外还是国内的公司,均适用本办法。

《办法》第四条第二款要求,“在算法设计、训练数据选择、模型生成和优化、提供服务等过程中,采取措施防止出现种族、民族、信仰、国别、地域、性别、年龄、职业等歧视。”个人信息保护是贯穿AI研发和应用的红线,但往往更加受到关注的合规点在于是否为公开信息,个人信息是否得到充分授权,而该款所列内容关注到的个人信息类别——歧视和偏见则更为隐蔽,而这将在生成式人工智能上被进一步放大。训练数据中可能存在的一系列社会歧视和偏见,会导致生成内容“继承”这种歧视和偏见。目前许多海外立法已经对此给予了充分关注,此次《办法》的明确,也表示国内对于这一问题的逐渐重视。

《办法》第四条第四款要求,“利用生成式人工智能生成的内容应当真实准确,采取措施防止生成虚假信息。”在现实操作中,生成式人工智能生成的内容是否“真实准确”较难界定。很多ChatGPT用户发现,在和AI交互过程中,遇到某些创造性较强的内容,如写小说、发表评价性看法,乃至长时间问答交互之后,人工智能经常会一本正经“胡说八道”,甚至出现幻觉(hallucinations)——而这恰恰又是生成式人工智能不同于其他语言模型的独特创新之处。冰鉴科技研究院认为,该条规定更强调生成式人工智能提供者,要有“防止生成虚假信息”的前置举措,并在应用实践中部署执行。至于最终生成的内容是否为“虚假信息”,还要根据实践中是否造成不良影响或侵犯他人权利来进一步认定。

《办法》第五条指出,生成式人工智能提供者,通过API接口支持他人生成内容的,也要“承担该产品生成内容生产者的责任”“涉及个人信息的,承担个人信息处理者的法定责任,履行个人信息保护义务。”——从该条来看,各类B端客户在使用生成式人工智能对外提供服务时,也都要追溯到源头提供者的责任,涉及个人信息处理的则按照《个人信息保护法》执行。

《办法》第六条,利用生成式人工智能产品向公众提供服务前,需按规定向国家网信部门申报安全评估。实际上明确了向监管部门备案和申报安全评估的硬性要求。至于目前互联网巨头已经开始向公众提供服务的,理论上应当补齐安全评估程序及算法备案手续。而在《办法》正式出台之后,计划向公众提供服务的生成式人工智能提供者,则需要提前向网信办申请安全评估及备案。

如前所述,要确保“生成内容”的真实准确,则需要从数据源头确保真实准确。《办法》第七条按照《网络安全法》,对“生成式人工智能产品的预训练数据、优化训练数据来源的合法性”提出了详细要求。第十七条则要求,应根据主管部门的要求,向用户提供“包括预训练和优化训练数据的来源、规模、类型、质量等描述……”

《办法》第八条要求“对标注人员进行必要培训,抽样核验标注内容的正确性”。众所周知,生成式人工智能在(有监督、半监督)深度学习时,涉及到大量人员对数据进行标注,“抽样核验”原本就是必不可少的过程。但当前有不少AI 公司(如自动驾驶)将标注工作进行外包,或放在互联网平台上进行众包,是否需要以及如何对这些标注人员进行培训?举或将提高生成式人工智能提供商的人力成本。

《办法》第十六条非常有意思,要求对AI“生成的图片、视频等内容进行标识”。比如打上“本图片由某某GPT自动生成”这样的水印?国外很多平台已经允许将ChatGPT列为论文合著者。而这类明显的标识,既是生成式人工智能提供商的广告式宣言,也为普通用户区别“人工智能”和真正“人工”生成的内容提供了帮助。我国法律学界与实务界目前对人工智能生成物是否属于著作权法下的作品观点不一,如果生成内容独创性不足,可能还构成对现有作品的侵权,如果人工智能生成物的确侵犯了著作权,这类标识也为作者法律维权打开了方便之门。

《办法》对投诉举报的处理机制也做了详细的规定,第十五条指出,对于运行中发现、用户举报的不符合办法要求的生成内容,除采取内容过滤等措施外,应在3个月内通过模型优化训练等方式防止再次生成。第十八条和十九条又分别明确了用户和使用者发现生成内容不合规或使用生成产品过程中产生不合法不道德行为的投诉处理机制,并且在第二十条列出了处罚的法律依据和相关规定。

生成式人工智能监管号角已经吹响,产业格局和行业规则或将发生重大改变。本次发布的《办法》仅为征求意见稿,公众可在2023年5月10日前通过多个途径提出反馈意见,后续监管也将根据行业实践和意见反馈调整相应内容。

相关链接:https://mp.weixin.qq.com/s/Mg-nk7tatmpWZpIkxBhUkQ