团 体 标 准
T/TAF 268.4—2025
生成式人工智能个人信息保护技术要求
第 4 部分:模型规制控制
Technical requirements for personal information protection of generative
artificial intelligence—Part 4:Model regulatory control
2025-02-10 发布 2025-02-10 实施
电信终端产业协会 发布
前 言
本文件按照GB/T 1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。
本文件是T/TAF 268《生成式人工智能个人信息保护技术要求》的第4部分。T/TAF 268已发布以下部分:
——第1部分:总则;
——第2部分: 隐私声明告知;
——第3部分:训练数据构建;
——第4部分:模型规制控制;
——第5部分:二次开发管理;
——第6部分:输出阶段管理;
——第7部分:个人权利响应;
——第8部分:供应链管理。
请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由电信终端产业协会提出并归口。
本文件起草单位:中国信息通信研究院、北京快手科技有限公司、维沃移动通信有限公司、厦门美柚股份有限公司、阿里巴巴 (中国)有限公司、北京小桔科技有限公司、科大讯飞股份有限公司、北京智者天下科技有限公司、蚂蚁科技集团股份有限公司、北京象信智能科技有限公司、荣耀终端股份有限公司、OPPO广东移动通信有限公司、华为终端有限公司、珠海魅族科技有限公司、中兴通讯股份有限公司、高通无线通信技术 (中国)有限公司、北京零一万物科技有限公司、北京微梦创科网络技术有限公司、联通华盛通信有限公司、北京卡路里科技有限公司、上海声网科技有限公司、广州视睿电子科技有限公司、友盟同欣(北京)科技有限公司、广东小天才科技有限公司、北京理想汽车有限公司、广州虎牙信息科技有限公司、北京转转精神科技有限责任公司。
本文件主要起草人:武林娜、王艳红、王淞鹤、屈蕾蕾、李京典、陈鑫爱、谷晨、落红卫、徐曼、贾科、安达、李碧君、熊有竹、黄鹏华、王磊、周辰、孙铁、许锐、黄如鑫、李荣、杜云、杨萌科、周飞、李可心、顾世鸿、王士进、高建清、李根、李腾、李辰淑、赵晓娜、王江胜、朱玲凤、李絁芩、林冠辰、石玉珍、阮玲宏、董继征、黄天宁、陈岑、刘胜宇、尹志超、潘万鹏、陈宝金、钱雷、杨弋、王海棠、任资政、康宇、刘觅、王海涛、曹昉赫、张天若、姚栋、贾紫薇、周裕亮、刘晓杰、胡梦云、马海龙、刘备、车天博、李晨瑜。
引 言
近年来,生成式人工智能实现跨越式发展,能够以十分接近人类的思考方式进行信息处理和内容生成,解决更加多元化的主题任务,在文本生成、数据分析、代码编写、图像生成等领域均表现出极为突出的可靠性、高效性与逻辑性。
目前,生成式人工智能广泛应用于虚拟助理、智能客服、语音助手等人机交互场景,能够为用户解答疑问、安排日程、处理问题,而良好交互体验的实现需要以获得大量用户数据为基础,在推动技术产业变革的同时也为用户个人信息保护带来了风险与隐患。
面对新技术新应用带来的机遇和挑战,为了平衡创新发展和精准治理,完善生成式人工智能数据治理体系,亟需针对生成式人工智能的个人信息保护问题提出技术要求,督促指导企业建立健全相关制度、强化技术能力。
T/TAF 268旨在对生成式人工智能的个人信息保护问题提出技术要求,拟由8部分构成。
——第1部分:总则。目的在于规定生成式人工智能服务个人信息保护的术语、总体原则和个人信息保护框架
——第2部分:隐私声明告知。目的在于提出向服务使用者进行隐私声明告知时的个人信息保护技术要求。
——第3部分:训练数据构建。目的在于提出生成式人工智能数据集构建过程中的个人信息保护技术要求。
——第4部分:模型规制控制。目的在于提出生成式人工智能模型训练阶段个人信息保护方面的规制控制要求。
——第5部分:二次开发管理。目的在于提出面向开发者提供二次开发应用时,个人信息保护相关的管理要求。
——第6部分:输出阶段管理。目的在于提出生成式人工智能服务在内容输出时对输出阶段管理的个人信息保护要求。
——第7部分:个人权利响应。目的在于提出服务提供者对于服务使用者个人权利响应要求。
——第8部分:供应链管理。目的在于提出供应链管理中所应满足保护个人信息安全的技术要求和管理措施。
生成式人工智能个人信息保护技术要求
第 4 部分:模型规制控制
1 范围
本文件主要面向基于自研模型的生成式人工智能服务提供者的模型管理风险提出个人信息保护要求,主要包括模型基本管控要求和模型训练基本要求。
本文件适用于指导生成式人工智能服务提供者对模型个人信息安全能力的设计与研发,同时适用于监管机构、第三方测评机构对生成式人工智能个人信息保护能力的模型规制控制情况进行监督、评估与认证。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
TAF 268.1 生成式人工智能个人信息保护技术要求 第1部分:总则
3 术语和定义
TAF 268.1界定的术语和定义适用于本文件。
4 模型基本管控能力
服务提供者应具备模型基本管控能力,具体要求如下:
a) 应保证构建的训练数据满足个人信息保护要求,具体参照 T/TAF XXX.3 第 5-7 章要求;
b) 应对内部模型训练平台设置严格的访问控制机制,使用身份验证和授权访问等访问控制机制,防止未授权的个人信息访问和使用,具体要求包括但不限于:
1) 内部模型训练平台应对登录人员进行身份鉴别,身份鉴别信息具有复杂度要求并定期更换。应采用口令、密码技术、生物技术等鉴别技术对人员进行身份鉴别;
2) 应限制内部模型训练平台账号的身份鉴别信息输入尝试次数,对身份鉴别信息遗忘的申请和重置流程实施严格管理,应具备限制非法登录次数和连接超时自动退出措施;
3) 应以最小化原则确定内部模型训练平台的人员权限,防止人员未授权或超出必要范围地访问和使用训练数据中的个人信息;
4) 应删除或停用内部模型训练平台多余、过期的账户,避免共享账户的存在;
5) 应对内部模型训练平台的用户配置访问控制策略,设置访问规则。
c) 应记录模型预训练和优化阶段的关键的操作行动及个人信息保护措施,建立完善的操作日志和数据追溯机制;
d) 应建立模型上线前的评估机制,必要时应对模型进行个人信息保护影响评估,应至少包含开发
利用用户输入数据的评估机制,评估用户输入数据用于模型优化的合法性、目的、必要性和范围,避免不必要的开发利用,并留存评估方法和结果记录;
e) 应建立用户输入数据的保护机制和管理措施,不应违规留存能够识别使用者身份的输入信息和使用记录,不应违规向他人提供使用者的输入信息和使用记录;
f) 应建立模型更新和改进机制,并留存各历史版本模型相关信息;
g) 应建立个人信息风险监测机制,实现对模型可能造成的个人信息泄露、窃取、篡改、毁损、丢失、非法使用等风险威胁的发现、跟踪、处置、记录等功能;
h) 应建立个人信息安全事件应急处置机制,针对出现的个人信息安全事件或漏洞,及时响应并采取措施进行处理和修复;
i) 应定期审查模型和数据处理策略,并保存审计结果,应不少于 1 年 1 次;
j) 应建立用户投诉处理机制,针对生成包含真实、准确个人信息并对个人合法权益造成损害的相关投诉,应及时响应并采取措施进行处理和修复;
k) 模型应具备抗推理攻击能力,防止模型因成员推理攻击、提示词注入等造成个人信息泄露。
5 模型训练基本要求
在生成式人工智能模型训练阶段,服务提供者应满足以下要求:
a) 未经用户同意,不应将模型用于分析、评估个人的行为习惯、兴趣爱好、经济、健康、信用状况或其他可能对用户隐私或安全造成较大影响的场景;
b) 应采用加密等措施保障模型参数的存储和传输安全,防止模型参数泄露导致个人信息泄露风险;
c) 应防范人工参与模型优化训练带来的个人信息风险,具体包括:
1) 应定期对参与训练、测试、微调、改进、监控或其他方式参与开发模型并可能访问训练数据的人员进行个人信息安全能力评估行个人信息安全培训和考核;
2) 应设置监督管理机制,防止因人员管理不当发生个人信息泄露;
3) 应对人工编写的问题或答案示例进行个人信息安全审查, 防止包含不必要的个人信息;
d) 若涉及使用用户输入数据进行优化训练,应满足以下要求:
1) 应征得用户同意或满足其他合法性基础,并提供用户撤销同意的渠道;
2) 数据的使用目的范围应合法、合理且必要,不应超出其声称的处理范围;
3) 宜采用经加密、去标识化或匿名化等方式处理用户数据,或采用基于同态加密、差分隐私、安全多方计算、联邦学习等隐私增强技术进行训练,避免潜在的数据和个人信息泄露风险。

评论