(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210700710.X
(22)申请日 2022.06.21
(65)同一申请的已公布的文献号
申请公布号 CN 114780999 A
(43)申请公布日 2022.07.22
(73)专利权人 广州中平智能科技有限公司
地址 510000 广东省广州市南沙区丰泽 东
路106号X1301-I013661
(72)发明人 郑飞州
(74)专利代理 机构 广州容大知识产权代理事务
所(普通合伙) 44326
专利代理师 刘新年
(51)Int.Cl.
G06F 21/62(2013.01)
G06N 3/04(2006.01)G06T 3/00(2006.01)
G06T 11/40(2006.01)
G06V 40/16(2022.01)
G06V 40/00(2022.01)
(56)对比文件
WO 2021204272 A1,2021.10.14
CN 113642715 A,2021.1 1.12
US 202134245 3 A1,2021.1 1.04
US 20210 64760 A1,2021.0 3.04
CN 114548373 A,202 2.05.27
审查员 刘燕
(54)发明名称
一种深度学习数据隐私保护方法、 系统、 设
备和介质
(57)摘要
本公开涉及一种深度学习数据隐私保护方
法、 系统、 设备和介质, 所述方法包括如下步骤:
加载原始训练数据集和深度学习模 型; 为原始训
练数据集中的隐私信息赋予隐私保护权重, 构建
隐私重要性矩阵; 在所述训练数据中配置全局噪
声强度和生成器参数以构建噪声生成器; 根据隐
私重要性矩 阵构建的损失函数训练所述噪声生
成器; 将原始训练数据集中的所有原始训练数据
通过噪声生成器进行加噪生 成加噪数据集; 使用
加噪数据集对所述深度学习模型进行训练以形
成具有隐私保护特性的深度学习模 型。 本公开构
建了噪声生成器的目标函数和参数训练方法, 实
现了最大化训练数据所添加的噪声强度的同时,
最小化模型性能差异, 自动地均衡模 型可行性和
隐私保护强度。
权利要求书2页 说明书10页 附图3页
CN 114780999 B
2022.09.27
CN 114780999 B
1.一种深度学习数据隐私保护方法, 其特 征在于, 包括如下步骤:
加载原始训练数据集和深度学习模型;
为原始训练数据集中的隐私信息赋予隐私保护权 重, 构建隐私重要性矩阵;
在所述训练数据中配置全局噪声强度和生成器参数以构建噪声生成器; 根据隐私重要
性矩阵构建的损失函数训练所述噪声生成器;
将原始训练数据集中的所有原 始训练数据通过噪声生成器进行加噪生成加噪数据集;
使用加噪数据集对所述深度学习模型进行训练以形成具有隐私保护特性的深度学习
模型; 根据隐私重要性矩阵构建的损失函数训练所述噪声生成器的具体步骤为:
选取所述原始训练数据集中的一组原 始训练数据特 征;
根据损失函数计算噪声生成器的损失值;
计算所述损失值对噪声生成器的参数的导数;
根据所述 导数更新噪声生成器的参数;
重复上述 步骤, 直到 达到指定的迭代次数。
2.如权利要求1所述的深度学习数据隐私保护方法, 其特征在于, 所述损失函数如下
式:
其中, F为用原始训练数据集训练而成的深度学习模型, x为所选训练数据集的特征, F
(x)指的是输入x 得到模型输出并经过softmax函数的结果, G为用参数θ构成的噪声生 成器,
G(x, θ )表示依据输入 x所生成的数据噪声, ad为全局噪声强度, Ax为隐私重要性矩阵。
3.如权利要求1所述的深度学习数据隐私保护方法, 其特征在于, 在使用加噪数据集对
所述深度学习模型进行训练之前, 还包括如下步骤: 使用原始训练数据对深度学习模型进
行训练。
4.如权利要求1或3所述的深度学习数据隐私保护方法, 其特征在于, 在将原始训练数
据集中的所有原始训练数据通过噪声生成器进行加噪生成加噪数据集之后, 还包括如下步
骤:
将所述加噪数据集中的加噪数据进行可视化, 根据加噪数据的隐私保护情况调节隐私
重要性矩阵和/或噪声生成器的参数。
5.如权利要求1或3所述的深度学习数据隐私保护方法, 其特征在于, 构建隐私重要性
矩阵的具体步骤如下:
通过标记全局重点隐私保护的原始训练数据的特征或属性中的权重来构建隐私重要
性矩阵;
或, 手动对原始训练数据中的部分重点区域赋予隐私保护权重, 来构建出相应的隐私
重要性矩阵。
6.一种深度学习数据隐私保护系统, 其特 征在于, 包括:
资源加载模块, 加载原 始训练数据集和深度学习模型;
隐私重要性配置模块, 为原始训练数据集中的隐私信息赋予隐私保护权重, 构建隐私
重要性矩阵;
噪声生成器构建模块, 在所述训练数据中配置全局噪声强度和生成器参数以构建噪声权 利 要 求 书 1/2 页
2
CN 114780999 B
2生成器; 根据隐私 重要性矩阵构建的损失函数训练所述噪声生成器所述噪声生成器具体包
括: 选取所述原始训练数据集中的一组原始训练数据特征; 根据损失函数计算噪声生成器
的损失值; 计算所述损失值对噪声生成器的参数 的导数; 根据所述导数更新噪声生成器的
参数直到 达到指定的迭代次数;
数据转换模块, 将原始训练数据集中的所有原始训练数据通过 噪声生成器进行加噪生
成加噪数据集;
模型构建模块, 使用加噪数据集对所述深度 学习模型进行训练以形成具有隐私保护特
性的深度学习模型。
7.如权利要求6所述的深度学习数据隐私保护系统, 其特征在于, 所述系统还包括数据
可视化模块, 所述数据可视化模块用于将加噪数据集中的加噪数据进行可视化, 根据加噪
数据的隐私保护情况调节隐私重要性矩阵和/或噪声生成器的参数。
8.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算
机程序, 其特征在于, 所述处理器执行所述计算机程序时实现权利要求1至5任一项所述的
深度学习数据隐私保护方法。
9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理器
执行时实现权利要求1至 5任一项所述的深度学习数据隐私保护方法的步骤。权 利 要 求 书 2/2 页
3
CN 114780999 B
3
专利 一种深度学习数据隐私保护方法、系统、设备和介质
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:38:36上传分享