(19)国家知识产权局 (12)发明 专利 (10)授权公告 号 (45)授权公告日 (21)申请 号 202210702081.4 (22)申请日 2022.06.21 (65)同一申请的已公布的文献号 申请公布号 CN 114781000 A (43)申请公布日 2022.07.22 (73)专利权人 支付宝 (杭州) 信息技 术有限公司 地址 310000 浙江省杭州市西湖区西溪路 556号8层B段801-1 1 (72)发明人 刘颖婷 王力  (74)专利代理 机构 北京亿腾知识产权代理事务 所(普通合伙) 11309 专利代理师 陈霁 周良玉 (51)Int.Cl. G06F 21/62(2013.01) G06F 17/16(2006.01)G06F 17/18(2006.01) (56)对比文件 CN 112818290 A,2021.0 5.18 EP 3970074 A1,202 2.03.23 CN 113407988 A,2021.09.17 常悦.基于联邦学习的大 数据风控 模型. 《硕 士电子期刊》 .202 2, 叶青青等.本地 化差分隐私研究综述. 《软件 学报》 .2017,(第07期), Moon etc..Secure Multi-party Computati on of cor relation coefficients. 《Journal of KI ISE》 .2014, 马敏耀.安全 多方计算的一些研究进 展. 《中 国新通信》 .2020,(第18 期), 审查员 岳孟果 (54)发明名称 针对大规模数据的对象特征之间相关性的 确定方法及装置 (57)摘要 本说明书实施例提供了一种针对大规模数 据的对象特征之间相关性的确定方法及装置。 多 方联合利用多方安全计算检测样本特征是否符 合正态分布, 当符合时, 各方联合对样本进行安 全标准化, 之后进行随机采样, 并对大规模数据 进行选取, 进而得到特征采样分片, 然后各方利 用多方安全计算相关技术, 基于各方的采样分片 确定特征之间的皮尔逊积矩相关系数。 当检测出 样本特征不符合正态分布时, 参与方对 特征矩阵 中的特征值进行排序, 并采用序号值分片代替特 征值分片, 接着进行随机采样, 进一步得到排序 数据的采样分片。 然后, 各方利用多方安全计算 相关技术, 基于各方的采样分片确定特征之间的 斯皮尔曼等级相关系数。 整个处理过程对隐私数 据进行了保护。 权利要求书3页 说明书21页 附图4页 CN 114781000 B 2022.09.20 CN 114781000 B 1.一种针对大规模数据的对象特征之间相关性的确定方法, 待确定相关性的特征矩阵 包括第一参与方和 第二参与方分别持有的特征矩阵, 不同的特征矩阵包含相同业务对象的 不同特征的特征值; 所述方法通过第一 参与方执行, 包括: 当所述待确定相关性的特征矩阵不符合正态分布时, 对所述第 一参与方的特征矩阵中 的特征值进 行排序, 并采用序号值代 替对应的特征值, 得到所述第一参与方的排序分片; 其 中, 当多个参与方的特征矩阵中至少存在一个不符合正态分布的特征时, 确定所述待确定 相关性的特 征矩阵不符合 正态分布; 与所述第二参与 方联合对所述业务对象进行安全采样, 并基于采样结果和所述第 一参 与方的排序分片确定所述第一 参与方的采样分片; 利用基于多方安全计算的矩阵乘法, 基于所述第 一参与方的采样分片和所述第 二参与 方的采样分片, 确定所述待确定相关性的特征矩阵中特征之间属于所述第一参与方的相关 性系数分片, 以用于与所述第二 参与方的相关性系数分片合成完整的相关性系数; 其中, 所述第 二参与方的采样分片基于所述采样结果和所述第 二参与方的排序分片确 定, 所述第二参与方 的排序分片通过对所述第二参与方的特征矩阵中的特征值进行排序, 并采用序号 值代替对应的特 征值而得到 。 2.根据权利要求1所述的方法, 所述方法还 包括: 当所述待确定相关性的特征矩阵符合正态分布时, 对自身持有的特征矩阵进行标准 化, 得到所述第一 参与方的标准 化分片; 与所述第二参与 方联合对所述业务对象进行安全采样, 并基于采样结果从所述第 一参 与方的标准化分片中得到采样分片, 返回执行所述确定所述待确定相关性的特征矩阵中特 征之间属于所述第一 参与方的相关性系数分片的步骤。 3.根据权利要求1所述的方法, 其中还包括采用以下方式确定所述待确定相关性的特 征矩阵是否符合 正态分布: 当确定所述第 一参与方的特征矩阵中存在不符合正态分布的特征时, 确定所述待确定 相关性的特 征矩阵不符合 正态分布。 4.根据权利要求3所述的方法, 其中还 包括: 当确定所述第 一参与方的特征矩阵中的特征都符合正态分布时, 获取用于表征所述第 二参与方的特 征矩阵中是否存在不符合 正态分布的特 征的结果; 当所述结果表明所述第 二参与方的特征矩阵中存在不符合正态分布的特征时, 确定所 述待确定相关性的特 征矩阵不符合 正态分布。 5.根据权利要求3所述的方法, 其中还包括采用以下方式确定所述第一参与方的特征 矩阵中是否存在不符合 正态分布的特 征: 基于所述第 一参与方的特征矩阵中第 i特征的多个特征值, 确定所述第 i特征的偏度值 和峰度值; 基于所述偏度值和峰度值, 确定所述第i特 征是否符合 正态分布。 6.根据权利要求5所述的方法, 所述确定所述第i特 征是否符合 正态分布的步骤, 包括: 当所述偏度值处于第一预设范围中, 且所述峰度值处于第二预设范围中时, 确定所述 第i特征符合正态分布。 7.根据权利要求1所述的方法, 所述确定所述待确定相关性的特征矩阵中特征之间属权 利 要 求 书 1/3 页 2 CN 114781000 B 2于所述第一 参与方的相关性系数分片的步骤, 包括: 利用基于多方安全计算的矩阵乘法, 基于所述第 一参与方的采样分片和所述第 二参与 方的采样分片, 确定协方差矩阵的协方差 分片; 其中, 所述协方差矩阵基于采样联合矩阵得 到; 各方的采样分片在假定相拼接的情况下构成所述采样联合矩阵; 各方的协方差分片在 假定重构的情况 下构成所述协方差矩阵; 基于所述第一参与方的协方差分片、 采样分片以及所述第二参与方的采样分片, 利用 基于多方安全计算的矩阵乘法, 确定所述第一 参与方的相关性系数分片。 8.一种针对大规模数据的对象特征之间相关性的确定方法, 待确定相关性的特征矩阵 包括第一参与方和 第二参与方分别持有的特征矩阵, 不同的特征矩阵包含不同业务对象的 相同特征的特征值; 所述方法通过第一 参与方执行, 包括: 当所述待确定相关性的特征矩阵不符合正态分布时, 利用多方安全计算, 不同参与方 联合对各方特征矩阵中的特征值进行安全排序, 并采用序号值分片代替对应的特征值分 片, 使得不同参与方分别得到各自的排序分片; 其中, 当多个参与方的特征矩阵中至少存在 一个不符合 正态分布的特 征时, 确定所述待确定相关性的特 征矩阵不符合 正态分布; 对业务对象进行采样, 并基于采样结果和所述第 一参与方的排序分片确定所述第 一参 与方的采样分片; 利用多方安全计算, 基于所述第一参与方的采样分片和所述第二参与方的采样分片, 确定所述待确定相关性的特征矩阵中特征之间属于所述第一参与方的相关性系数分片, 以 用于与所述第二参与方的相关性系 数分片合成完整的相关性系 数; 其中, 所述第二参与方 的采样分片基于采样结果和所述第二 参与方的排序分片确定 。 9.根据权利要求8所述的方法, 所述方法还 包括: 当所述待确定相关性的特征矩阵符合正态分布时, 利用秘密分享加法和乘法, 与所述 第二参与方联合对特 征矩阵进行 标准化, 得到各参与方的标准 化分片; 对业务对象进行采样, 并基于采样结果和所述第 一参与方的标准化分片确定所述第 一 参与方的采样分片, 返回执行所述确定所述待确定相关性的特征矩阵中特征之 间属于所述 第一参与方的相关性系数分片的步骤。 10.根据权利要求8所述的方法, 其中还包括采用以下方式确定所述待确定相关性的特 征矩阵是否符合 正态分布: 利用多方安全计算, 不同参与方基于各自的特征矩阵, 确定特征联合矩阵中是否存在 不符合正态分布的特 征; 各方的特征矩阵在假定相拼接的情况 下构成所述特 征联合矩阵; 如果存在, 则确定所述待确定相关性的特 征矩阵不符合 正态分布。 11.根据权利要求10所述的方法, 所述确定特征联合矩阵中是否存在不符合正态分布 的特征的步骤, 包括: 基于各参与 方的特征矩阵中第 i特征的多个特征值, 利用秘密分享加法和乘法, 各参与 方联合确定所述第i特 征的偏度值和峰度值; 基于所述偏度值和峰度值, 确定所述第i特 征是否符合 正态分布。 12.根据权利要求8所述的方法, 所述确定所述待确定相关性的特征矩阵中特征之间属 于所述第一 参与方的相关性系数分片的步骤, 包括: 基于所述第 一参与方的采样分片, 确定协方差矩阵的协方差分片; 其中, 所述协方差矩权 利 要 求 书 2/3 页 3 CN 114781000 B 3

PDF文档 专利 针对大规模数据的对象特征之间相关性的确定方法及装置

文档预览
中文文档 29 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共29页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 针对大规模数据的对象特征之间相关性的确定方法及装置 第 1 页 专利 针对大规模数据的对象特征之间相关性的确定方法及装置 第 2 页 专利 针对大规模数据的对象特征之间相关性的确定方法及装置 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-07 12:38:35上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。