多方安全计算:隐私保护集合求交技术

作者 : 开心源码 本文共1590个字,预计阅读时间需要4分钟 发布时间: 2022-05-14 共169人阅读

摘要:PSI全称隐私保护集合交集(Private Set Intersection, PSI),是指持有数据的两方能够计算得到双方数据集合的交集部分,而不暴露交集以外的任何数据集合信息。

本文分享自华为云社区《浅谈PSI隐私集合求交》,原文作者:tics神奇海螺 。

1、简介

PSI全称隐私保护集合交集(Private Set Intersection, PSI),是指持有数据的两方能够计算得到双方数据集合的交集部分,而不暴露交集以外的任何数据集合信息。

PSI通常具备以下三个特点:

1.半可信场景:数据双方不愿意暴露所有数据,仅希望求得数据集合交集

2.数据最小化:除了数据集合交集以外的数据不能泄露给任意一方

3.安全双方计算:参加计算的双方需要共同实现一套安全的计算协议,以保证数据的安全性。

PSI有多种实现方式,以下是少量常见的实现方式及复杂度。

2、简单案例

根据两方选择的数据和唯一标识数据的字段(可以了解为主键,例如id、身份证、手机号),找到两方数据集共有的记录,并按一样的顺序排列存储为对齐结果。

例如:A、B两方有两张表a和b,分别为

表a 人员存款表:

表b 消费汇总表:

双方通过身份证字段进行PSI,计算出最后共有的记录是标红的三条,结果如下:

在此过程中,A方不希望B方知道交集数据的银行卡存款,B方也不希望A方知道交集数据的年消费额等数据,同时A方也不该知道B方还有“01234”身份证的客户,反之亦然。双方应该只知道结果中的身份证是数据集合的交集。

3、技术原理

以下简单详情一下使用伪随机函数实现的PSI。

假设有两方A、B,分别有X、Y数据id集合。

1.H()是指A、B双方对自己的数据id集合做一次hash,确保两方PSI计算数据等长

2.B方使用伪随机函数生成的随机因子r,乘以自己的H(Y),并发给A方

3.A方使用伪随机函数生成的密钥k,分别乘以自己的H(X)和B方发送过来的B1得到A和B2,再把两个计算结果都发送给B方

4.B方在使用随机因子r的逆r-1乘以B2,消去随机因子r,得到B

5.A和B使用相同的密钥k加密,就可进行密文比较计算交集。

4、应用场景

计算广告的实际效果

线上广告是一种重要的广告形式。对于广告的有效程度的衡量的常见方法是计算所谓的转换率,也就是浏览广告的客户中有多少客户最终浏览了相应的商品页面,或者是最终购买了相应的商品或者是服务。一种通用的计算方法是由计算浏览广告的客户信息(由广告发送方占有)和完成相应交易的客户信息(由商家占有)的交集来计算(如计算交易总额或者是总交易量等)。

寻觅联络人

当一个客户注册使用一种新的服务(如微信、Whatsapp 等)的时候,从客户的现有联络人中寻觅有哪些已经注册了同类的服务是一种在大多数情况下十分必要的操作。通过将客户的联络人发送给服务提供商可以有效地完成这项功能,但是与此同时客户的联络人信息,一种在大多数情况下被认为是隐私的信息,也被暴露给服务提供商了。因而在这种场景下,将客户的联络人信息作为一方的输入,将服务提供商的所有客户信息作为另一方的输入来进行PSI 协议可以完成发现联络人的功能,而且可以防止交集以外的信息泄露给任何一方。

联邦学习样本对齐

在联邦学习发起训练之前,必需基于双方的数据进行PSI,使用双方共有的客户信息(例如客户ID)找出交集,从而对应两方数据的特征和标签,在对齐的数据集上进行模型训练才有意义。

5、参考

1)隐私保护集合求交技术PSI — 晓鹿(https://blog.alienx.cn/2020/10/10/E10101535/)

2)崔泓睿,刘天怡,郁昱,程越强,张煜龙,韦韬:多方安全计算热点-隐私保护集合求交技术(PSI)分析研究报告 (https://anquan.baidu.com/upload/ue/file/20190814/1565763561975581.pdf)

说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » 多方安全计算:隐私保护集合求交技术

发表回复