手机站:/m

香港服务器_阿淘客app源码-里云python_优惠券

时间:2021-09-08 13:30编辑:淘客樊里来源:淘客樊里当前位置:主页 > 云存储 >

众所周知,数据收集是世界上一些最大公司的重点和货币化基础。此外,机器学习解决方案的部署越来越多,它们需要大量的训练数据。然而,这类有价值的数据包含敏感的、个人可识别的信息,例如卫生统计、遥测和行为数据、生物特征信息、金融交易等,它们需要特殊处理,根据最近的数据保护立法,如全球数据保护法,很难收集或共享。更为复杂的是,品高云,有价值的数据仍然隐藏在不同机构和公司的分布式数据仓库中,这些机构和公司不能也不想合并他们的敏感数据。

但是,在确保隐私的情况下,合并这些分布式数据可以获得整体见解。一些真实世界的隐私保护用例可以在政府机构中找到,例如。,通过使用不同政府机构(否则无法合作)的数据来发现税务欺诈,或者通过确保雇主能够安全地参与此类研究来调查工资差距。像谷歌和万事达这样的大公司已经将在线广告与线下购买联系起来,以实现聚合广告转换。然而,这些示例大多支持简单的聚合统计(例如,总和、平均值),而不支持更复杂的顺序统计(例如,最大值、中位数),并且只保护输入,而不为输出提供额外的隐私保证。

为了增加潜在的用例,并解锁和合并隐藏在数据仓库中的更多数据,需要回答以下问题:

如何扩展和改进协作分析,以支持数据驱动的创新,淘客引流,同时保护基本隐私权?

现有的协同分析解决方案主要集中在聚合统计上,比如私有价值的总和。非正式地说,这类解决方案的工作原理是安全地将所有私人价值添加到一起,从而使个人贡献更难找到("隐藏在人群中"),从而提供一些非正式(而且不充分)的隐私保护。改进的解决方案,满足正式的隐私保证,也增加了噪音的总和。

但事情变得更复杂,如果我们考虑顺序统计,因为人们需要知道每个元素在排序数据中的位置(顺序),结果是一个私人输入值,而不是一些聚合。顺序统计是一种稳健且通用的度量方法,包括最小值和最大值、四分位间距(IQR)和中位数。

SAP安全研究人员Jonas Boehler和滑铁卢大学的Florian Kerschbaum教授研究了如何在分布式数据上实现隐私保护顺序统计,同时保护输入和输出。他们的工作考虑了一般顺序统计,但目前让我们关注中位数,它是排序数据集中的中间元素:

中位数是一个重要的稳健统计指标,代表了数据中的"典型"值:保险公司使用平均预期寿命来调整保险费和财务状况调查报告收入中位数,因为它对异常值的鲁棒性高于平均值。为了说明为什么离群值对平均值产生了巨大的影响,而不是中间值,手机网站建站,让我们看看华盛顿州麦地那的收入。西雅图附近的一个小郊区,亚马逊和微软总部所在地,人口约3000。平均收入约为18.6万美元。然而,平均收入超过了1000000000美元。为什么?由于麦地那只有两个离群者:杰夫·贝佐斯和比尔·盖茨。

现有的隐私保护中位数计算研究依赖于一个额外的可信第三方,家居智能化系统价格,该第三方可以访问明文规定的组合数据。然而,这样一个可信的第三方是一个单一的攻击点,可能无法解决所有的监管问题。

另一种选择是安全计算,它使用加密技术来保护敏感、秘密的输入,并且只显示计算的确切输出,即提供"输入保密"。不幸的是,一些计算的输出,如顺序统计,是一个人的私人输入。因此,了解确切的结果已经泄露了私人信息,并且没有隐私保护。

有一些解决方案提供"输出隐私",满足称为"差异隐私"的强大隐私保障。然而,这些解决方案还需要一个可信的第三方或多次随机(例如,每一方添加随机噪声),这降低了计算输出的准确性。

Böhler和Kerschbaum提出了一种混合解决方案,为双方提供高精度的输入保密和输出保密。他们的研究论文"安全次线性时差私有中值计算"发表在网络和分布式系统安全研讨会(NDSS)上,于2020年2月在圣地亚哥举行。

该研究是在正在进行的欧盟项目MOSAICrOWN("多所有者数据共享,用于分析和集成,尊重机密性和所有者控制")的过程中完成的,它"旨在以保护隐私的方式实现多所有者场景中的数据共享和协作分析"。

其思想是结合不同的加密技术来有效地计算不同的私有中值。他们的隐私保护协议通过尽可能少地使用密码工具进行计算和采用静态(即数据独立)访问模式的动态规划来优化,从而降低了安全计算的复杂性。通过对具有数百万条记录的大型真实支付数据集进行综合评估,可在局域网中实现小于500毫秒的实际运行时间,在法兰克福和俄亥俄州的各方网络中实现小于7秒的实际运行时间(100毫秒延迟和100 Mbit/s带宽)。

上一篇云数据库_注册企业管理平台软件-域名服务器_测评

下一篇大带宽_佛山建设企业应用管理-企业网站_哪家好

云市场知识本月排行

云市场知识精选