谷歌开放了机密数据处理的库代码

谷歌 опубликовала 库源代码差异隐私» 方法的实施 差别隐私,允许以足够高的精度对数据集执行统计操作,而无需识别其中的单个记录。 库代码是用 C++ 编写的 是开放的 在 Apache 2.0 下获得许可。

使用差异隐私方法进行分析使组织能够从统计数据库中生成分析样本,而无需分割数据并从一般信息中提取特定个人的参数。 例如,为了识别患者护理方面的差异,可以向研究人员提供信息,以便比较患者在医院花费的平均时间,同时保持患者的机密性并且不允许识别有关他们的信息。

所提出的库包括多种算法的实现,用于基于包含机密信息的数值数据集生成聚合统计数据。 为了检查算法的正确性,提供了 随机探针。 算法允许您对数据执行求和、计数、计算平均值、标准差、方差和顺序统计,包括确定最小值、最大值和中值。 还包括实施 拉普拉斯机制,可用于预定义算法未涵盖的计算。

该库使用模块化架构,允许您扩展现有功能并添加额外的机制、聚合函数和隐私控制。
基于 PostgreSQL 11 DBMS 库 准备好了 使用差异隐私方法(ANON_COUNT、ANON_SUM、ANON_AVG、ANON_VAR、ANON_STDDEV 和 ANON_NTILE)使用一组匿名聚合函数进行扩展。

来源: opennet.ru

添加评论