谷歌開放庫代碼用於機密資料處理

谷歌 опубликовала 庫原始碼“差異隱私» 方法的實施 差別隱私,允許以足夠高的精度對資料集執行統計操作,而無需識別其中的單一記錄。 函式庫程式碼是用 C++ 寫的 是開放的 在 Apache 2.0 下獲得許可。

使用差異隱私方法進行分析可讓組織從統計資料庫中製作分析樣本,而無需將資料分開並將特定個人的參數與一般資訊隔離。 例如,為了識別患者護理方面的差異,可以向研究人員提供信息,使他們能夠比較患者在醫院的平均住院時間,但仍然保持患者機密並且不突出患者信息。

所提出的庫包括多種演算法的實現,用於根據包含機密資訊的數值資料集產生聚合統計資料。 為了檢查演算法的正確運行,提供了 隨機探針。 演算法可讓您對資料執行求和、計數、平均值、標準差、離差和順序統計操作,包括確定最小值、最大值和中位數。 它還包括實施 拉普拉斯機制,可用於預定義演算法未涵蓋的計算。

該程式庫使用模組化架構,可讓您擴展現有功能並添加其他機制、聚合函數和隱私等級控制。
基於 PostgreSQL 11 DBMS 函式庫 準備好的 使用差異隱私方法(ANON_COUNT、ANON_SUM、ANON_AVG、ANON_VAR、ANON_STDDEV 和 ANON_NTILE)使用一組匿名聚合函數進行擴充。

來源: opennet.ru

添加評論