Google、機密データ処理用のライブラリコードを公開

グーグル опубликовала ライブラリのソースコード」差分プライバシー» メソッドの実装 差分プライバシーこれにより、データセット内の個々のレコードを識別することなく、十分に高い精度でデータセットに対して統計操作を実行できるようになります。 ライブラリのコードは C++ で書かれており、 開いている Apache 2.0 に基づいてライセンスされています。

差分プライバシー手法を使用した分析により、組織はデータを分離したり、一般情報から特定の個人のパラメーターを分離したりすることなく、統計データベースから分析サンプルを作成できます。 たとえば、患者ケアの違いを特定するために、患者の平均在院日数を比較できる情報を研究者に提供できますが、それでも患者の機密性は維持され、患者情報は強調されません。

提案されたライブラリには、機密情報を含む数値データのセットに基づいて集計統計を生成するためのいくつかのアルゴリズムの実装が含まれています。 アルゴリズムの正しい動作を確認するために、次のものが提供されています。 確率的プローブ。 アルゴリズムを使用すると、最小値、最大値、中央値の決定など、データの合計、カウント、平均、標準偏差、分散、順序統計操作を実行できます。 実装も含まれます ラプラス機構、事前定義されたアルゴリズムではカバーされない計算に使用できます。

このライブラリは、既存の機能を拡張し、追加のメカニズム、集約関数、およびプライバシー レベルの制御を追加できるモジュラー アーキテクチャを使用しています。
PostgreSQL 11 DBMS のライブラリに基づく 準備した 差分プライバシー方式 (ANON_COUNT、ANON_SUM、ANON_AVG、ANON_VAR、ANON_STDDEV、ANON_NTILE) を使用した一連の匿名集計関数による拡張機能。

出所: オープンネット.ru

コメントを追加します