Google öffnet Bibliothekscode für vertrauliche Datenverarbeitung

Google опубликовала Quellcodes der Bibliothek "Differenzielle Privatsphäre» bei der Implementierung von Methoden unterschiedliche PrivatsphäreDies ermöglicht die Durchführung statistischer Operationen an einem Datensatz mit ausreichend hoher Genauigkeit, ohne dass einzelne Datensätze darin identifiziert werden können. Der Bibliothekscode ist in C++ geschrieben und ist offen lizenziert unter Apache 2.0.

Die Analyse mithilfe differenzieller Datenschutzmethoden ermöglicht es Organisationen, analytische Stichproben aus statistischen Datenbanken zu ziehen, ohne dass sie die Daten trennen und die Parameter bestimmter Personen von den allgemeinen Informationen isolieren müssen. Um beispielsweise Unterschiede in der Patientenversorgung zu erkennen, können Forschern Informationen zur Verfügung gestellt werden, die es ihnen ermöglichen, die durchschnittliche Verweildauer von Patienten in Krankenhäusern zu vergleichen, aber dennoch die Vertraulichkeit der Patienten zu wahren und Patienteninformationen nicht hervorzuheben.

Die vorgeschlagene Bibliothek umfasst die Implementierung mehrerer Algorithmen zur Generierung aggregierter Statistiken auf der Grundlage numerischer Datensätze, die vertrauliche Informationen enthalten. Um die korrekte Funktion der Algorithmen zu überprüfen, wird diese bereitgestellt Stochastische Sonde. Mit Algorithmen können Sie Summations-, Zähl-, Mittelwert-, Standardabweichungs-, Streuungs- und Ordnungsstatistikoperationen für Daten durchführen, einschließlich der Bestimmung von Minimum, Maximum und Median. Dazu gehört auch die Umsetzung Laplace-Mechanismus, die für Berechnungen verwendet werden kann, die nicht durch vordefinierte Algorithmen abgedeckt werden.

Die Bibliothek verwendet eine modulare Architektur, die es Ihnen ermöglicht, vorhandene Funktionen zu erweitern und zusätzliche Mechanismen, Aggregatfunktionen und Datenschutzebenenkontrollen hinzuzufügen.
Basierend auf der Bibliothek für PostgreSQL 11 DBMS vorbereitet Erweiterung mit einer Reihe anonymer Aggregatfunktionen unter Verwendung differenzieller Datenschutzmethoden – ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV und ANON_NTILE.

Source: opennet.ru

Kommentar hinzufügen