Google ouvre le code de la bibliothèque pour le traitement des données confidentielles

Google опубликовала codes sources de la bibliothèque "Confidentialité différentielle» avec la mise en place de méthodes confidentialité différentielle, permettant d'effectuer des opérations statistiques sur un ensemble de données avec une précision suffisamment élevée sans possibilité d'y identifier des enregistrements individuels. Le code de la bibliothèque est écrit en C++ et est ouvert sous licence Apache 2.0.

L'analyse utilisant des méthodes de confidentialité différentielles permet aux organisations de réaliser des échantillons analytiques à partir de bases de données statistiques, sans leur permettre de séparer les données et d'isoler les paramètres d'individus spécifiques des informations générales. Par exemple, pour identifier les différences dans les soins aux patients, les chercheurs peuvent recevoir des informations qui leur permettent de comparer la durée moyenne de séjour des patients dans les hôpitaux, tout en préservant la confidentialité des patients et en ne mettant pas en évidence les informations sur les patients.

La bibliothèque proposée comprend la mise en œuvre de plusieurs algorithmes pour générer des statistiques agrégées basées sur des ensembles de données numériques comprenant des informations confidentielles. Pour vérifier le bon fonctionnement des algorithmes, il est prévu sonde stochastique. Les algorithmes vous permettent d'effectuer des opérations statistiques de sommation, de comptage, de moyenne, d'écart type, de dispersion et d'ordre sur les données, y compris la détermination du minimum, du maximum et de la médiane. Cela comprend également la mise en œuvre Mécanisme de Laplace, qui peut être utilisé pour des calculs non couverts par des algorithmes prédéfinis.

La bibliothèque utilise une architecture modulaire qui vous permet d'étendre les fonctionnalités existantes et d'ajouter des mécanismes supplémentaires, des fonctions d'agrégation et des contrôles de niveau de confidentialité.
Basé sur la bibliothèque pour le SGBD PostgreSQL 11 préparé extension avec un ensemble de fonctions d'agrégation anonymes utilisant des méthodes de confidentialité différentielles - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV et ANON_NTILE.

Source: opennet.ru

Ajouter un commentaire