Η Google ανοίγει τον κωδικό της βιβλιοθήκης για εμπιστευτική επεξεργασία δεδομένων

Google опубликовала πηγαίοι κώδικες βιβλιοθήκης "Διαφορικό απόρρητο» με την εφαρμογή μεθόδων διαφορική ιδιωτικότητα, επιτρέποντας την εκτέλεση στατιστικών πράξεων σε ένα σύνολο δεδομένων με αρκετά υψηλή ακρίβεια χωρίς τη δυνατότητα αναγνώρισης μεμονωμένων εγγραφών σε αυτό. Ο κώδικας της βιβλιοθήκης είναι γραμμένος σε C++ και Άνοιξε άδεια σύμφωνα με το Apache 2.0.

Η ανάλυση με χρήση διαφορικών μεθόδων απορρήτου επιτρέπει στους οργανισμούς να κάνουν αναλυτικά δείγματα από στατιστικές βάσεις δεδομένων, χωρίς να τους επιτρέπει να διαχωρίζουν τα δεδομένα και να απομονώνουν τις παραμέτρους συγκεκριμένων ατόμων από τις γενικές πληροφορίες. Για παράδειγμα, για τον εντοπισμό διαφορών στη φροντίδα των ασθενών, οι ερευνητές μπορούν να λάβουν πληροφορίες που τους επιτρέπουν να συγκρίνουν τη μέση διάρκεια παραμονής των ασθενών στα νοσοκομεία, αλλά εξακολουθεί να διατηρεί το απόρρητο των ασθενών και να μην τονίζει τις πληροφορίες των ασθενών.

Η προτεινόμενη βιβλιοθήκη περιλαμβάνει την εφαρμογή αρκετών αλγορίθμων για τη δημιουργία συγκεντρωτικών στατιστικών που βασίζονται σε σύνολα αριθμητικών δεδομένων που περιλαμβάνουν εμπιστευτικές πληροφορίες. Για τον έλεγχο της σωστής λειτουργίας των αλγορίθμων παρέχεται στοχαστικός ανιχνευτής. Οι αλγόριθμοι σάς επιτρέπουν να εκτελείτε λειτουργίες άθροισης, μέτρησης, μέσης τιμής, τυπικής απόκλισης, διασποράς και σειράς στατιστικών στοιχείων σε δεδομένα, συμπεριλαμβανομένου του προσδιορισμού του ελάχιστου, του μέγιστου και του μέσου όρου. Περιλαμβάνει επίσης την υλοποίηση Μηχανισμός Laplace, το οποίο μπορεί να χρησιμοποιηθεί για υπολογισμούς που δεν καλύπτονται από προκαθορισμένους αλγόριθμους.

Η βιβλιοθήκη χρησιμοποιεί μια αρθρωτή αρχιτεκτονική που σας επιτρέπει να επεκτείνετε την υπάρχουσα λειτουργικότητα και να προσθέσετε πρόσθετους μηχανισμούς, συγκεντρωτικές λειτουργίες και στοιχεία ελέγχου επιπέδου απορρήτου.
Βασισμένο στη βιβλιοθήκη για PostgreSQL 11 DBMS έτοιμος επέκταση με ένα σύνολο ανώνυμων συγκεντρωτικών συναρτήσεων που χρησιμοποιούν διαφορικές μεθόδους απορρήτου - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV και ANON_NTILE.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο