Google otvara kod biblioteke za obradu povjerljivih podataka

Google objavljeno izvorni kodovi biblioteke "Diferencijalna privatnost» implementacijom metoda diferencijalna privatnost, omogućavajući izvođenje statističkih operacija nad skupom podataka sa dovoljno visokom preciznošću bez mogućnosti identifikacije pojedinačnih zapisa u njemu. Kôd biblioteke je napisan u C++ i otvoren licenciran pod Apache 2.0.

Analiza korištenjem diferencijalnih metoda privatnosti omogućava organizacijama da naprave analitičke uzorke iz statističkih baza podataka, ne dozvoljavajući im da odvoje podatke i izoluju parametre određenih pojedinaca od općih informacija. Na primjer, da bi se identificirale razlike u njezi pacijenata, istraživačima se mogu pružiti informacije koje im omogućavaju da uporede prosječnu dužinu boravka pacijenata u bolnicama, ali i dalje čuvaju povjerljivost pacijenata i ne ističu informacije o pacijentima.

Predložena biblioteka uključuje implementaciju nekoliko algoritama za generisanje agregiranih statistika zasnovanih na skupovima numeričkih podataka koji uključuju povjerljive informacije. Za provjeru ispravnog rada algoritama, predviđeno je stohastička sonda. Algoritmi vam omogućavaju da izvršite operacije sumiranja, brojanja, srednje vrijednosti, standardne devijacije, disperzije i statistike poredanja podataka, uključujući određivanje minimuma, maksimuma i medijana. Takođe uključuje implementaciju Laplace mehanizam, koji se može koristiti za proračune koji nisu obuhvaćeni unaprijed definiranim algoritmima.

Biblioteka koristi modularnu arhitekturu koja vam omogućava da proširite postojeću funkcionalnost i dodate dodatne mehanizme, agregatne funkcije i kontrole nivoa privatnosti.
Zasnovan na biblioteci za PostgreSQL 11 DBMS pripremljeno proširenje sa skupom anonimnih agregatnih funkcija koje koriste različite metode privatnosti - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV i ANON_NTILE.

izvor: opennet.ru

Dodajte komentar