Google otvara kod knjižnice za povjerljivu obradu podataka

Google опубликовала izvorni kodovi knjižnice "Diferencijalna privatnost» uz provedbu metoda diferencijalna privatnost, omogućujući izvođenje statističkih operacija na skupu podataka s dovoljno visokom točnošću bez mogućnosti identificiranja pojedinačnih zapisa u njemu. Kod knjižnice napisan je u C++ i otvoren licenciran pod Apache 2.0.

Analiza pomoću metoda diferencijalne privatnosti omogućuje organizacijama izradu analitičkih uzoraka iz statističkih baza podataka, ne dopuštajući im da odvoje podatke i izoliraju parametre određenih pojedinaca od općih informacija. Na primjer, kako bi se identificirale razlike u skrbi za pacijente, istraživačima se mogu pružiti informacije koje im omogućuju usporedbu prosječne duljine boravka pacijenata u bolnicama, ali i dalje održavaju povjerljivost pacijenata i ne ističu informacije o pacijentima.

Predložena biblioteka uključuje implementaciju nekoliko algoritama za generiranje agregirane statistike na temelju skupova numeričkih podataka koji uključuju povjerljive informacije. Da biste provjerili ispravan rad algoritama, postoji stohastička sonda. Algoritmi vam omogućuju izvođenje operacija zbrajanja, brojanja, srednje vrijednosti, standardne devijacije, disperzije i statistike reda podataka, uključujući određivanje minimuma, maksimuma i medijana. To također uključuje implementaciju Laplaceov mehanizam, koji se može koristiti za izračune koji nisu pokriveni unaprijed definiranim algoritmima.

Knjižnica koristi modularnu arhitekturu koja vam omogućuje proširenje postojeće funkcionalnosti i dodavanje dodatnih mehanizama, skupnih funkcija i kontrola razine privatnosti.
Temeljeno na biblioteci za PostgreSQL 11 DBMS pripremljeni proširenje sa skupom anonimnih agregatnih funkcija koje koriste metode diferencijalne privatnosti - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV i ANON_NTILE.

Izvor: opennet.ru

Dodajte komentar