Google odpre kodo knjižnice za zaupno obdelavo podatkov

Google objavljeno izvorne kode knjižnice "Diferencialna zasebnost» z izvajanjem metod diferencialna zasebnost, ki omogoča izvajanje statističnih operacij na nizu podatkov z dovolj visoko natančnostjo brez zmožnosti identifikacije posameznih zapisov v njem. Koda knjižnice je napisana v C++ in odprto licenciran pod Apache 2.0.

Analiza z uporabo diferencialnih metod zasebnosti omogoča organizacijam, da naredijo analitične vzorce iz statističnih baz podatkov, ne da bi jim dovolili ločevanje podatkov in izolacijo parametrov določenih posameznikov od splošnih informacij. Na primer, za ugotavljanje razlik v oskrbi pacientov lahko raziskovalci dobijo informacije, ki jim omogočajo primerjavo povprečne dolžine bivanja pacientov v bolnišnicah, vendar še vedno ohranjajo zaupnost pacientov in ne poudarjajo podatkov o pacientih.

Predlagana knjižnica vključuje implementacijo več algoritmov za generiranje agregirane statistike na podlagi nizov numeričnih podatkov, ki vključujejo zaupne informacije. Za preverjanje pravilnega delovanja algoritmov je na voljo stohastična sonda. Algoritmi vam omogočajo izvajanje seštevanja, štetja, povprečja, standardnega odklona, ​​disperzije in statističnih operacij za urejanje podatkov, vključno z določanjem minimuma, maksimuma in mediane. Vključuje tudi izvedbo Laplaceov mehanizem, ki se lahko uporablja za izračune, ki jih vnaprej določeni algoritmi ne pokrivajo.

Knjižnica uporablja modularno arhitekturo, ki vam omogoča razširitev obstoječe funkcionalnosti in dodajanje dodatnih mehanizmov, agregatnih funkcij in kontrol ravni zasebnosti.
Temelji na knjižnici za PostgreSQL 11 DBMS pripravljeno razširitev z nizom anonimnih agregatnih funkcij, ki uporabljajo metode diferencialne zasebnosti - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV in ANON_NTILE.

Vir: opennet.ru

Dodaj komentar