Google atver bibliotēkas kodu konfidenciālu datu apstrādei

Google опубликовала bibliotēkas pirmkodi "Diferenciālā privātums» ar metožu ieviešanu atšķirīgu privātumu, kas ļauj ar pietiekami augstu precizitāti veikt statistiskās operācijas ar datu kopu bez iespējas identificēt tajā atsevišķus ierakstus. Bibliotēkas kods ir rakstīts C++ un ir atvērts licencēts saskaņā ar Apache 2.0.

Analīze, izmantojot atšķirīgas privātuma metodes, ļauj organizācijām veidot analītiskos paraugus no statistikas datu bāzēm, neļaujot tām nodalīt datus un izolēt konkrētu personu parametrus no vispārējās informācijas. Piemēram, lai identificētu atšķirības pacientu aprūpē, pētniekiem var sniegt informāciju, kas ļauj salīdzināt pacientu vidējo uzturēšanās ilgumu slimnīcās, tomēr saglabā pacientu konfidencialitāti un neizceļ pacienta informāciju.

Piedāvātā bibliotēka ietver vairāku algoritmu ieviešanu apkopotas statistikas ģenerēšanai, pamatojoties uz skaitlisko datu kopām, kas ietver konfidenciālu informāciju. Lai pārbaudītu pareizu algoritmu darbību, tas tiek nodrošināts stohastiskā zonde. Algoritmi ļauj veikt datu summēšanas, skaitīšanas, vidējās, standarta novirzes, dispersijas un secības statistikas darbības, tostarp noteikt minimālo, maksimālo un mediānu. Tas ietver arī ieviešanu Laplasa mehānisms, ko var izmantot aprēķiniem, uz kuriem neattiecas iepriekš noteikti algoritmi.

Bibliotēka izmanto modulāru arhitektūru, kas ļauj paplašināt esošo funkcionalitāti un pievienot papildu mehānismus, apkopotas funkcijas un privātuma līmeņa vadīklas.
Balstīts uz PostgreSQL 11 DBVS bibliotēku sagatavots paplašinājums ar anonīmu apkopojošu funkciju kopu, izmantojot atšķirīgas konfidencialitātes metodes — ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV un ANON_NTILE.

Avots: opennet.ru

Pievieno komentāru