Google åbner bibliotekskode til fortrolig databehandling

Google опубликовала bibliotekets kildekoder "Differentiel privatliv» med implementering af metoder differentieret privatliv, der gør det muligt at udføre statistiske operationer på et datasæt med tilstrækkelig høj nøjagtighed uden mulighed for at identificere individuelle poster i det. Bibliotekskoden er skrevet i C++ og åben licenseret under Apache 2.0.

Analyse ved hjælp af differentielle privatlivsmetoder giver organisationer mulighed for at lave analytiske prøver fra statistiske databaser uden at tillade dem at adskille dataene og isolere specifikke individers parametre fra den generelle information. For at identificere forskelle i patientbehandlingen kan forskerne f.eks. forsynes med information, der giver dem mulighed for at sammenligne patienters gennemsnitlige opholdstid på hospitaler, men stadig opretholder patienthemmeligheden og ikke fremhæver patientoplysninger.

Det foreslåede bibliotek omfatter implementering af adskillige algoritmer til generering af aggregerede statistikker baseret på sæt af numeriske data, der omfatter fortrolige oplysninger. For at kontrollere den korrekte funktion af algoritmerne er den leveret stokastisk sonde. Algoritmer giver dig mulighed for at udføre summering, optælling, middelværdi, standardafvigelse, spredning og rækkefølgestatistik operationer på data, herunder bestemmelse af minimum, maksimum og median. Det omfatter også implementeringen Laplace mekanisme, som kan bruges til beregninger, der ikke er dækket af foruddefinerede algoritmer.

Biblioteket bruger en modulær arkitektur, der giver dig mulighed for at udvide eksisterende funktionalitet og tilføje yderligere mekanismer, aggregerede funktioner og kontroller på privatlivsniveau.
Baseret på biblioteket for PostgreSQL 11 DBMS forberedt udvidelse med et sæt anonyme samlede funktioner ved hjælp af differentielle privatlivsmetoder - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV og ANON_NTILE.

Kilde: opennet.ru

Tilføj en kommentar