Google opent bibliotheekcode voor vertrouwelijke gegevensverwerking

Google опубликовала bibliotheekbroncodes "Differentiële privacy» met de implementatie van methoden differentiële privacy, waardoor statistische bewerkingen op een dataset met voldoende hoge nauwkeurigheid kunnen worden uitgevoerd zonder de mogelijkheid om individuele records daarin te identificeren. De bibliotheekcode is geschreven in C++ en is open gelicentieerd onder Apache 2.0.

Analyse met behulp van differentiële privacymethoden stelt organisaties in staat analytische steekproeven te maken uit statistische databases, zonder dat ze de gegevens kunnen scheiden en de parameters van specifieke individuen kunnen isoleren van de algemene informatie. Om bijvoorbeeld verschillen in de patiëntenzorg te identificeren, kunnen onderzoekers informatie krijgen waarmee ze de gemiddelde verblijfsduur van patiënten in ziekenhuizen kunnen vergelijken, maar waarbij de vertrouwelijkheid van de patiënt behouden blijft en de patiëntinformatie niet wordt benadrukt.

De voorgestelde bibliotheek omvat de implementatie van verschillende algoritmen voor het genereren van geaggregeerde statistieken op basis van reeksen numerieke gegevens die vertrouwelijke informatie bevatten. Om de correcte werking van de algoritmen te controleren, wordt deze verstrekt stochastische sonde. Met algoritmen kunt u sommatie-, tel-, gemiddelde-, standaarddeviatie-, spreidings- en volgorde-statistische bewerkingen op gegevens uitvoeren, inclusief het bepalen van het minimum, maximum en de mediaan. Daar hoort ook de implementatie bij Laplace-mechanisme, die kan worden gebruikt voor berekeningen die niet onder vooraf gedefinieerde algoritmen vallen.

De bibliotheek maakt gebruik van een modulaire architectuur waarmee u de bestaande functionaliteit kunt uitbreiden en extra mechanismen, aggregatiefuncties en bedieningselementen op privacyniveau kunt toevoegen.
Gebaseerd op de bibliotheek voor PostgreSQL 11 DBMS voorbereid extensie met een reeks anonieme statistische functies die gebruik maken van verschillende privacymethoden: ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV en ANON_NTILE.

Bron: opennet.ru

Voeg een reactie