Google het die biblioteekkode oopgemaak vir vertroulike dataverwerking

Google gepubliseer biblioteek bronkodeDifferensiële privaatheid» met die implementering van metodes differensiële privaatheid, wat toelaat om statistiese bewerkings op 'n datastel uit te voer met 'n voldoende hoë akkuraatheid sonder die moontlikheid om individuele rekords daarin te identifiseer. Die biblioteekkode is geskryf in C++ en is oop gelisensieer onder Apache 2.0.

Ontleding deur gebruik te maak van differensiële privaatheidsmetodes stel organisasies in staat om analitiese monsters uit statistiese databasisse te produseer, sonder dat data verdeel word en die parameters van spesifieke individue uit die algemene inligting onttrek word. Om byvoorbeeld verskille in pasiëntsorg te identifiseer, kan navorsers voorsien word van inligting wat vergelyking van die gemiddelde hoeveelheid tyd wat pasiënte in hospitale deurbring moontlik maak, terwyl die vertroulikheid van pasiënte gehandhaaf word en nie identifikasie van inligting oor hulle moontlik gemaak word nie.

Die voorgestelde biblioteek sluit die implementering van verskeie algoritmes in vir die generering van saamgestelde statistieke gebaseer op numeriese datastelle wat vertroulike inligting insluit. Om die korrektheid van die algoritmes na te gaan, word dit verskaf stogastiese sonde. Die algoritmes laat jou toe om opsomming, tel, berekening van gemiddeldes, standaardafwyking, variansie en volgordestatistieke op data uit te voer, insluitend die bepaling van die minimum, maksimum en mediaan. Die implementering is ook ingesluit Laplace meganisme, wat gebruik kan word vir berekeninge wat nie deur vooraf gedefinieerde algoritmes gedek word nie.

Die biblioteek gebruik 'n modulêre argitektuur wat jou toelaat om die bestaande funksionaliteit uit te brei en bykomende meganismes, totale funksies en privaatheidskontroles by te voeg.
Gebaseer op die biblioteek vir PostgreSQL 11 DBMS voorberei uitbreiding met 'n stel anonieme saamgevoegde funksies wat differensiële privaatheidsmetodes gebruik - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV en ANON_NTILE.

Bron: opennet.ru

Voeg 'n opmerking