„Google“ atidaro bibliotekos kodą konfidencialiems duomenims apdoroti

Google опубликовала bibliotekos šaltinio kodai "Diferencinis privatumas» su metodų įgyvendinimu diferencijuotas privatumas, leidžianti pakankamai tiksliai atlikti statistines duomenų rinkinio operacijas, neturint galimybės identifikuoti atskirų įrašų joje. Bibliotekos kodas parašytas C++ ir atviras licencijuota pagal Apache 2.0.

Analizė naudojant skirtingus privatumo metodus leidžia organizacijoms daryti analitinius pavyzdžius iš statistinių duomenų bazių, neleidžiant atskirti duomenų ir atskirti konkrečių asmenų parametrus nuo bendros informacijos. Pavyzdžiui, siekiant nustatyti pacientų priežiūros skirtumus, tyrėjams gali būti pateikta informacija, leidžianti palyginti vidutinę pacientų buvimo ligoninėse trukmę, tačiau vis tiek išlaikomas pacientų konfidencialumas ir neišryškinama paciento informacija.

Siūloma biblioteka apima kelių algoritmų, skirtų generuoti agreguotą statistiką, pagrįstą skaitmeninių duomenų rinkiniais, apimančiais konfidencialią informaciją, įgyvendinimą. Norint patikrinti teisingą algoritmų veikimą, jis pateikiamas stochastinis zondas. Algoritmai leidžia atlikti sumavimo, skaičiavimo, vidurkio, standartinio nuokrypio, sklaidos ir eilės statistikos operacijas su duomenimis, įskaitant minimumo, maksimumo ir medianos nustatymą. Tai taip pat apima įgyvendinimą Laplaso mechanizmas, kuris gali būti naudojamas skaičiavimams, kurių neapima iš anksto nustatyti algoritmai.

Bibliotekoje naudojama modulinė architektūra, leidžianti išplėsti esamas funkcijas ir pridėti papildomų mechanizmų, agreguotų funkcijų ir privatumo lygio valdiklių.
Remiantis PostgreSQL 11 DBVS biblioteka paruoštas plėtinys su anoniminių agreguotų funkcijų rinkiniu, naudojant skirtingus privatumo metodus – ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV ir ANON_NTILE.

Šaltinis: opennet.ru

Добавить комментарий