Google avab konfidentsiaalseks andmetöötluseks raamatukogu koodi

Google опубликовала raamatukogu lähtekoodid "Diferentsiaalne privaatsus» meetodite rakendamisega erinev privaatsus, mis võimaldab teha piisavalt suure täpsusega statistilisi toiminguid andmekogumiga, ilma et oleks võimalik selles üksikuid kirjeid tuvastada. Teegi kood on kirjutatud C++ ja on avatud litsentsitud Apache 2.0 alusel.

Analüüs diferentseeritud privaatsusmeetodite abil võimaldab organisatsioonidel teha statistilistest andmebaasidest analüütilisi proove, võimaldamata neil andmeid eraldada ja konkreetsete isikute parameetreid üldisest teabest eraldada. Näiteks patsientide hoolduse erinevuste väljaselgitamiseks saab teadlastele anda teavet, mis võimaldab võrrelda patsientide keskmist haiglas viibimise pikkust, kuid säilitab siiski patsientide konfidentsiaalsuse ega tõsta patsiendi teavet esile.

Kavandatav teek sisaldab mitme algoritmi rakendamist koondstatistika genereerimiseks, mis põhineb arvandmete kogumitel, mis sisaldavad konfidentsiaalset teavet. Algoritmide õige toimimise kontrollimiseks on see ette nähtud stohhastiline sond. Algoritmid võimaldavad teil teha andmetega liitmise, loendamise, keskmise, standardhälbe, dispersiooni ja järjestuse statistika toiminguid, sealhulgas määrata miinimumi, maksimumi ja mediaani. See hõlmab ka rakendamist Laplace'i mehhanism, mida saab kasutada arvutuste jaoks, mida ei kata etteantud algoritmid.

Teek kasutab modulaarset arhitektuuri, mis võimaldab laiendada olemasolevat funktsionaalsust ja lisada täiendavaid mehhanisme, koondfunktsioone ja privaatsustaseme juhtelemente.
Põhineb PostgreSQL 11 DBMS-i teegil ette valmistatud laiendus anonüümsete koondfunktsioonide komplektiga, mis kasutavad erinevaid privaatsusmeetodeid – ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV ja ANON_NTILE.

Allikas: opennet.ru

Lisa kommentaar