Google otvára kód knižnice na spracovanie dôverných údajov

Google опубликовала zdrojové kódy knižnice "Rozdielne súkromie» s implementáciou metód rozdielne súkromie, umožňujúci vykonávať štatistické operácie so súborom údajov s dostatočne vysokou presnosťou bez možnosti identifikovať v ňom jednotlivé záznamy. Kód knižnice je napísaný v C++ a je otvorený licencovaný pod Apache 2.0.

Analýza využívajúca rôzne metódy ochrany súkromia umožňuje organizáciám vytvárať analytické vzorky zo štatistických databáz bez toho, aby im umožnila oddeliť údaje a izolovať parametre konkrétnych jednotlivcov od všeobecných informácií. Napríklad na identifikáciu rozdielov v starostlivosti o pacienta môžu výskumníci dostať informácie, ktoré im umožnia porovnať priemernú dĺžku pobytu pacientov v nemocniciach, no stále zachovávajú dôvernosť pacienta a nezvýrazňujú informácie o pacientovi.

Navrhovaná knižnica zahŕňa implementáciu niekoľkých algoritmov na generovanie agregovaných štatistík na základe súborov číselných údajov, ktoré obsahujú dôverné informácie. Na kontrolu správneho fungovania algoritmov je k dispozícii stochastická sonda. Algoritmy umožňujú vykonávať operácie sčítania, počítania, priemeru, štandardnej odchýlky, rozptylu a štatistických operácií s údajmi, vrátane určenia minima, maxima a mediánu. Zahŕňa aj realizáciu Laplaceov mechanizmus, ktorý možno použiť na výpočty, ktoré nepokrývajú vopred definované algoritmy.

Knižnica využíva modulárnu architektúru, ktorá vám umožňuje rozšíriť existujúce funkcie a pridať ďalšie mechanizmy, súhrnné funkcie a ovládacie prvky na úrovni súkromia.
Založené na knižnici pre PostgreSQL 11 DBMS pripravený rozšírenie o sadu anonymných agregačných funkcií využívajúcich diferenciálne metódy ochrany osobných údajov – ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV a ANON_NTILE.

Zdroj: opennet.ru

Pridať komentár