Google otevírá kód knihovny pro zpracování důvěrných dat

Google publikováno zdrojové kódy knihovny"Diferenciální soukromí» s implementací metod rozdílné soukromí, umožňující provádět statistické operace nad souborem dat s dostatečně vysokou přesností bez možnosti identifikace jednotlivých záznamů v něm. Knihovní kód je napsán v C++ a je otevřeno licencováno pod Apache 2.0.

Analýza využívající různé metody ochrany soukromí umožňuje organizacím vytvářet analytické vzorky ze statistických databází, aniž by jim umožňovala oddělovat data a izolovat parametry konkrétních osob od obecných informací. Například pro identifikaci rozdílů v péči o pacienty mohou být výzkumníkům poskytnuty informace, které jim umožní porovnávat průměrnou délku pobytu pacientů v nemocnicích, ale stále zachovávají důvěrnost pacientů a nezdůrazňují informace o pacientech.

Navrhovaná knihovna zahrnuje implementaci několika algoritmů pro generování agregovaných statistik založených na souborech číselných údajů, které obsahují důvěrné informace. Pro kontrolu správného fungování algoritmů je k dispozici stochastická sonda. Algoritmy umožňují provádět operace sčítání, počítání, průměru, směrodatné odchylky, rozptylu a statistiky pořadí na datech, včetně určování minima, maxima a mediánu. Součástí je i realizace Laplaceův mechanismus, který lze použít pro výpočty, které nepokrývají předdefinované algoritmy.

Knihovna využívá modulární architekturu, která vám umožňuje rozšířit stávající funkce a přidat další mechanismy, agregační funkce a ovládací prvky úrovně soukromí.
Založeno na knihovně pro PostgreSQL 11 DBMS připravený rozšíření o sadu anonymních agregačních funkcí využívajících diferenciální metody ochrany soukromí - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV a ANON_NTILE.

Zdroj: opennet.ru

Přidat komentář