Google öppnar bibliotekskod för konfidentiell databehandling

Google опубликовала bibliotekets källkoder "Differentiell integritet» med implementering av metoder differentiell integritet, vilket gör det möjligt att utföra statistiska operationer på en datamängd med tillräckligt hög noggrannhet utan möjlighet att identifiera enskilda poster i den. Bibliotekskoden är skriven i C++ och är öppen licensierad under Apache 2.0.

Analys med hjälp av differentiella integritetsmetoder gör det möjligt för organisationer att göra analytiska prover från statistiska databaser, utan att tillåta dem att separera data och isolera parametrarna för specifika individer från den allmänna informationen. Till exempel, för att identifiera skillnader i patientvården, kan forskarna förses med information som gör att de kan jämföra den genomsnittliga vistelsetiden för patienter på sjukhus, men ändå upprätthåller patientens konfidentialitet och inte lyfter fram patientinformation.

Det föreslagna biblioteket inkluderar implementering av flera algoritmer för att generera aggregerad statistik baserad på uppsättningar numeriska data som inkluderar konfidentiell information. För att kontrollera att algoritmerna fungerar korrekt, tillhandahålls den stokastisk sond. Algoritmer låter dig utföra summering, räkning, medelvärde, standardavvikelse, spridning och ordningsstatistik på data, inklusive bestämning av minimum, maximum och median. Det inkluderar även implementeringen Laplace mekanism, som kan användas för beräkningar som inte täcks av fördefinierade algoritmer.

Biblioteket använder en modulär arkitektur som låter dig utöka befintlig funktionalitet och lägga till ytterligare mekanismer, aggregerade funktioner och kontroller på integritetsnivån.
Baserat på biblioteket för PostgreSQL 11 DBMS beredd tillägg med en uppsättning anonyma samlade funktioner som använder differentiella sekretessmetoder - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV och ANON_NTILE.

Källa: opennet.ru

Lägg en kommentar