Google avaa kirjastokoodin luottamuksellisten tietojen käsittelyä varten

Google julkaistu kirjaston lähdekoodit "Erilainen yksityisyys» menetelmien käyttöönotolla erilainen yksityisyys, joka mahdollistaa tilastollisten operaatioiden suorittamisen tietojoukolle riittävän suurella tarkkuudella ilman kykyä tunnistaa yksittäisiä tietueita siitä. Kirjastokoodi on kirjoitettu C++ ja on auki lisensoitu Apache 2.0:lla.

Erilaisia ​​tietosuojamenetelmiä käyttävän analyysin avulla organisaatiot voivat tehdä analyyttisiä näytteitä tilastotietokannoista ilman, että ne voivat erottaa tietoja ja eristää tiettyjen henkilöiden parametrit yleisestä tiedosta. Esimerkiksi potilaiden hoidossa olevien erojen tunnistamiseksi tutkijoille voidaan antaa tietoa, jonka avulla he voivat verrata potilaiden keskimääräistä sairaalassaoloaikaa, mutta säilyttävät silti potilaiden luottamuksellisuuden eikä korosta potilastietoja.

Ehdotettu kirjasto sisältää useiden algoritmien toteutuksen aggregoitujen tilastojen luomiseksi luottamuksellista tietoa sisältävien numeeristen tietojen sarjoihin perustuvien. Se tarjotaan algoritmien oikean toiminnan tarkistamiseksi stokastinen anturi. Algoritmien avulla voit suorittaa datalle summaus-, laskenta-, keskiarvo-, keskihajonnan-, hajonta- ja järjestystilastooperaatioita, mukaan lukien minimi-, maksimi- ja mediaanin määrittäminen. Se sisältää myös toteutuksen Laplacen mekanismi, jota voidaan käyttää laskelmiin, joita ennalta määritetyt algoritmit eivät kata.

Kirjasto käyttää modulaarista arkkitehtuuria, jonka avulla voit laajentaa olemassa olevia toimintoja ja lisätä lisämekanismeja, aggregaattitoimintoja ja yksityisyyden tason säätimiä.
Perustuu PostgreSQL 11 DBMS:n kirjastoon valmis laajennus, jossa on joukko anonyymejä koostefunktioita, jotka käyttävät erilaisia ​​tietosuojamenetelmiä - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV ja ANON_NTILE.

Lähde: opennet.ru

Lisää kommentti