Google-k liburutegiko kodea irekitzen du datu konfidentzialak prozesatzeko

Google argitaratuko liburutegiko iturburu-kodeak "Pribatutasun diferentzialaΒ» metodoen ezarpenarekin pribatutasun diferentziala, datu multzo batean nahikoa zehaztasun handiz eragiketa estatistikoak egiteko aukera emanez, bertan erregistro indibidualak identifikatzeko gaitasunik gabe. Liburutegiaren kodea C++-n idatzita dago eta irekita dago Apache 2.0 lizentziapean.

Pribatutasun-metodo diferentzialak erabiliz analisiari esker, erakundeek datu-base estatistikoetatik lagin analitikoak egin ditzakete, datuak bereizten eta pertsona zehatzen parametroak informazio orokorretik isolatzen utzi gabe. Esaterako, pazienteen arretaren desberdintasunak identifikatzeko, ikertzaileei ospitaleetan gaixoen batez besteko egonaldia alderatzeko aukera ematen dien informazioa eman diezaiekete, baina hala ere pazientearen konfidentzialtasuna mantentzen du eta pazientearen informazioa nabarmentzen ez duena.

Proposatutako liburutegiak isilpeko informazioa barne hartzen duten zenbakizko datu multzoetan oinarritutako estatistika agregatuak sortzeko hainbat algoritmo ezartzea barne hartzen du. Algoritmoen funtzionamendu zuzena egiaztatzeko, ematen da zunda estokastikoa. Algoritmoek datuen batuketa, zenbaketa, batez bestekoa, desbideratze estandarra, sakabanaketa eta ordena estatistiko-eragiketak egiteko aukera ematen dute, gutxieneko, maximo eta mediana zehaztea barne. Inplementazioa ere barne hartzen du Laplace mekanismoa, aurrez definitutako algoritmoek estali gabeko kalkuluetarako erabil daitekeena.

Liburutegiak arkitektura modularra erabiltzen du, lehendik dauden funtzionalitateak zabaltzeko eta mekanismo osagarriak, funtzio agregatuak eta pribatutasun maila kontrolatzeko aukera ematen duena.
PostgreSQL 11 DBMSrako liburutegian oinarrituta prestatuta luzapena, pribatutasun-metodo diferentzialak erabiliz agregazio-funtzio anonimoen multzoarekin - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV eta ANON_NTILE.

Iturria: opennet.ru

Gehitu iruzkin berria