Google abre o código da biblioteca para o procesamento de datos confidenciais

Google publicado códigos fonte da biblioteca "Privacidade diferencial» coa implantación de métodos privacidade diferencial, permitindo realizar operacións estatísticas sobre un conxunto de datos cunha precisión suficientemente alta sen a posibilidade de identificar rexistros individuais nel. O código da biblioteca está escrito en C++ e aberto licenciado baixo Apache 2.0.

A análise mediante métodos de privacidade diferencial permite ás organizacións facer mostras analíticas a partir de bases de datos estatísticas, sen permitirlles separar os datos e illar os parámetros de individuos específicos da información xeral. Por exemplo, para identificar diferenzas na atención ao paciente, pódese proporcionar aos investigadores información que lles permita comparar a duración media da estancia dos pacientes nos hospitais, pero aínda así mantén a confidencialidade do paciente e non destaca a información do paciente.

A biblioteca proposta inclúe a implementación de varios algoritmos para xerar estatísticas agregadas baseadas en conxuntos de datos numéricos que inclúen información confidencial. Para comprobar o correcto funcionamento dos algoritmos, ofrécese sonda estocástica. Os algoritmos permítenche realizar operacións estatísticas de suma, reconto, media, desviación estándar, dispersión e orde sobre datos, incluíndo a determinación do mínimo, máximo e mediano. Tamén inclúe a implantación Mecanismo de Laplace, que se pode usar para cálculos non cubertos por algoritmos predefinidos.

A biblioteca usa unha arquitectura modular que lle permite ampliar a funcionalidade existente e engadir mecanismos adicionais, funcións agregadas e controis de nivel de privacidade.
Baseado na biblioteca para PostgreSQL 11 DBMS preparado extensión cun conxunto de funcións agregadas anónimas que utilizan métodos de privacidade diferenciais: ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV e ANON_NTILE.

Fonte: opennet.ru

Engadir un comentario