Google abrió el código de la biblioteca para el procesamiento de datos confidenciales

Google опубликовала código fuente de la bibliotecaPrivacidad diferencial» con la implementación de métodos privacidad diferencial, que permite realizar operaciones estadísticas sobre un conjunto de datos con una precisión suficientemente alta sin la posibilidad de identificar registros individuales en él. El código de la biblioteca está escrito en C++ y está abierto licenciado bajo Apache 2.0.

El análisis que utiliza métodos de privacidad diferencial permite a las organizaciones producir muestras analíticas a partir de bases de datos estadísticas, sin permitir que se dividan los datos y que los parámetros de individuos específicos se extraigan de la información general. Por ejemplo, para identificar las diferencias en la atención de los pacientes, se puede proporcionar a los investigadores información que permita comparar la cantidad promedio de tiempo que los pacientes pasan en los hospitales, manteniendo la confidencialidad de los pacientes y no permitiendo la identificación de información sobre ellos.

La biblioteca propuesta incluye la implementación de varios algoritmos para generar estadísticas agregadas basadas en conjuntos de datos numéricos que incluyen información confidencial. Para comprobar la corrección de los algoritmos, se proporciona sonda estocástica. Los algoritmos le permiten realizar sumas, conteos, cálculos de promedios, desviación estándar, varianza y estadísticas de orden de los datos, incluida la determinación del mínimo, el máximo y la mediana. También se incluye la implementación mecanismo de Laplace, que se puede utilizar para cálculos no cubiertos por algoritmos predefinidos.

La biblioteca utiliza una arquitectura modular que le permite expandir la funcionalidad existente y agregar mecanismos adicionales, funciones agregadas y controles de privacidad.
Basado en la biblioteca para PostgreSQL 11 DBMS preparado extensión con un conjunto de funciones agregadas anónimas que utilizan métodos de privacidad diferencial: ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV y ANON_NTILE.

Fuente: opennet.ru

Añadir un comentario