Google abre código de biblioteca para processamento de dados confidenciais

Google publicado códigos-fonte da biblioteca "Privacidade Diferencial» com a implementação de métodos privacidade diferencial, permitindo realizar operações estatísticas em um conjunto de dados com precisão suficientemente alta, sem a capacidade de identificar registros individuais nele. O código da biblioteca é escrito em C++ e está aberto licenciado sob Apache 2.0.

A análise utilizando métodos de privacidade diferencial permite que as organizações façam amostras analíticas a partir de bases de dados estatísticas, sem permitir que separem os dados e isolem os parâmetros de indivíduos específicos das informações gerais. Por exemplo, para identificar diferenças no atendimento ao paciente, os pesquisadores podem receber informações que lhes permitam comparar o tempo médio de permanência dos pacientes nos hospitais, mas ainda assim mantêm a confidencialidade do paciente e não destacam as informações do paciente.

A biblioteca proposta inclui a implementação de diversos algoritmos para geração de estatísticas agregadas baseadas em conjuntos de dados numéricos que incluem informações confidenciais. Para verificar o correto funcionamento dos algoritmos, é fornecido sonda estocástica. Os algoritmos permitem realizar operações de soma, contagem, média, desvio padrão, dispersão e ordenação de dados estatísticos, incluindo a determinação de mínimo, máximo e mediana. Inclui também a implementação Mecanismo Laplace, que pode ser usado para cálculos não cobertos por algoritmos predefinidos.

A biblioteca usa uma arquitetura modular que permite expandir a funcionalidade existente e adicionar mecanismos adicionais, funções agregadas e controles de nível de privacidade.
Baseado na biblioteca para PostgreSQL 11 DBMS preparado extensão com um conjunto de funções agregadas anônimas usando métodos de privacidade diferencial - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV e ANON_NTILE.

Fonte: opennet.ru

Adicionar um comentário