PostgreSQL Anonymizer 0.6, uma extensão para anonimizar dados em um SGBD
Disponível novo lançamento do projeto Anonimizador PostgreSQL, que fornece um complemento ao SGBD PostgreSQL que resolve o problema de ocultar ou substituir dados confidenciais ou segredos comerciais. Os dados podem ser ocultados instantaneamente com base em regras e listas de usuários especialmente definidas, cujas respostas às solicitações devem ser anônimas. Código distribuído por licenciado sob PostgreSQL.
Por exemplo, com a ajuda do complemento em questão, você pode fornecer acesso ao banco de dados a terceiros, por exemplo, serviços de business intelligence de terceiros, cortando automaticamente dados para eles, como números de telefone e cartões de crédito, ou usando métodos mais sofisticados, como a substituição de nomes de clientes e empresas por informações fictícias. Além de realizar o anonimato ao conectar-se diretamente ao SGBD, existe um modo para criar dumps SQL anonimizados (o utilitário pg_dump_anon é proposto).
Anonimizador PostgreSQL expande PostgreSQL DDL (Data Definition Language) e permite definir uma estratégia de anonimato no nível do esquema que define a estrutura da tabela. Um grande conjunto de funções é fornecido para o processamento de dados a serem substituídos: randomização, substituição por valores fictícios, parcial lutando, embaralhamento, ruído, etc. A nova versão adiciona funções de identificação de identificadores e também possui um modo de pseudonimização que permite gerar valores fictícios realistas vinculados aos dados de origem.
Adicionalmente, podemos destacar a plataforma aberta desenvolvida pela Microsoft para identificação de vazamentos de informações confidenciais Presídio. A plataforma permite identificar ou excluir informações em documentos, textos e imagens contendo dados pessoais e confidenciais, como nome completo, números de telefone, e-mail, números de cartão de crédito, carteiras criptográficas, endereços, números de passaporte, dados financeiros, etc. Suporta processamento de vários armazenamentos (do Amazon S3 ao PostgreSQL) e formatos. O código é escrito em Go (existe uma versão em Python) e distribuído por sob a licença do MIT.