PostgreSQL Anonymizer 0.6, un'estensione per anonimizzare i dati in un DBMS
A disposizione nuova versione del progetto Anonimizzatore PostgreSQL, che fornisce un componente aggiuntivo al DBMS PostgreSQL che risolve il problema di nascondere o sostituire dati riservati o segreti commerciali. I dati possono essere nascosti al volo sulla base di regole appositamente definite e di elenchi di utenti le cui risposte alle richieste devono essere rese anonime. Codice distribuito da concesso in licenza con PostgreSQL.
Ad esempio, con l'aiuto del componente aggiuntivo in questione, è possibile fornire a terzi l'accesso al database, ad esempio servizi di business intelligence di terzi, ritagliando automaticamente per loro dati come numeri di telefono e carte di credito, oppure utilizzando metodi più sofisticati, come la sostituzione dei nomi dei clienti e delle aziende con informazioni fittizie. Oltre a eseguire l'anonimizzazione quando ci si connette direttamente al DBMS, esiste una modalità per creare dump SQL anonimizzati (viene proposta l'utilità pg_dump_anon).
Anonimizzatore PostgreSQL espande PostgreSQL DDL (Data Definition Language) e consente di impostare una strategia di anonimizzazione a livello di schema che definisce la struttura della tabella. È previsto un ampio insieme di funzioni per l'elaborazione dei dati da sostituire: randomizzazione, sostituzione con valori fittizi, parziale rimescolando, strascichi, rumori, ecc. La nuova versione aggiunge funzioni per identificare gli identificatori e dispone anche di una modalità di pseudonimizzazione che consente di generare valori fittizi realistici legati ai dati di origine.
Inoltre, possiamo notare la piattaforma aperta sviluppata da Microsoft per identificare le fughe di informazioni riservate Presidio. La piattaforma consente di identificare o eliminare informazioni in documenti, testi e immagini contenenti dati personali e riservati, come nome completo, numeri di telefono, e-mail, numeri di carte di credito, portafogli crittografici, indirizzi, numeri di passaporto, dati finanziari, ecc. Supporta l'elaborazione di vari archivi (da Amazon S3 a PostgreSQL) e formati. Il codice è scritto in Go (esiste una versione in Python) e distribuito da con licenza MIT.