Google otwiera kod biblioteki do przetwarzania poufnych danych

Google опубликовала kody źródłowe biblioteki "Prywatność różnicowa» z wdrożeniem metod zróżnicowana prywatność, pozwalające na wykonywanie operacji statystycznych na zbiorze danych z odpowiednio dużą dokładnością bez możliwości identyfikacji w nim poszczególnych rekordów. Kod biblioteki jest napisany w C++ i otwarty na licencji Apache 2.0.

Analiza wykorzystująca metody prywatności różnicowej umożliwia organizacjom tworzenie próbek analitycznych ze statystycznych baz danych, nie pozwalając im na oddzielanie danych i izolowanie parametrów konkretnych osób od informacji ogólnych. Na przykład, aby zidentyfikować różnice w opiece nad pacjentem, badacze mogą otrzymać informacje, które pozwolą im porównać średnią długość pobytu pacjentów w szpitalach, zachowując jednocześnie poufność pacjenta i nie eksponując informacji o pacjencie.

Proponowana biblioteka obejmuje implementację kilku algorytmów generowania zagregowanych statystyk na podstawie zbiorów danych liczbowych zawierających informacje poufne. Służy do sprawdzania poprawności działania algorytmów sonda stochastyczna. Algorytmy pozwalają na wykonywanie operacji sumowania, liczenia, średniej, odchylenia standardowego, dyspersji i statystyki porządkowej na danych, w tym wyznaczanie minimum, maksimum i mediany. Obejmuje to również wdrożenie Mechanizm Laplace’a, które można wykorzystać do obliczeń nie objętych predefiniowanymi algorytmami.

Biblioteka wykorzystuje architekturę modułową, która pozwala rozszerzać istniejącą funkcjonalność i dodawać dodatkowe mechanizmy, funkcje agregujące i kontrolę poziomu prywatności.
Oparty na bibliotece dla PostgreSQL 11 DBMS przygotowany rozszerzenie o zestaw anonimowych funkcji agregujących wykorzystujących metody różnicowej prywatności - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV i ANON_NTILE.

Źródło: opennet.ru

Dodaj komentarz