Google membuka kode perpustakaan untuk pemrosesan data rahasia

Google ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° kode sumber perpustakaan "Privasi DiferensialΒ» dengan penerapan metode privasi diferensial, memungkinkan untuk melakukan operasi statistik pada kumpulan data dengan akurasi yang cukup tinggi tanpa kemampuan untuk mengidentifikasi catatan individual di dalamnya. Kode perpustakaan ditulis dalam C++ dan terbuka berlisensi di bawah Apache 2.0.

Analisis menggunakan metode privasi diferensial memungkinkan organisasi untuk membuat sampel analitis dari database statistik, tanpa membiarkan mereka memisahkan data dan mengisolasi parameter individu tertentu dari informasi umum. Misalnya, untuk mengidentifikasi perbedaan pelayanan pasien, peneliti dapat diberikan informasi yang memungkinkan mereka membandingkan rata-rata lama rawat pasien di rumah sakit, namun tetap menjaga kerahasiaan pasien dan tidak menonjolkan informasi pasien.

Perpustakaan yang diusulkan mencakup penerapan beberapa algoritma untuk menghasilkan statistik agregat berdasarkan kumpulan data numerik yang mencakup informasi rahasia. Untuk memeriksa kebenaran pengoperasian algoritma, disediakan pemeriksaan stokastik. Algoritma memungkinkan Anda melakukan operasi penjumlahan, penghitungan, mean, deviasi standar, dispersi, dan mengurutkan statistik pada data, termasuk menentukan minimum, maksimum, dan median. Termasuk juga implementasinya Mekanisme Laplace, yang dapat digunakan untuk penghitungan yang tidak tercakup dalam algoritme yang telah ditentukan sebelumnya.

Pustaka menggunakan arsitektur modular yang memungkinkan Anda memperluas fungsionalitas yang ada dan menambahkan mekanisme tambahan, fungsi agregat, dan kontrol tingkat privasi.
Berdasarkan perpustakaan untuk DBMS PostgreSQL 11 siap ekstensi dengan serangkaian fungsi agregat anonim yang menggunakan metode privasi diferensial - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV, dan ANON_NTILE.

Sumber: opennet.ru

Tambah komentar