Google membuka kod perpustakaan untuk pemprosesan data sulit

Google ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π»Π° kod sumber perpustakaan "Privasi PembezaanΒ» dengan pelaksanaan kaedah privasi berbeza, membolehkan untuk melaksanakan operasi statistik pada set data dengan ketepatan yang cukup tinggi tanpa keupayaan untuk mengenal pasti rekod individu di dalamnya. Kod perpustakaan ditulis dalam C++ dan ia terbuka berlesen di bawah Apache 2.0.

Analisis menggunakan kaedah privasi pembezaan membolehkan organisasi membuat sampel analisis daripada pangkalan data statistik, tanpa membenarkan mereka memisahkan data dan mengasingkan parameter individu tertentu daripada maklumat umum. Sebagai contoh, untuk mengenal pasti perbezaan dalam penjagaan pesakit, penyelidik boleh diberikan maklumat yang membolehkan mereka membandingkan purata tempoh penginapan pesakit di hospital, tetapi masih mengekalkan kerahsiaan pesakit dan tidak menyerlahkan maklumat pesakit.

Perpustakaan yang dicadangkan termasuk pelaksanaan beberapa algoritma untuk menjana statistik agregat berdasarkan set data berangka yang termasuk maklumat sulit. Untuk menyemak operasi algoritma yang betul, ia disediakan kuar stokastik. Algoritma membolehkan anda melakukan operasi penjumlahan, pengiraan, min, sisihan piawai, serakan dan tertib pada data, termasuk menentukan minimum, maksimum dan median. Ia juga termasuk pelaksanaan Mekanisme Laplace, yang boleh digunakan untuk pengiraan yang tidak diliputi oleh algoritma yang dipratentukan.

Perpustakaan menggunakan seni bina modular yang membolehkan anda mengembangkan fungsi sedia ada dan menambah mekanisme tambahan, fungsi agregat dan kawalan tahap privasi.
Berdasarkan perpustakaan untuk PostgreSQL 11 DBMS disediakan sambungan dengan set fungsi agregat tanpa nama menggunakan kaedah privasi berbeza - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV dan ANON_NTILE.

Sumber: opennet.ru

Tambah komen