Google құпия деректерді өңдеу үшін кітапхана кодын ашады

Google жарияланған кітапхананың бастапқы кодтары»Дифференциалды құпиялылық» әдістерін жүзеге асырумен дифференциалды құпиялылық, деректер жиынында жеке жазбаларды анықтау мүмкіндігінсіз жеткілікті жоғары дәлдікпен статистикалық операцияларды орындауға мүмкіндік береді. Кітапхана коды C++ тілінде жазылған және ашық Apache 2.0 бойынша лицензияланған.

Құпиялықтың дифференциалды әдістерін қолдану арқылы талдау ұйымдарға статистикалық деректер қорынан деректерді бөлуге және нақты тұлғалардың параметрлерін жалпы ақпараттан оқшаулауға мүмкіндік бермей, аналитикалық үлгілер жасауға мүмкіндік береді. Мысалы, пациенттерге күтім көрсетудегі айырмашылықтарды анықтау үшін зерттеушілерге пациенттердің стационарларда болуының орташа ұзақтығын салыстыруға мүмкіндік беретін, бірақ әлі де пациенттердің құпиялылығын сақтайтын және пациенттер туралы ақпаратты ерекшелендірмейтін ақпаратты ұсынуға болады.

Ұсынылған кітапхана құпия ақпаратты қамтитын сандық деректер жиынтығы негізінде жинақталған статистиканы құрудың бірнеше алгоритмдерін жүзеге асыруды қамтиды. Алгоритмдердің дұрыс жұмысын тексеру үшін ол қарастырылған стохастикалық зонд. Алгоритмдер мәліметтер бойынша жинақтау, санау, орташа, стандартты ауытқу, дисперсия және реттілік статистикасы операцияларын орындауға мүмкіндік береді, соның ішінде минимум, максимум және медиананы анықтау. Оған іске асыру да кіреді Лаплас механизмі, ол алдын ала анықталған алгоритмдермен қамтылмаған есептеулер үшін пайдаланылуы мүмкін.

Кітапхана бар функционалдылықты кеңейтуге және қосымша механизмдерді, жиынтық функцияларды және құпиялылық деңгейін басқару элементтерін қосуға мүмкіндік беретін модульдік архитектураны пайдаланады.
PostgreSQL 11 ДҚБЖ кітапханасына негізделген дайындалған ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV және ANON_NTILE дифференциалды құпиялылық әдістерін қолданатын анонимді жиынтық функциялар жиынтығы бар кеңейтім.

Ақпарат көзі: opennet.ru

пікір қалдыру