فتحت جوجل رمز المكتبة لمعالجة البيانات السرية

متصفح الجوجل опубликовала رموز مصدر المكتبة "الخصوصية التفاضلية» مع تنفيذ الأساليب الخصوصية التفاضليةمما يسمح بإجراء عمليات إحصائية على مجموعة بيانات بدقة عالية بما فيه الكفاية دون القدرة على تحديد السجلات الفردية فيها. كود المكتبة مكتوب بلغة C++ و فتح مرخص بموجب Apache 2.0.

يسمح التحليل باستخدام أساليب الخصوصية التفاضلية للمؤسسات بعمل عينات تحليلية من قواعد البيانات الإحصائية، دون السماح لها بفصل البيانات وعزل معلمات أفراد محددين عن المعلومات العامة. على سبيل المثال، لتحديد الاختلافات في رعاية المرضى، يمكن تزويد الباحثين بالمعلومات التي تسمح لهم بمقارنة متوسط ​​مدة إقامة المرضى في المستشفيات، ولكن مع الحفاظ على سرية المريض ولا يسلط الضوء على معلومات المريض.

تتضمن المكتبة المقترحة تنفيذ عدة خوارزميات لتوليد إحصائيات مجمعة بناءً على مجموعات من البيانات الرقمية التي تتضمن معلومات سرية. للتحقق من التشغيل الصحيح للخوارزميات، يتم توفيره مسبار عشوائي. تسمح لك الخوارزميات بإجراء عمليات الجمع والعد والمتوسط ​​والانحراف المعياري والتشتت وترتيب العمليات الإحصائية على البيانات، بما في ذلك تحديد الحد الأدنى والحد الأقصى والوسيط. ويشمل أيضا التنفيذ آلية لابلاس، والتي يمكن استخدامها للحسابات التي لا تغطيها الخوارزميات المحددة مسبقًا.

تستخدم المكتبة بنية معيارية تسمح لك بتوسيع الوظائف الحالية وإضافة آليات إضافية ووظائف مجمعة وعناصر تحكم في مستوى الخصوصية.
استنادًا إلى مكتبة PostgreSQL 11 DBMS مُعد ملحق مع مجموعة من الوظائف المجمعة المجهولة باستخدام أساليب الخصوصية التفاضلية - ANON_COUNT، وANON_SUM، وANON_AVG، وANON_VAR، وANON_STDDEV، وANON_NTILE.

المصدر: opennet.ru

إضافة تعليق