گوگل کد کتابخانه را برای پردازش داده های محرمانه باز می کند

گوگل опубликовала کدهای منبع کتابخانه "حفظ حریم خصوصی» با اجرای روش ها حریم خصوصی دیفرانسیل، امکان انجام عملیات آماری روی یک مجموعه داده را با دقت کافی و بدون توانایی شناسایی رکوردهای فردی در آن فراهم می کند. کد کتابخانه به زبان C++ و نوشته شده است باز کن دارای مجوز Apache 2.0.

تجزیه و تحلیل با استفاده از روش‌های متمایز حریم خصوصی به سازمان‌ها این امکان را می‌دهد که نمونه‌های تحلیلی را از پایگاه‌های داده آماری تهیه کنند، بدون اینکه به آنها اجازه جداسازی داده‌ها و جداسازی پارامترهای افراد خاص از اطلاعات عمومی را بدهد. به عنوان مثال، برای شناسایی تفاوت‌ها در مراقبت از بیمار، می‌توان اطلاعاتی در اختیار محققان قرار داد که به آنها اجازه می‌دهد میانگین مدت اقامت بیماران در بیمارستان‌ها را با هم مقایسه کنند، اما همچنان محرمانه بودن بیمار را حفظ کرده و اطلاعات بیمار را برجسته نمی‌کند.

کتابخانه پیشنهادی شامل اجرای چندین الگوریتم برای تولید آمار انباشته بر اساس مجموعه‌ای از داده‌های عددی است که شامل اطلاعات محرمانه است. برای بررسی عملکرد صحیح الگوریتم ها ارائه شده است کاوشگر تصادفی. الگوریتم‌ها به شما امکان می‌دهند عملیات جمع‌بندی، شمارش، میانگین، انحراف استاندارد، پراکندگی و آمار ترتیب را روی داده‌ها انجام دهید، از جمله تعیین حداقل، حداکثر و میانه. شامل اجرا نیز می شود مکانیسم لاپلاس، که می تواند برای محاسباتی که توسط الگوریتم های از پیش تعریف شده پوشش داده نشده اند استفاده شود.

این کتابخانه از یک معماری مدولار استفاده می‌کند که به شما امکان می‌دهد عملکردهای موجود را گسترش دهید و مکانیسم‌های اضافی، توابع جمع‌آوری و کنترل‌های سطح حریم خصوصی را اضافه کنید.
بر اساس کتابخانه برای PostgreSQL 11 DBMS آماده شده برنامه افزودنی با مجموعه‌ای از توابع مجموع ناشناس با استفاده از روش‌های حریم خصوصی متفاوت - ANON_COUNT، ANON_SUM، ANON_AVG، ANON_VAR، ANON_STDDEV و ANON_NTILE.

منبع: opennet.ru

اضافه کردن نظر