Google адкрыў код бібліятэкі для канфідэнцыйнай апрацоўкі дадзеных

Кампанія Google апублікавала зыходныя тэксты бібліятэкі «Дыферэнцыяльная прыватнасць» з рэалізацыяй метадаў дыферэнцыяльнай прыватнасці, якія дазваляюць з дастаткова высокай дакладнасцю выконваць статыстычныя аперацыі над наборам дадзеных без магчымасці ідэнтыфікацыі асобных запісаў у ім. Код бібліятэкі напісаны на мове C++ і адкрыты пад ліцэнзіяй Apache 2.0.

Аналіз з выкарыстаннем метадаў дыферэнцыяльнай прыватнасці дае магчымасць арганізацыям вырабляць аналітычныя выбаркі са статыстычных БД, не дазваляючы падзяліць дадзеныя і вылучыць з агульнай інфармацыі параметры канкрэтных асоб. Напрыклад, для выяўлення адрозненняў у доглядзе за хворымі, даследчыкам можна прадаставіць інфармацыю, якая дазваляе параўнаць сярэднюю колькасць часу знаходжання пацыентаў у бальніцах, але пры гэтым захоўвае канфідэнцыйнасць пацыентаў і не дапускае выдзялення звестак аб іх.

Прапанаваная бібліятэка ўключае рэалізацыю некалькіх алгарытмаў для фарміравання агрэгаванай статыстыкі на аснове набораў лікавых даных, якія ўключаюць канфідэнцыйныя звесткі. Для праверкі карэктнасці працы алгарытмаў прадастаўляецца стахастычны пробнік. Алгарытмы дазваляюць выконваць над дадзенымі аперацыі падсумоўвання, падліку, вылічэнні сярэдніх значэнняў, сярэднеквадратычнага адхіленні, дысперсіі і парадкавай статыстыкі, уключаючы вызначэнне мінімуму, максімуму і медыяны. У склад таксама ўваходзіць рэалізацыя механізму Лапласа, які можа выкарыстоўвацца для вылічэнняў, якія не ахопліваюцца перадвызначанымі алгарытмамі.

Бібліятэка выкарыстоўвае модульную архітэктуру, якая дазваляе пашыраць існуючую функцыянальнасць і дабаўляць дадатковыя механізмы, агрэгатныя функцыі і сродкі кіравання ўзроўнем канфідэнцыйнасці.
На базе бібліятэкі для СКБД PostgreSQL 11 падрыхтавана пашырэнне з наборам ананімных агрэгатных функцый, якія выкарыстоўваюць метады дыферэнцыяльнай прыватнасці - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV і ANON_NTILE.

Крыніца: opennet.ru

Дадаць каментар