Алгарытмы Facebook дапамогуць інтэрнэт-кампаніям шукаць дублікаты відэа і малюнкаў для барацьбы з недапушчальным кантэнтам

Facebook абвясціла аб адкрыцці зыходнага кода двух алгарытмаў, здольных вызначаць ступень ідэнтычнасці для фатаграфій і відэа, нават калі ў іх унесены невялікія змены. Гэтыя алгарытмы сацыяльная сетка актыўна выкарыстоўвае для барацьбы з кантэнтам, які змяшчае матэрыялы, звязаныя з эксплуатацыяй дзяцей, тэрарыстычнай прапагандай і рознымі формамі гвалту. Facebook адзначае, што яна ўпершыню падзялілася падобнай тэхналогіяй, і ў кампаніі спадзяюцца, што з яе дапамогай іншыя буйныя парталы і сэрвісы, невялікія студыі па распрацоўцы ПЗ і некамерцыйныя арганізацыі змогуць больш эфектыўна змагацца з распаўсюджваннем недапушчальнага медыя-кантэнту ў сусветнай Сеткі.

Алгарытмы Facebook дапамогуць інтэрнэт-кампаніям шукаць дублікаты відэа і малюнкаў для барацьбы з недапушчальным кантэнтам

"Калі мы знаходзім фрагмент недапушчальнага кантэнту, тэхналогіі могуць дапамагчы нам знайсці ўсе яго дублікаты і прадухіліць іх распаўсюджванне", – пішуць кіраўнік службы бяспекі Facebook Антыгона Дэвіс (Antigone Davis) і віцэ-прэзідэнт па сумленнасці Гі Розен (Guy Rosen) у сваім пасце, прымеркаваным да чацвёртага штогадовага хакатона "Бяспека дзяцей у Facebook". "Для тых, хто ўжо выкарыстоўвае сваю ўласную ці іншую тэхналогію супастаўлення кантэнту, нашы тэхналогіі могуць стаць яшчэ адным узроўнем абароны, робячы сістэмы бяспекі нашмат больш магутнымі".

Facebook сцвярджае, што два апублікаваных алгарытму – PDQ і TMK + PDQ – былі распрацаваны для працы з вялізнымі масівамі дадзеных і заснаваныя на ўжо існуючых мадэлях і рэалізацыях, уключаючы pHash, PhotoDNA ад Microsoft, aHash і dHash. Напрыклад, алгарытм PDQ для параўнання фатаграфій быў натхнёны pHash, але пры гэтым распрацаваны цалкам з нуля распрацоўшчыкамі з Facebook, у той час як супастаўляючае відэа TMK+PDQF створаны сумеснымі намаганнямі даследчай групай Facebook па штучным інтэлекце і навукоўцамі з Універсітэта Модены і Рэджа-Эміліі ў Італіі.

Абодва алгарытму аналізуюць шуканыя файлы, дзякуючы кароткім лічбавых хэшам, унікальным ідэнтыфікатарам, якія дапамагаюць вызначыць, ці з'яўляюцца два файла аднолькавымі або падобнымі, нават без зыходнага малюнка або відэа. Facebook адзначае, што дадзеныя хешы могуць быць лёгка перададзены іншым кампаніям і некамерцыйным арганізацыям, а таксама галіновым партнёрам праз Глабальны інтэрнэт-форум па барацьбе з тэрарызмам (GIFCT), таму ўсе зацікаўленыя ў сеткавай бяспецы кампаніі таксама змогуць выдаляць кантэнт, пазначаны Facebook як небяспечны, калі ён загружаны ў іх сэрвісы.

Распрацоўка PDQ і TMK+PDQ рушыла ўслед за рэлізам вышэйзгаданай PhotoDNA 10 гадоў таму ў спробе барацьбы з дзіцячай парнаграфіяй у сетцы з боку Microsoft. Таксама зусім нядаўна Google запусціла Content Safety API, платформу штучнага інтэлекту, прызначаную для выяўлення анлайн-матэрыялаў аб сэксуальных здзеках над дзецьмі, каб зрабіць працу людзей-мадэратараў больш эфектыўнай.

У сваю чаргу кіраўнік Facebook Марк Цукерберг ужо даўно сцвярджае, што ІІ ў найбліжэйшай будучыні істотна скароціць колькасць злоўжыванняў, якія здзяйсняюцца мільёнамі нядобрасумленных карыстальнікаў Facebook. І сапраўды, у апублікаваным у траўні справаздачы аб выкананні стандартаў супольнасці Facebook кампанія паведаміла, што ІІ і машыннае навучанне дапамаглі значна скараціць колькасць апублікаваных забароненых матэрыялаў у шасці з дзевяці катэгорый падобнага кантэнту.



Крыніца: 3dnews.ru

Дадаць каментар