Алгоритми Facebook допоможуть інтернет-компаніям шукати дублікати відео та зображень для боротьби з неприпустимим контентом

Facebook оголосила про відкриття вихідного коду двох алгоритмів, здатних визначати ступінь ідентичності для фотографій та відео, навіть якщо до них внесено невеликі зміни. Ці алгоритми соціальна мережа активно використовує для боротьби з контентом, що містить матеріали, пов'язані з експлуатацією дітей, терористичною пропагандою та різними формами насильства. Facebook зазначає, що вона вперше поділилася подібною технологією, і в компанії сподіваються, що з її допомогою інші великі портали та сервіси, невеликі студії з розробки програмного забезпечення та некомерційні організації зможуть ефективніше боротися з поширенням неприпустимого медіа-контенту у світовій Мережі.

Алгоритми Facebook допоможуть інтернет-компаніям шукати дублікати відео та зображень для боротьби з неприпустимим контентом

"Коли ми знаходимо фрагмент неприпустимого контенту, технології можуть допомогти нам знайти всі його дублікати і запобігти їх поширенню", - пишуть глава служби безпеки Facebook Антігона Девіс (Antigone Davis) і віце-президент з чесності Гі Розен (Guy Rosen) у своєму пості. приуроченому до четвертого щорічного хакатона «Безпека дітей у Facebook». "Для тих, хто вже використовує свою власну або іншу технологію зіставлення контенту, наші технології можуть стати ще одним рівнем захисту, роблячи системи безпеки набагато потужнішими".

Facebook стверджує, що два опубліковані алгоритми - PDQ і TMK + PDQ - були розроблені для роботи з величезними масивами даних і засновані на вже існуючих моделях і реалізаціях, включаючи pHash, PhotoDNA від Microsoft, aHash і dHash. Наприклад, алгоритм PDQ для порівняння фотографій був натхненний pHash, але при цьому розроблений повністю з нуля розробниками з Facebook, у той час як зіставляючий відео TMK+PDQF створений спільними зусиллями дослідницької групи Facebook з штучного інтелекту та вченими з Університету Модени та Реджо-Емілії Італії.

Обидва алгоритми аналізують файли, що шукаються, завдяки коротким цифровим хешам, унікальним ідентифікаторам, які допомагають визначити, чи є два файли однаковими або схожими, навіть без вихідного зображення або відео. Facebook зазначає, що дані хеші можуть бути легко передані іншим компаніям та некомерційним організаціям, а також галузевим партнерам через Глобальний інтернет-форум боротьби з тероризмом (GIFCT), тому всі зацікавлені в мережевій безпеці компанії також зможуть видаляти контент, помічений Facebook як небезпечний, якщо він завантажений у їхні послуги.

Розробка PDQ і TMK + PDQ пішла слідом за релізом вищезгаданої PhotoDNA 10 років тому у спробі боротьби з дитячою порнографією у мережі з боку Microsoft. Також недавно Google запустила Content Safety API, платформу штучного інтелекту, призначену для виявлення онлайн-матеріалів про сексуальні наруги над дітьми, щоб зробити роботу людей-модераторів більш ефективною.

У свою чергу, глава Facebook Марк Цукерберг вже давно стверджує, що ІІ в найближчому майбутньому істотно скоротить кількість зловживань, що здійснюються мільйонами несумлінних користувачів Facebook. І справді, в опублікованому в травні звіт про дотримання стандартів спільноти Facebook компанія повідомила, що ІІ та машинне навчання допомогли значно скоротити кількість опублікованих заборонених матеріалів у шести з дев'яти категорій подібного контенту.



Джерело: 3dnews.ru

Додати коментар або відгук