Жарнамаларды кантип жөнгө салабыз

Жарнамаларды кантип жөнгө салабыз

Колдонуучулары өз мазмунун түзө алган ар бир кызмат (UGC - Колдонуучу тарабынан түзүлгөн мазмун) бизнес көйгөйлөрүн чечүүгө гана эмес, ошондой эле UGCдеги нерселерди иретке келтирүүгө мажбур. Начар же сапатсыз мазмундун модерациясы акыр аягында анын ишин токтотууга чейин, анын ичинде колдонуучулар үчүн кызматтын жагымдуулугун төмөндөтүшү мүмкүн.

Бүгүн биз Юла менен Одноклассникинин ортосундагы синергетика жөнүндө айтып беребиз, ал бизге Юладагы жарнамаларды эффективдүү башкарууга жардам берет.

Жалпысынан синергия - бул абдан пайдалуу нерсе жана заманбап дүйнөдө, технологиялар жана тенденциялар абдан тез өзгөргөндө, ал куткаруучуга айланып кетиши мүмкүн. Эмне үчүн буга чейин ойлоп табылган жана сиздин алдыңызга келген нерсени ойлоп табуу үчүн жетишсиз ресурстарды жана убакытты текке кетирүү керек?

Колдонуучунун мазмунун - сүрөттөрдү, текстти жана шилтемелерди модерациялоонун толук милдети менен бетме-бет келгенибизде биз да ушундай ойлогонбуз. Биздин колдонуучулар күн сайын Юлага миллиондогон мазмунду жүктөп беришет жана автоматтык түрдө иштетилбестен, бул маалыматтардын баарын кол менен модерациялоо таптакыр мүмкүн эмес.

Ошондуктан, биз даяр модерация платформасын колдондук, ал убакта биздин Одноклассникидеги кесиптештерибиз аны “дээрлик жеткилеңдикке” жеткен.

Эмне үчүн Одноклассники?

Күн сайын он миллиондогон колдонуучулар социалдык тармакка келип, миллиарддаган мазмунду жарыялашат: сүрөттөрдөн видеолорго жана тексттерге чейин. Одноклассники модерация платформасы өтө чоң көлөмдөгү маалыматтарды текшерүүгө жана спам жасоочуларга жана ботторго каршы турууга жардам берет.

OK модератордук командасы 12 жылдан бери өзүнүн куралын өркүндөтүп келе жаткандыктан, көп тажрыйба топтоду. Алар өздөрүнүн даяр чечимдерин гана бөлүшпөстөн, платформасынын архитектурасын биздин конкреттүү милдеттерибизге ылайыкташтыра алышы маанилүү.

Жарнамаларды кантип жөнгө салабыз

Мындан ары, кыскача айтканда, биз OK модерация платформасын жөн гана "платформа" деп атайбыз.

Баары кантип иштейт

Юла жана Одноклассники ортосунда маалымат алмашуу аркылуу орнотулган Апачи Кафка.

Эмне үчүн биз бул куралды тандап алдык:

  • Юлада бардык жарнамалар пост-модерацияланган, андыктан алгач синхрондуу жооп талап кылынган эмес.
  • Эгерде жаман абзац болуп калса жана Юла же Одноклассники жеткиликсиз болсо, анын ичинде кээ бир жогорку жүктөмдөрдөн улам, Кафкадагы маалыматтар эч жерде жок болуп кетпейт жана кийинчерээк окуса болот.
  • Платформа мурунтан эле Кафка менен интеграцияланган, ошондуктан көпчүлүк коопсуздук маселелери чечилген.

Жарнамаларды кантип жөнгө салабыз

Юлада колдонуучу тарабынан түзүлгөн же өзгөртүлгөн ар бир жарнама үчүн маалыматтары бар JSON түзүлөт, ал кийинки модерация үчүн Кафкада жайгаштырылат. Кафкадан кулактандыруулар платформага жүктөлүп, алар автоматтык түрдө же кол менен каралат. Жаман жарнамалар себеп менен бөгөттөлөт, ал эми платформа бузууларды таппагандары "жакшы" деп белгиленет. Андан кийин бардык чечимдер Юлага кайра жөнөтүлүп, кызматта колдонулат.

Акыр-аягы, Юла үчүн баары жөнөкөй иш-аракеттерге келет: Одноклассники платформасына жарнама жөнөтүп, "макул" деген резолюцияны кайтарып алыңыз, же эмне үчүн "макул".

Автоматтык иштетүү

Жарнама платформага түшкөндөн кийин эмне болот? Ар бир жарнама бир нече объекттерге бөлүнөт:

  • аты,
  • сүрөттөлүшү,
  • сүрөттөр,
  • колдонуучу тандаган категория жана жарнаманын субкатегориясы,
  • баасы.

Жарнамаларды кантип жөнгө салабыз

Андан кийин платформа дубликаттарды табуу үчүн ар бир объект үчүн кластерлөө жүргүзөт. Мындан тышкары, текст жана сүрөттөр ар кандай схемалар боюнча кластерленген.

Кластерлөөнүн алдында тексттер атайын белгилерди, өзгөртүлгөн тамгаларды жана башка таштандыларды алып салуу үчүн нормалдаштырылган. Кабыл алынган маалыматтар N-граммдарга бөлүнөт, алардын ар бири хэштелген. Натыйжада көптөгөн уникалдуу хэштер. Тексттердин ортосундагы окшоштук менен аныкталат Жаккардын өлчөмү пайда болгон эки топтомдун ортосунда. Окшоштук босогодон жогору болсо, анда тексттер бир кластерге бириктирилет. Окшош кластерлерди издөөнү тездетүү үчүн MinHash жана Locality-сезимтал хэшинг колдонулат.

Сүрөттөр үчүн сүрөттөрдү жабыштыруунун ар кандай варианттары ойлоп табылган, pHash сүрөттөрүн салыштыруудан тартып, нейрондук тармак аркылуу дубликаттарды издөөгө чейин.

Акыркы ыкма эң "оор" болуп саналат. Модельди үйрөтүү үчүн сүрөттөрдүн үчилтиктери (N, A, P) тандалган, анда N Aга окшош эмес, ал эми P Aга окшош (жарым дубликат). Андан кийин нейрондук тармак А жана Р мүмкүн болушунча жакын, ал эми А менен Н мүмкүн болушунча алыс кылууну үйрөндү. Бул алдын ала даярдалган тармактан жалгаштырууларды алуу менен салыштырганда жалган позитивдерди азыраак кылат.

Нейрондук тармак сүрөттөрдү киргизүү катары кабыл алганда, алардын ар бири үчүн N(128)-өлчөмдүү векторду жаратат жана сүрөттүн жакындыгын баалоо өтүнүчү берилет. Андан кийин, жакын сүрөттөр дубликат деп эсептелген босого эсептелет.

Модель pHash салыштыруусун айланып өтүү үчүн бир эле продуктуну ар кайсы бурчтан сүрөткө тарткан спам жасоочуларды чебер таба алат.

Жарнамаларды кантип жөнгө салабызЖарнамаларды кантип жөнгө салабыз
Нейрондук тармак тарабынан дубликат катары чапталган спам сүрөттөрүнүн мисалы.

Акыркы этапта кайталанган жарнактар ​​текст жана сүрөт боюнча бир эле учурда изделет.

Эгерде эки же андан көп жарнамалар кластерде жабышып калса, система автоматтык түрдө бөгөттөөнү баштайт, ал белгилүү алгоритмдерди колдонуу менен кайсы дубликаттарды жок кылууну жана кайсынысын калтырууну тандайт. Мисалы, эки колдонуучунун жарнактагы сүрөттөрү бирдей болсо, система акыркы жарнакты бөгөттөйт.

Түзүлгөндөн кийин, бардык кластерлер бир катар автоматтык чыпкалардан өтөт. Ар бир чыпка кластерге упай ыйгарат: ал бул чыпка аныктаган коркунучту камтышы мүмкүн.

Мисалы, система жарнамадагы сыпаттаманы талдап, ал үчүн потенциалдуу категорияларды тандайт. Андан кийин максималдуу ыктымалдыкты алып, аны жарнаманын автору көрсөткөн категория менен салыштырат. Алар дал келбесе, жарнама туура эмес категория үчүн бөгөттөлөт. Жана биз боорукер жана чынчыл болгондуктан, жарнама модерациядан өтүшү үчүн колдонуучуга кайсы категорияны тандоо керек экенин түздөн-түз айтабыз.

Жарнамаларды кантип жөнгө салабыз
Туура эмес категория үчүн бөгөттөө жөнүндө билдирүү.

Машина үйрөнүү биздин платформада үйдөй сезилет. Мисалы, анын жардамы менен биз Россия Федерациясында тыюу салынган товарлардын аталыштарын жана сүрөттөмөлөрүн издейбиз. Ал эми нейрон тармагынын моделдери сүрөттөрдө URL даректери, спам тексттери, телефон номерлери жана ошол эле "тыюу салынган" маалымат бар-жоктугун билүү үчүн кылдаттык менен "карашат".

Алар мыйзамдуу нерсеге жамынган тыюу салынган продуктуну сатууга аракет кылып жаткан учурларда жана аталышында же сүрөттөмөсүндө эч кандай текст жок болсо, биз сүрөттүн тегдерин колдонобуз. Ар бир сүрөт үчүн, сүрөттө эмне бар экенин сүрөттөгөн 11 миңге чейин ар кандай тегдерди кошууга болот.

Жарнамаларды кантип жөнгө салабыз
Кальянды самоордун кейпин кийип сатууга аракет кылып жатышат.

Татаал чыпкалар менен катар эле жөнөкөйлөр да иштейт, текстке байланыштуу ачык көйгөйлөрдү чечет:

  • антимат;
  • URL жана телефон номери детектору;
  • мессенджерлерди жана башка байланыштарды айтуу;
  • арзандатылган баа;
  • эч нерсе сатылбаган жарнактар ​​ж.б.

Бүгүнкү күндө ар бир жарнама 50дөн ашык автоматтык чыпкалардан турат, алар жарнамадан жаман нерсени табууга аракет кылышат.

Эгерде детекторлордун бири да иштебесе, анда Юлага жарнама эң сонун тартипте "болушу мүмкүн" деген жооп жөнөтүлөт. Бул жоопту биз өзүбүз колдонобуз жана сатуучуга жазылган колдонуучулар жаңы продуктунун бар экендиги жөнүндө билдирүү алышат.

Жарнамаларды кантип жөнгө салабыз
Сатуучуда жаңы товар бар экендиги жөнүндө билдирүү.

Натыйжада, ар бир жарнак метаберилиштерге "көбөйүп", алардын бир бөлүгү жарнама түзүлгөндө түзүлөт (автордун IP дареги, колдонуучу-агент, платформа, геолокация ж.б.), калганы ар бир фильтр тарабынан берилген балл болуп саналат. .

Жарыялоо кезектери

Жарнама платформага түшкөндө, система аны кезектердин бирине коёт. Ар бир кезек математикалык формуланы колдонуу менен түзүлөт, ал жарнама метадайындарын ар кандай жаман үлгүлөрдү аныктай тургандай бириктирет.

Мисалы, сиз "Уюлдук телефондор" категориясындагы жарнамалардын кезегин Петербургдан келген Юла колдонуучуларынан түзө аласыз, бирок алардын IP даректери Москвадан же башка шаарлардан.

Жарнамаларды кантип жөнгө салабыз
Ар кайсы шаарларда бир колдонуучу тарабынан жарыяланган жарнактын мисалы.

Же нейрондук тармак жарнамаларга ыйгарган упайлардын негизинде, аларды азаюу иретинде тизип, кезек түзө аласыз.

Ар бир кезек, өзүнүн формуласына ылайык, жарнакка акыркы балл берет. Андан кийин сиз ар кандай жолдор менен уланта аласыз:

  • жарнама бөгөттөөнүн белгилүү бир түрүн ала турган босогону көрсөтүү;
  • кезектеги бардык жарнамаларды кол менен карап чыгуу үчүн модераторлорго жөнөтүү;
  • же мурунку варианттарды бириктириңиз: автоматтык бөгөттөө босогосун белгилеңиз жана бул босогого жете элек жарнамаларды модераторлорго жөнөтүңүз.

Жарнамаларды кантип жөнгө салабыз

Бул кезектер эмне үчүн керек? Колдонуучу ок атуучу куралдын сүрөтүн жүктөдү дейли. Нейрондук тармак ага 95тен 100гө чейин балл берип, сүрөттө курал бар экенин 99 пайыздык тактык менен аныктайт. Бирок баллдын мааниси 95% дан төмөн болсо, моделдин тактыгы төмөндөй баштайт (бул нейрондук тармак моделдеринин өзгөчөлүгү).

Натыйжада, упай үлгүсүнүн негизинде кезек түзүлүп, 95тен 100гө чейин түшкөн жарнамалар автоматтык түрдө "Тыюу салынган продуктулар" катары бөгөттөлөт. 95 баллдан төмөн болгон жарнамалар кол менен иштетүү үчүн модераторлорго жөнөтүлөт.

Жарнамаларды кантип жөнгө салабыз
Шоколад Беретта картридждери менен. Кол менен модерациялоо үчүн гана! 🙂

Кол менен модерациялоо

2019-жылдын башында Юладагы бардык жарнамалардын болжол менен 94% автоматтык түрдө модерацияланат.

Жарнамаларды кантип жөнгө салабыз

Эгер платформа айрым жарнамаларды чече албаса, аларды кол менен модерациялоого жөнөтөт. Одноклассники өзүнүн инструментин иштеп чыккан: модераторлор үчүн тапшырмалар тез чечим кабыл алуу үчүн бардык керектүү маалыматты дароо көрсөтөт - жарнама ылайыктуу же себебин көрсөтүү менен бөгөттөлүшү керек.

Кол менен модерациялоо учурунда тейлөөнүн сапаты жабыркабашы үчүн, адамдардын иши дайыма көзөмөлдөнүп турат. Мисалы, тапшырма агымында модераторго "тузактар" көрсөтүлөт - алар үчүн мурунтан эле даяр чечимдер бар. Модератордун чечими даяр чечим менен дал келбесе, модераторго ката берилет.

Орточо алганда, модератор бир жарнаманы текшерүүгө 10 секунд коротот. Мындан тышкары, каталардын саны бардык текшерилген жарнамалардын 0,5% дан көп эмес.

Элдик модерация

Одноклассникидеги кесиптештер андан да ары барышып, "аудиториянын жардамынан" пайдаланышты: алар социалдык тармак үчүн оюн тиркемесин жазышты, анда сиз чоң көлөмдөгү маалыматтарды тез эле белгилеп, кандайдыр бир жаман белгини баса аласыз - Одноклассники Модератору (https://ok.ru/app/moderator). Мазмунду жагымдуураак кылууга аракет кылып жаткан OK колдонуучуларынын жардамынан пайдалануунун жакшы жолу.

Жарнамаларды кантип жөнгө салабыз
Колдонуучулар телефон номери бар сүрөттөрдү белгилей турган оюн.

Платформадагы жарнамалардын каалаган кезегин Odnoklassniki Модератор оюнуна багыттаса болот. Оюндун колдонуучулары белгилеген нерселердин баары карап чыгуу үчүн ички модераторлорго жөнөтүлөт. Бул схема фильтрлери түзүлө элек жарнамаларды бөгөттөп, бир эле учурда окуу үлгүлөрүн түзүүгө мүмкүндүк берет.

Модерация натыйжаларын сактоо

Биз модерация учурунда кабыл алынган бардык чечимдерди сактайбыз, ошондуктан биз буга чейин чечим кабыл алган жарнактарды кайра иштетпейбиз.

Жарнамалардын негизинде күн сайын миллиондогон кластерлер түзүлөт. Убакыттын өтүшү менен ар бир кластер "жакшы" же "жаман" деп аталат. Белги менен кластерге кирген ар бир жаңы жарнак же анын версиясы автоматтык түрдө кластердин өзүнөн резолюцияны алат. Күнүнө 20 миңге жакын мындай автоматтык токтомдор бар.

Жарнамаларды кантип жөнгө салабыз

Эгерде кластерге жаңы кулактандыруулар келбесе, ал эстутумдан алынып салынат жана анын хэштери жана чечими Apache Cassandra'га жазылат.

Платформа жаңы жарнаманы алганда, алгач түзүлгөндөрдүн арасынан окшош кластерди табууга аракет кылат жана андан бир чечим кабыл алат. Андай кластер жок болсо, платформа Кассандрага барып, ошол жакка карайт. Таптыңбы? Улуу, чечимди кластерге колдонот жана аны Юлага жөнөтөт. Күн сайын орто эсеп менен 70 миңге жакын мындай “кайталануучу” чечимдер кабыл алынат — бул жалпы сандын 8%.

жыйынтыктап жатып

Одноклассники модерация платформасын эки жарым жылдан бери колдонуп келебиз. Бизге натыйжалар жагат:

  • Биз күнүнө бардык жарнамалардын 94% автоматтык түрдө модернизациялайбыз.
  • Бир жарнаманы модерациялоонун баасы 2 рублдан 7 тыйынга чейин арзандады.
  • Даяр инструменттин аркасында биз модераторлорду башкаруу көйгөйлөрүн унутуп калдык.
  • Биз кол менен иштетилген жарнамалардын санын 2,5 эсеге көбөйттүк, ошол эле модераторлор жана бюджет менен. Автоматташтырылган башкаруунун эсебинен кол менен модерациялоонун сапаты да жогорулап, каталардын 0,5% тегерегинде өзгөрүп турат.
  • Биз спамдын жаңы түрлөрүн чыпкалар менен тез жаап жатабыз.
  • Жаңы бөлүмдөрдү модерацияга тез байланыштырабыз "Юла Вертикалдар". 2017-жылдан бери Юла кыймылсыз мүлк, бош орундар жана авто вертикалдарды кошкон.

Source: www.habr.com

Комментарий кошуу