Reklamalarni qanday tartibga solamiz

Reklamalarni qanday tartibga solamiz

Foydalanuvchilari o'z kontentini yaratishi mumkin bo'lgan har bir xizmat (UGC - Foydalanuvchi tomonidan yaratilgan kontent) nafaqat biznes muammolarini hal qilishga, balki UGCda narsalarni tartibga solishga ham majbur. Kambag'al yoki past sifatli kontentni moderatsiya qilish pirovardida foydalanuvchilar uchun xizmatning jozibadorligini pasaytiradi, hatto uning faoliyatini to'xtatadi.

Bugun biz sizga Yula va Odnoklassniki o'rtasidagi sinergiya haqida gapirib beramiz, bu bizga Yula'da reklamalarni samarali boshqarishga yordam beradi.

Umuman olganda, sinergiya juda foydali narsa va zamonaviy dunyoda texnologiyalar va tendentsiyalar juda tez o'zgarganda, u qutqaruvchiga aylanishi mumkin. Nega allaqachon ixtiro qilingan va sizning oldingizga kelgan narsalarni ixtiro qilish uchun kam resurslar va vaqtni behuda sarflash kerak?

Biz foydalanuvchi tarkibini - rasmlar, matn va havolalarni moderatsiya qilish bo'yicha to'liq vazifaga duch kelganimizda ham xuddi shunday fikrda edik. Bizning foydalanuvchilarimiz har kuni Yula-ga millionlab kontentni yuklaydilar va avtomatik ishlovsiz ushbu ma'lumotlarni qo'lda boshqarish mutlaqo mumkin emas.

Shuning uchun biz tayyor moderatsiya platformasidan foydalandik, bu vaqtga kelib Odnoklassnikidagi hamkasblarimiz uni “deyarli mukammal” holatga keltirishdi.

Nima uchun Odnoklassniki?

Har kuni ijtimoiy tarmoqqa o'n millionlab foydalanuvchilar keladi va milliardlab kontentni nashr etadi: fotosuratlardan tortib video va matnlargacha. Odnoklassniki moderatsiya platformasi juda katta hajmdagi ma'lumotlarni tekshirish va spamerlar va botlarga qarshi turishga yordam beradi.

OK moderator jamoasi juda ko'p tajriba to'pladi, chunki u o'z vositasini 12 yil davomida takomillashtirib kelmoqda. Muhimi, ular nafaqat o'zlarining tayyor echimlarini baham ko'rishlari, balki platformasining arxitekturasini bizning aniq vazifalarimizga mos ravishda sozlashlari mumkin.

Reklamalarni qanday tartibga solamiz

Bundan buyon, qisqalik uchun biz OK moderatsiya platformasini shunchaki “platforma” deb ataymiz.

Hammasi qanday ishlaydi

Yula va Odnoklassniki o'rtasida ma'lumotlar almashinuvi yo'lga qo'yilgan Apache Kafka.

Nima uchun biz ushbu vositani tanladik:

  • Yulada barcha reklamalar post-moderatsiya qilingan, shuning uchun dastlab sinxron javob talab qilinmagan.
  • Agar yomon paragraf ro'y bersa va Yula yoki Odnoklassniki mavjud bo'lmasa, jumladan, ba'zi yuklamalar tufayli, Kafka ma'lumotlari hech qaerda yo'qolmaydi va keyinroq o'qilishi mumkin.
  • Platforma allaqachon Kafka bilan integratsiyalangan edi, shuning uchun ko'pgina xavfsizlik muammolari hal qilindi.

Reklamalarni qanday tartibga solamiz

Yula'da foydalanuvchi tomonidan yaratilgan yoki o'zgartirilgan har bir reklama uchun ma'lumotlarga ega JSON yaratiladi, u keyingi moderatsiya uchun Kafkaga joylashtiriladi. Kafkadan e'lonlar platformaga yuklanadi, u erda ular avtomatik yoki qo'lda ko'rib chiqiladi. Yomon reklamalar sabab bilan bloklanadi va platforma qoidabuzarliklarni topmaganlar "yaxshi" deb belgilanadi. Keyin barcha qarorlar Yula-ga qaytariladi va xizmatda qo'llaniladi.

Oxir-oqibat, Yula uchun hammasi oddiy harakatlarga to'g'ri keladi: Odnoklassniki platformasiga reklama yuboring va "ok" rezolyutsiyasini qaytarib oling yoki nima uchun "ok" emas.

Avtomatik ishlov berish

Reklama platformaga tushganidan keyin nima bo'ladi? Har bir reklama bir nechta ob'ektlarga bo'lingan:

  • ism,
  • tavsifi
  • fotosuratlar,
  • foydalanuvchi tanlagan reklama toifasi va pastki toifasi,
  • narxlari

Reklamalarni qanday tartibga solamiz

Keyin platforma dublikatlarni topish uchun har bir ob'ekt uchun klasterlashni amalga oshiradi. Bundan tashqari, matn va fotosuratlar turli sxemalar bo'yicha klasterlangan.

Klasterlashdan oldin matnlar maxsus belgilar, o'zgartirilgan harflar va boshqa axlatlarni olib tashlash uchun normallashtiriladi. Qabul qilingan ma'lumotlar N-grammlarga bo'linadi, ularning har biri xeshlanadi. Natijada ko'plab noyob xeshlar mavjud. Matnlar orasidagi o'xshashlik bilan belgilanadi Jakkar o'lchovi hosil bo'lgan ikkita to'plam o'rtasida. Agar o'xshashlik chegaradan katta bo'lsa, matnlar bitta klasterga birlashtiriladi. Shu kabi klasterlarni qidirishni tezlashtirish uchun MinHash va Locality sezgir xeshlash qo'llaniladi.

Fotosuratlar uchun tasvirlarni yopishtirishning turli xil variantlari ixtiro qilingan, pHash rasmlarini taqqoslashdan tortib neyron tarmoq yordamida dublikatlarni qidirishgacha.

Oxirgi usul eng "og'ir" hisoblanadi. Modelni o'rgatish uchun tasvirlarning uchligi (N, A, P) tanlandi, ularda N A ga o'xshamaydi, P esa A ga o'xshaydi (yarim dublikat). Keyin neyron tarmoq A va P ni iloji boricha yaqinlashtirishni, A va N ni esa iloji boricha uzoqroq qilishni o'rgandi. Bu oldindan o'rgatilgan tarmoqdan o'rnatishlarni olish bilan solishtirganda kamroq noto'g'ri pozitivlarga olib keladi.

Neyron tarmoq tasvirlarni kirish sifatida qabul qilganda, ularning har biri uchun N(128) o'lchamli vektor hosil qiladi va tasvirning yaqinligini baholash uchun so'rov yuboriladi. Keyinchalik, yaqin tasvirlar dublikat deb hisoblanadigan chegara hisoblanadi.

Model pHash taqqoslashni chetlab o'tish uchun bir xil mahsulotni turli burchaklardan suratga oladigan spamerlarni mohirlik bilan topa oladi.

Reklamalarni qanday tartibga solamizReklamalarni qanday tartibga solamiz
Neyron tarmog'i tomonidan bir-biriga yopishtirilgan spam-fotosuratlarga misol.

Yakuniy bosqichda ikki nusxadagi reklamalar bir vaqtning o'zida matn va rasm bo'yicha qidiriladi.

Agar ikkita yoki undan ortiq reklama klasterda bir-biriga yopishtirilgan bo'lsa, tizim avtomatik bloklashni boshlaydi, bu ma'lum algoritmlardan foydalangan holda qaysi dublikatlarni o'chirish va qaysi birini qoldirishni tanlaydi. Misol uchun, agar ikkita foydalanuvchining reklamada bir xil fotosuratlari bo'lsa, tizim oxirgi reklamani bloklaydi.

Yaratilgandan so'ng, barcha klasterlar bir qator avtomatik filtrlardan o'tadi. Har bir filtr klasterga ball qo'yadi: unda ushbu filtr aniqlagan tahdid mavjudligi ehtimoli qanchalik katta.

Masalan, tizim reklamadagi tavsifni tahlil qiladi va u uchun potentsial toifalarni tanlaydi. Keyin u maksimal ehtimolga ega bo'lganini oladi va uni e'lon muallifi ko'rsatgan toifa bilan taqqoslaydi. Agar ular mos kelmasa, reklama noto'g'ri toifa uchun bloklanadi. Biz mehribon va halol bo'lganimiz sababli, biz foydalanuvchiga reklama moderatsiyadan o'tishi uchun qaysi toifani tanlashi kerakligini to'g'ridan-to'g'ri aytamiz.

Reklamalarni qanday tartibga solamiz
Noto'g'ri toifa uchun blokirovka qilish haqida bildirishnoma.

Mashinani o'rganish bizning platformamizda o'zini uyda his qiladi. Masalan, uning yordami bilan biz Rossiya Federatsiyasida taqiqlangan tovarlarning nomlari va tavsiflarini qidiramiz. Neyron tarmoq modellari esa tasvirlarni URL manzillari, spam-matnlari, telefon raqamlari va bir xil “taqiqlangan” ma’lumotlarni o‘z ichiga olgan yoki yo‘qligini aniqlash uchun sinchkovlik bilan “tekshiradi”.

Taqiqlangan mahsulotni qonuniy deb yashirgan holda sotishga urinayotgan va sarlavhada ham, tavsifda ham matn bo'lmagan hollarda biz rasm tegidan foydalanamiz. Har bir rasm uchun rasmda nima borligini tavsiflovchi 11 mingtagacha turli teglar qo'shilishi mumkin.

Reklamalarni qanday tartibga solamiz
Qalyanni samovar ko‘rinishida sotmoqchi bo‘lishyapti.

Murakkab filtrlar bilan bir qatorda oddiylari ham ishlaydi, matn bilan bog'liq aniq muammolarni hal qiladi:

  • antimat;
  • URL va telefon raqami detektori;
  • messenjerlar va boshqa aloqalarni eslatish;
  • arzonlashtirilgan narx;
  • hech narsa sotilmaydigan reklamalar va boshqalar.

Bugungi kunda har bir reklama 50 dan ortiq avtomatik filtrlardan iborat nozik elakdan o'tadi, ular reklamada yomon narsani topishga harakat qilishadi.

Agar detektorlarning hech biri ishlamagan bo'lsa, Yula-ga reklama "ehtimol" mukammal tartibda ekanligi haqida javob yuboriladi. Biz ushbu javobdan o'zimiz foydalanamiz va sotuvchiga obuna bo'lgan foydalanuvchilar yangi mahsulot mavjudligi haqida xabar olishadi.

Reklamalarni qanday tartibga solamiz
Sotuvchining yangi mahsuloti borligi haqida xabar.

Natijada, har bir e'lon metama'lumotlar bilan "to'lib ketadi", ularning bir qismi reklama yaratilganda hosil bo'ladi (muallifning IP manzili, foydalanuvchi-agent, platforma, geolokatsiya va boshqalar), qolganlari esa har bir filtr tomonidan berilgan balldir. .

E'lon navbatlari

Reklama platformaga tushganda, tizim uni navbatlardan biriga qo'yadi. Har bir navbat har qanday yomon naqshlarni aniqlaydigan tarzda reklama metama'lumotlarini birlashtirgan matematik formuladan foydalangan holda yaratilgan.

Misol uchun, siz "Uyali telefonlar" turkumidagi "Yula" foydalanuvchilaridan go'yoki Sankt-Peterburgdan kelgan reklamalar navbatini yaratishingiz mumkin, ammo ularning IP manzillari Moskva yoki boshqa shaharlardan.

Reklamalarni qanday tartibga solamiz
Turli shaharlarda bitta foydalanuvchi tomonidan joylashtirilgan reklamalarga misol.

Yoki siz neyron tarmoq reklamalarga bergan ballar asosida ularni kamayish tartibida tartibga solib, navbatlar yaratishingiz mumkin.

Har bir navbat, o'z formulasiga ko'ra, reklama uchun yakuniy ballni belgilaydi. Keyin turli yo'llar bilan davom etishingiz mumkin:

  • reklama blokirovkaning ma'lum bir turini oladigan chegarani belgilang;
  • navbatdagi barcha e'lonlarni qo'lda ko'rib chiqish uchun moderatorlarga yuborish;
  • yoki oldingi variantlarni birlashtiring: avtomatik blokirovka chegarasini belgilang va ushbu chegaraga yetmagan reklamalarni moderatorlarga yuboring.

Reklamalarni qanday tartibga solamiz

Nima uchun bu navbatlar kerak? Aytaylik, foydalanuvchi o‘qotar qurol suratini yukladi. Neyron tarmoq unga 95 dan 100 gacha ball beradi va rasmda qurol borligini 99 foiz aniqlik bilan aniqlaydi. Ammo agar ball qiymati 95% dan past bo'lsa, modelning aniqligi pasayishni boshlaydi (bu neyron tarmoq modellarining xususiyati).

Natijada, ball modeli asosida navbat hosil bo'ladi va 95 dan 100 gacha bo'lgan reklamalar avtomatik ravishda "Taqiqlangan mahsulotlar" sifatida bloklanadi. 95 balldan past bo'lgan e'lonlar qo'lda ishlov berish uchun moderatorlarga yuboriladi.

Reklamalarni qanday tartibga solamiz
Patronli shokoladli Beretta. Faqat qo'lda moderatsiya uchun! 🙂

Qo'lda moderatsiya

2019 yil boshida Yula-dagi barcha reklamalarning qariyb 94 foizi avtomatik tarzda moderatsiya qilinadi.

Reklamalarni qanday tartibga solamiz

Agar platforma ba'zi reklamalar bo'yicha qaror qabul qila olmasa, ularni qo'lda moderatsiyaga yuboradi. Odnoklassniki o'z vositasini ishlab chiqdi: moderatorlar uchun vazifalar tezda qaror qabul qilish uchun barcha kerakli ma'lumotlarni darhol aks ettiradi - reklama mos keladi yoki sababini ko'rsatib, bloklanishi kerak.

Va qo'lda moderatsiya paytida xizmat sifati yomonlashmasligi uchun odamlarning ishi doimiy ravishda nazorat qilinadi. Masalan, vazifa oqimida moderatorga "tuzoqlar" ko'rsatiladi - ular uchun allaqachon tayyor echimlar mavjud bo'lgan reklamalar. Agar moderatorning qarori tugagan qaror bilan mos kelmasa, moderatorga xatolik beriladi.

Moderator bitta reklamani tekshirish uchun o'rtacha 10 soniya vaqt sarflaydi. Bundan tashqari, xatolar soni barcha tasdiqlangan reklamalarning 0,5% dan ko'p emas.

Odamlarning mo''tadilligi

Odnoklassnikidagi hamkasblar yanada uzoqroqqa borishdi va "tomoshabinlar yordami" dan foydalanishdi: ular ijtimoiy tarmoq uchun o'yin ilovasini yozishdi, unda siz tezda katta hajmdagi ma'lumotlarni belgilashingiz mumkin bo'lgan ba'zi yomon belgilarni ta'kidlab o'tishdi - Odnoklassniki Moderatori (https://ok.ru/app/moderator). Kontentni yanada qiziqarli qilishga harakat qilayotgan OK foydalanuvchilari yordamidan foydalanishning yaxshi usuli.

Reklamalarni qanday tartibga solamiz
Foydalanuvchilar telefon raqami bo'lgan fotosuratlarga teg qo'yadigan o'yin.

Platformadagi har qanday reklama navbatini Odnoklassniki Moderator o'yiniga yo'naltirish mumkin. O'yin foydalanuvchilari belgilagan hamma narsa keyinchalik tekshirish uchun ichki moderatorlarga yuboriladi. Ushbu sxema filtrlari hali yaratilmagan reklamalarni bloklash va bir vaqtning o'zida o'quv namunalarini yaratish imkonini beradi.

Moderatsiya natijalarini saqlash

Biz moderatsiya paytida qabul qilingan barcha qarorlarni saqlaymiz, shunda biz allaqachon qaror qilgan reklamalarni qayta ishlamaymiz.

Har kuni reklamalar asosida millionlab klasterlar yaratiladi. Vaqt o'tishi bilan har bir klaster "yaxshi" yoki "yomon" deb nomlanadi. Belgilangan klasterga kirgan har bir yangi e'lon yoki uning tahriri avtomatik ravishda klasterning o'zidan rezolyutsiyani oladi. Kuniga 20 mingga yaqin bunday avtomatik ruxsatlar mavjud.

Reklamalarni qanday tartibga solamiz

Agar klasterga yangi e'lonlar kelmasa, u xotiradan o'chiriladi va uning xesh va yechimi Apache Kassandraga yoziladi.

Platforma yangi reklamani olganida, avvalo yaratilganlar orasida o'xshash klasterni topishga va undan yechim olishga harakat qiladi. Agar bunday klaster bo'lmasa, platforma Kassandraga boradi va u erga qaraydi. Siz topdingizmi? Ajoyib, yechimni klasterga qo'llaydi va uni Yulaga yuboradi. Har kuni o'rtacha 70 mingta shunday "takroriy" qarorlar mavjud - bu umumiy miqdorning 8 foizi.

sarhisob qilar ekanmiz

Biz Odnoklassniki moderatsiya platformasidan ikki yarim yildan beri foydalanamiz. Bizga natijalar yoqadi:

  • Biz kuniga barcha reklamalarning 94 foizini avtomatik tarzda o'rnatamiz.
  • Bitta reklamani moderatsiya qilish narxi 2 rubldan 7 tiyinga tushirildi.
  • Tayyor vosita tufayli biz moderatorlarni boshqarish muammolarini unutdik.
  • Xuddi shu miqdordagi moderatorlar va byudjet bilan qo'lda ishlangan reklamalar sonini 2,5 barobarga oshirdik. Avtomatlashtirilgan boshqaruv tufayli qo'lda moderatsiya sifati ham oshdi va xatolarning 0,5% atrofida o'zgarib turadi.
  • Biz spamning yangi turlarini tezda filtrlar bilan yopamiz.
  • Biz tezda yangi bo'limlarni moderatsiyaga ulaymiz "Yula vertikallari". 2017 yildan beri Yula ko'chmas mulk, bo'sh ish o'rinlari va avtoulov vertikallarini qo'shdi.

Manba: www.habr.com

a Izoh qo'shish