Kā mēs regulējam reklāmas

Kā mēs regulējam reklāmas

Katrs serviss, kura lietotāji var izveidot savu saturu (UGC - User-generated content) ir spiests ne tikai risināt biznesa problēmas, bet arÄ« sakārtot lietas UGC. Slikta vai zemas kvalitātes satura regulÄ“Å”ana galu galā var samazināt pakalpojuma pievilcÄ«bu lietotājiem, pat izbeidzot tā darbÄ«bu.

Šodien mēs jums pastāstīsim par Yula un Odnoklassniki sinerģiju, kas palīdz mums efektīvi regulēt reklāmas Yula.

Sinerģija kopumā ir ļoti noderīga lieta, un mūsdienu pasaulē, kad tehnoloģijas un tendences mainās ļoti ātri, tā var pārvērsties par glābiņu. Kāpēc tērēt ierobežotos resursus un laiku, lai izgudrotu kaut ko tādu, kas jau ir izdomāts un ienācis prātā pirms jums?

Mēs domājām to paÅ”u, kad saskārāmies ar pilnu uzdevumu regulēt lietotāja saturu - attēlus, tekstu un saites. MÅ«su lietotāji katru dienu Yula augÅ”upielādē miljoniem satura, un bez automātiskas apstrādes ir pilnÄ«gi neiespējami manuāli regulēt visus Å”os datus.

Tāpēc mēs izmantojām gatavu moderÄ“Å”anas platformu, kuru lÄ«dz tam laikam mÅ«su kolēģi no Odnoklassniki bija pabeiguÅ”i lÄ«dz stāvoklim ā€œgandrÄ«z pilnÄ«baā€.

Kāpēc Odnoklassniki?

Katru dienu desmitiem miljonu lietotāju ierodas sociālajā tÄ«klā un publicē miljardiem satura daļu: no fotoattēliem lÄ«dz videoklipiem un tekstiem. Odnoklassniki moderÄ“Å”anas platforma palÄ«dz pārbaudÄ«t ļoti lielu datu apjomu un cÄ«nÄ«ties pret surogātpasta izplatÄ«tājiem un robotiem.

OK moderācijas komanda ir uzkrājusi lielu pieredzi, jo tā savu rīku pilnveido jau 12 gadus. Ir svarīgi, lai viņi varētu ne tikai dalīties ar saviem gatavajiem risinājumiem, bet arī pielāgot savas platformas arhitektūru, lai tā atbilstu mūsu konkrētajiem uzdevumiem.

Kā mēs regulējam reklāmas

Turpmāk Ä«suma labad OK moderÄ“Å”anas platformu vienkārÅ”i sauksim par ā€œplatformuā€.

Kā tas viss darbojas

Datu apmaiņa starp Yula un Odnoklassniki tiek izveidota caur Apache Kafka.

Kāpēc mēs izvēlējāmies Å”o rÄ«ku:

  • Julā visas reklāmas ir pēcpārbaudes, tāpēc sākotnēji sinhrona atbilde nebija nepiecieÅ”ama.
  • Ja notiek slikta rindkopa un Yula vai Odnoklassniki nav pieejami, tostarp dažu maksimālo slodžu dēļ, dati no Kafka nekur nepazudÄ«s un tos varēs izlasÄ«t vēlāk.
  • Platforma jau bija integrēta ar Kafka, tāpēc lielākā daļa droŔības problēmu tika atrisinātas.

Kā mēs regulējam reklāmas

Katrai reklāmai, ko lietotājs izveidojis vai modificējis pakalpojumā Yula, tiek Ä£enerēts JSON ar datiem, kas tiek ievietoti Kafkā turpmākai moderÄ“Å”anai. No Kafkas paziņojumi tiek ielādēti platformā, kur tie tiek izskatÄ«ti automātiski vai manuāli. Sliktas reklāmas tiek bloķētas ar iemeslu, un tās, kurās platforma neatrod pārkāpumus, tiek atzÄ«mētas kā ā€œlabasā€. Pēc tam visi lēmumi tiek nosÅ«tÄ«ti atpakaļ Yulai un tiek piemēroti dienestā.

Galu galā Julai viss ir saistÄ«ts ar vienkārŔām darbÄ«bām: nosÅ«tiet sludinājumu uz Odnoklassniki platformu un saņemiet atpakaļ rezolÅ«ciju ā€œokā€, vai kāpēc ne ā€œokā€.

Automātiska apstrāde

Kas notiek ar reklāmu pēc tam, kad tā nonāk platformā? Katra reklāma ir sadalīta vairākās vienībās:

  • Vārds,
  • apraksts,
  • fotogrāfijas,
  • lietotāja izvēlēta reklāmas kategorija un apakÅ”kategorija,
  • цŠµŠ½Š°.

Kā mēs regulējam reklāmas

Pēc tam platforma katrai entītijai veic klasterizāciju, lai atrastu dublikātus. Turklāt teksts un fotogrāfijas tiek grupēti pēc dažādām shēmām.

Pirms grupÄ“Å”anas teksti tiek normalizēti, lai noņemtu speciālās rakstzÄ«mes, mainÄ«tos burtus un citus atkritumus. Saņemtie dati tiek sadalÄ«ti N-gramos, no kuriem katrs ir sajaukts. Rezultātā ir daudz unikālu jaucēju. Tekstu lÄ«dzÄ«bu nosaka Žakarda mērs starp divām iegÅ«tajām kopām. Ja lÄ«dzÄ«ba ir lielāka par slieksni, tad teksti tiek sapludināti vienā klasterÄ«. Lai paātrinātu lÄ«dzÄ«gu klasteru meklÄ“Å”anu, tiek izmantota MinHash un lokāli jutÄ«ga jaukÅ”ana.

Fotogrāfijām ir izgudrotas dažādas attēlu lÄ«mÄ“Å”anas iespējas, sākot no pHash attēlu salÄ«dzināŔanas lÄ«dz dublikātu meklÄ“Å”anai, izmantojot neironu tÄ«klu.

Pēdējā metode ir "smagākā". Lai apmācÄ«tu modeli, tika atlasÄ«ti attēlu tripleti (N, A, P), kuros N nav lÄ«dzÄ«gs A, bet P ir lÄ«dzÄ«gs A (ir daļēji dublikāts). Tad neironu tÄ«kls iemācÄ«jās padarÄ«t A un P pēc iespējas tuvāk, bet A un N pēc iespējas tālāk. Tādējādi tiek iegÅ«ts mazāk kļūdaini pozitÄ«vu rezultātu, salÄ«dzinot ar vienkārÅ”u iegulÅ”anu no iepriekÅ” apmācÄ«ta tÄ«kla.

Kad neironu tīkls saņem attēlus kā ievadi, tas katram no tiem ģenerē N(128) dimensijas vektoru un tiek pieprasīts novērtēt attēla tuvumu. Pēc tam tiek aprēķināts slieksnis, pie kura tuvu attēli tiek uzskatīti par dublikātiem.

Modelis spēj prasmÄ«gi atrast surogātpasta izplatÄ«tājus, kuri Ä«paÅ”i fotografē vienu un to paÅ”u produktu no dažādiem leņķiem, lai apietu pHash salÄ«dzinājumu.

Kā mēs regulējam reklāmasKā mēs regulējam reklāmas
Surogātpasta fotoattēlu piemērs, ko neironu tīkls ir salīmējis kopā kā dublikātus.

Pēdējā posmā dublētos sludinājumus vienlaikus meklē gan pēc teksta, gan pēc attēla.

Ja klasterÄ« ir salipuÅ”as kopā divas vai vairākas reklāmas, sistēma sāk automātisku bloÄ·Ä“Å”anu, kas, izmantojot noteiktus algoritmus, izvēlas, kurus dublikātus dzēst un kurus atstāt. Piemēram, ja diviem lietotājiem reklāmā ir vienādas fotogrāfijas, sistēma bloķēs jaunāko reklāmu.

Pēc izveides visas kopas iziet cauri virknei automātisku filtru. Katrs filtrs pieŔķir klasterim punktu skaitu: cik liela ir iespējamÄ«ba, ka tajā ir Ŕī filtra identificētie draudi.

Piemēram, sistēma analizē aprakstu reklāmā un atlasa tai iespējamās kategorijas. Tad ņem to ar maksimālo varbÅ«tÄ«bu un salÄ«dzina ar sludinājuma autora norādÄ«to kategoriju. Ja tie neatbilst, reklāma tiek bloķēta nepareizai kategorijai. Un, tā kā mēs esam laipni un godÄ«gi, mēs tieÅ”i pasakām lietotājam, kura kategorija viņam ir jāatlasa, lai reklāma tiktu regulēta.

Kā mēs regulējam reklāmas
Paziņojums par bloÄ·Ä“Å”anu nepareizas kategorijas dēļ.

MaŔīnmācÄ«ba mÅ«su platformā jÅ«tas kā mājās. Piemēram, ar tās palÄ«dzÄ«bu mēs meklējam Krievijas Federācijā aizliegto preču nosaukumos un aprakstos. Un neironu tÄ«klu modeļi rÅ«pÄ«gi ā€œpārbaudaā€ attēlus, lai redzētu, vai tajos ir vietrāži URL, surogātpasta teksti, tālruņu numuri un tā pati ā€œaizliegtāā€ informācija.

GadÄ«jumos, kad viņi mēģina pārdot aizliegtu produktu, kas ir slēpts kā kaut kas likumÄ«gs, un ne nosaukumā, ne aprakstā nav teksta, mēs izmantojam attēlu marÄ·Ä“Å”anu. Katram attēlam var pievienot lÄ«dz pat 11 tÅ«kstoÅ”iem dažādu tagu, kas raksturo attēlā redzamo.

Kā mēs regulējam reklāmas
Viņi mēģina pārdot ūdenspīpi, maskējot to par samovāru.

Paralēli sarežģītajiem filtriem darbojas arÄ« vienkārÅ”ie filtri, kas atrisina acÄ«mredzamas ar tekstu saistÄ«tas problēmas:

  • antimats;
  • URL un tālruņa numura detektors;
  • tÅ«lÄ«tējo kurjeru un citu kontaktu pieminÄ“Å”ana;
  • pazemināta cena;
  • sludinājumi, kuros nekas netiek pārdots utt.

Mūsdienās katra reklāma iziet cauri vairāk nekā 50 automātisko filtru sietam, kas mēģina reklāmā atrast kaut ko sliktu.

Ja neviens no detektoriem nedarbojās, tad Yulai tiek nosÅ«tÄ«ta atbilde, ka sludinājums ā€œvisticamākā€ ir pilnÄ«gā kārtÄ«bā. Mēs paÅ”i izmantojam Å”o atbildi, un lietotāji, kuri ir abonējuÅ”i pie pārdevēja, saņem paziņojumu par jauna produkta pieejamÄ«bu.

Kā mēs regulējam reklāmas
Paziņojums, ka pārdevējam ir jauna prece.

Rezultātā katra reklāma ir ā€œaizaugusiā€ ar metadatiem, no kuriem daļa tiek Ä£enerēta reklāmas izveides laikā (autora IP adrese, lietotāja aÄ£ents, platforma, Ä£eogrāfiskā atraÅ”anās vieta utt.), bet pārējais ir katra filtra izdotais rezultāts. .

Sludinājumu rindas

Kad reklāma nonāk platformā, sistēma to ievieto vienā no rindām. Katra rinda tiek izveidota, izmantojot matemātisko formulu, kas apvieno reklāmas metadatus tā, lai atklātu jebkādus sliktus modeļus.

Piemēram, kategorijā ā€œMobilie tālruņiā€ varat izveidot sludinājumu rindu no Yula lietotājiem, kas it kā no Sanktpēterburgas, bet viņu IP adreses ir no Maskavas vai citām pilsētām.

Kā mēs regulējam reklāmas
Sludinājumu piemērs, ko ievietojis viens lietotājs dažādās pilsētās.

Vai arī varat veidot rindas, pamatojoties uz rādītājiem, ko neironu tīkls pieŔķir reklāmām, sakārtojot tās dilstoŔā secībā.

Katra rinda pēc savas formulas pieŔķir sludinājumam galÄ«go punktu skaitu. Pēc tam varat rÄ«koties dažādos veidos:

  • norādiet slieksni, pie kura reklāma saņems noteikta veida bloÄ·Ä“Å”anu;
  • nosÅ«tÄ«t visas rindā esoŔās reklāmas moderatoriem manuālai pārskatÄ«Å”anai;
  • vai arÄ« apvienojiet iepriekŔējās opcijas: norādiet automātiskās bloÄ·Ä“Å”anas slieksni un nosÅ«tiet moderatoriem tās reklāmas, kuras nav sasnieguÅ”as Å”o slieksni.

Kā mēs regulējam reklāmas

Kāpēc ir vajadzÄ«gas Ŕīs rindas? Pieņemsim, ka lietotājs augÅ”upielādēja Å”aujamieroča fotoattēlu. Neironu tÄ«kls tam pieŔķir punktu skaitu no 95 lÄ«dz 100 un ar 99 procentu precizitāti nosaka, ka attēlā ir ierocis. Bet, ja rezultāta vērtÄ«ba ir zem 95%, modeļa precizitāte sāk samazināties (tā ir neironu tÄ«klu modeļu iezÄ«me).

Rezultātā tiek veidota rinda, pamatojoties uz punktu modeli, un tās reklāmas, kas saņēmuÅ”as no 95 lÄ«dz 100, tiek automātiski bloķētas kā ā€œAizliegtie produktiā€. Reklāmas, kuru vērtējums ir mazāks par 95, tiek nosÅ«tÄ«tas moderatoriem manuālai apstrādei.

Kā mēs regulējam reklāmas
Å okolādes Beretta ar kārtridžiem. Tikai manuālai moderÄ“Å”anai! šŸ™‚

Manuāla moderÄ“Å”ana

2019. gada sākumā aptuveni 94% no visiem sludinājumiem Julā tiek regulēti automātiski.

Kā mēs regulējam reklāmas

Ja platforma nevar izlemt par dažām reklāmām, tā nosÅ«ta tās manuālai regulÄ“Å”anai. Odnoklassniki izstrādāja savu rÄ«ku: moderatoru uzdevumi nekavējoties parāda visu nepiecieÅ”amo informāciju, lai ātri pieņemtu lēmumu - reklāma ir piemērota vai jābloķē, norādot iemeslu.

Un, lai manuālas regulÄ“Å”anas laikā neciestu pakalpojumu kvalitāte, cilvēku darbs tiek pastāvÄ«gi uzraudzÄ«ts. Piemēram, uzdevumu straumē moderatoram tiek rādÄ«ti ā€œslazdiā€ ā€” reklāmas, kurām jau ir gatavi risinājumi. Ja moderatora lēmums nesakrÄ«t ar pabeigto, moderatoram tiek dota kļūda.

Vidēji moderators vienas reklāmas pārbaudei pavada 10 sekundes. Turklāt kļūdu skaits ir ne vairāk kā 0,5% no visām pārbaudītajām reklāmām.

Tautas mērenība

Kolēģi no Odnoklassniki gāja vēl tālāk un izmantoja ā€œauditorijas palÄ«dzÄ«buā€: viņi uzrakstÄ«ja spēles lietojumprogrammu sociālajam tÄ«klam, kurā varat ātri atzÄ«mēt lielu datu apjomu, izceļot kādu sliktu zÄ«mi - Odnoklassniki moderators (https://ok.ru/app/moderator). Labs veids, kā izmantot OK lietotāju palÄ«dzÄ«bu, kuri cenÅ”as padarÄ«t saturu patÄ«kamāku.

Kā mēs regulējam reklāmas
Spēle, kurā lietotāji atzīmē fotoattēlus, uz kuriem ir tālruņa numurs.

Jebkuru reklāmu rindu platformā var novirzÄ«t uz spēli Odnoklassniki Moderator. Viss, ko spēļu lietotāji atzÄ«mē, tiek nosÅ«tÄ«ts iekŔējiem moderatoriem pārbaudei. Å Ä« shēma ļauj bloķēt reklāmas, kurām vēl nav izveidoti filtri, un vienlaikus izveidot apmācÄ«bas paraugus.

Moderācijas rezultātu saglabāŔana

Mēs saglabājam visus moderÄ“Å”anas laikā pieņemtos lēmumus, lai nepārstrādātu tās reklāmas, par kurām jau esam pieņēmuÅ”i lēmumu.

Katru dienu, pamatojoties uz reklāmām, tiek izveidoti miljoniem klasteru. Laika gaitā katra klastera tiek apzÄ«mēta kā "laba" vai "slikta". Katra jauna reklāma vai tās pārskatÄ«Å”ana, ievadot klasteru ar atzÄ«mi, automātiski saņem izŔķirtspēju no paÅ”a klastera. Dienā ir aptuveni 20 tÅ«kstoÅ”i Ŕādu automātisko izŔķirtspēju.

Kā mēs regulējam reklāmas

Ja klasterī neienāk jauni paziņojumi, tas tiek noņemts no atmiņas un tā jaucējfunkcija un risinājums tiek rakstīts Apache Cassandra.

Kad platforma saņem jaunu sludinājumu, tā vispirms mēģina atrast lÄ«dzÄ«gu klasteru starp jau izveidotajiem un ņemt no tā risinājumu. Ja Ŕādas kopas nav, platforma dodas uz Kasandru un skatās tur. Vai tu to atradi? Lieliski, piemēro risinājumu klasterim un nosÅ«ta to Yula. Katru dienu tiek pieņemti vidēji 70 tÅ«kstoÅ”i Ŕādu ā€œatkārtotuā€ lēmumu ā€” 8% no kopējā skaita.

Summējot

Mēs izmantojam Odnoklassniki moderÄ“Å”anas platformu divarpus gadus. Mums patÄ«k rezultāti:

  • Mēs automātiski regulējam 94% no visām reklāmām dienā.
  • Vienas reklāmas regulÄ“Å”anas izmaksas tika samazinātas no 2 rubļiem lÄ«dz 7 kapeikām.
  • Pateicoties gatavajam rÄ«kam, mēs aizmirsām par moderatoru pārvaldÄ«bas problēmām.
  • Mēs palielinājām manuāli apstrādāto reklāmu skaitu par 2,5 reizēm, izmantojot tādu paÅ”u moderatoru skaitu un budžetu. Manuālās regulÄ“Å”anas kvalitāte ir palielinājusies arÄ« automatizētās vadÄ«bas dēļ, un tā svārstās ap 0,5% kļūdu.
  • Mēs ātri pārklājam jaunus surogātpasta veidus ar filtriem.
  • Mēs ātri savienojam jaunas nodaļas ar mērenÄ«bu "Yula Verticals". KopÅ” 2017. gada Yula ir pievienojusi vertikāles Nekustamais Ä«paÅ”ums, Vakances un Auto.

Avots: www.habr.com

Pievieno komentāru