موږ څنګه اعلانونه منځته راوړو

موږ څنګه اعلانونه منځته راوړو

هر خدمت چې کاروونکي یې کولی شي خپل مینځپانګه رامینځته کړي (UGC - د کارونکي لخوا رامینځته شوی مینځپانګه) نه یوازې د سوداګرۍ ستونزې حل کولو ته اړ کیږي ، بلکه په UGC کې شیان تنظیم کړي. ضعیف یا د ټیټ کیفیت مینځپانګې اعتدال کولی شي په پای کې د کاروونکو لپاره د خدماتو جذب کم کړي، حتی د هغې عملیات پای ته ورسوي.

نن ورځ موږ به تاسو ته د یولا او اوډنوکلاسنیکي تر مینځ د همغږۍ په اړه ووایو، کوم چې موږ سره په یولا کې په مؤثره توګه د اعلاناتو اعتدال کې مرسته کوي.

په عموم کې همغږي یو خورا ګټور شی دی ، او په عصري نړۍ کې ، کله چې ټیکنالوژي او رجحانات خورا ګړندي بدلیږي ، دا کولی شي د ژوند ژغورونکي بدل شي. ولې د هغه څه په اختراع کولو کې کمې سرچینې او وخت ضایع کوئ چې دمخه یې اختراع شوی او ستاسو په ذهن کې راوړل شوی؟

موږ ورته شی فکر کاوه کله چې موږ د کاروونکي منځپانګې منځپانګې - انځورونه، متن او لینکونه د بشپړ کار سره مخ شو. زموږ کارونکي هره ورځ یولا ته د مینځپانګې ملیونونه ټوټې اپلوډ کوي ، او د اتومات پروسس کولو پرته دا په بشپړ ډول ناشونې ده چې دا ټول معلومات په لاسي ډول تنظیم کړئ.

له همدې امله، موږ د اعتدال لپاره چمتو شوی پلیټ فارم کارولی و، کوم چې په هغه وخت کې د اوډنوکلاسنیکي څخه زموږ همکارانو د "نږدې بشپړتیا" حالت ته رسیدلی و.

ولې Odnoklassniki؟

هره ورځ په ملیونونو کاروونکي ټولنیز شبکې ته راځي او د مینځپانګې ملیاردونه ټوټې خپروي: له عکسونو څخه ویډیوګانو او متنونو ته. د Odnoklassniki اعتدال پلیټ فارم د ډیټا خورا لوی مقدار چیک کولو او د سپیمرونو او بوټونو سره مبارزه کې مرسته کوي.

د OK اعتدال ټیم ​​ډیری تجربه راټوله کړې، ځکه چې دا د 12 کلونو لپاره خپل وسیله ښه کوي. دا مهمه ده چې دوی نشي کولی یوازې خپل چمتو شوي حلونه شریک کړي ، بلکه زموږ د ځانګړو دندو سره سم د دوی پلیټ فارم جوړښت هم تنظیم کړي.

موږ څنګه اعلانونه منځته راوړو

له اوس څخه، د لنډیز لپاره، موږ به په ساده ډول د OK اعتدال پلیټ فارم "پلیټ فارم" ووایو.

دا ټول څنګه کار کوي

د یولا او اوډنوکلاسنیکي تر مینځ د معلوماتو تبادله د دې له لارې رامینځته کیږي اپاپي کافيکا.

ولې موږ دا وسیله غوره کړه:

  • په یولا کې، ټول اعلانونه وروسته منځته راځي، نو په پیل کې یو همغږي ځواب ته اړتیا نه وه.
  • که یو خراب پاراګراف پیښ شي او یولا یا اوډنوکلاسنیکي شتون ونلري ، په شمول د ځینې لوړ بارونو له امله ، نو د کافکا ډیټا به هیڅ ځای ورک نشي او وروسته لوستل کیدی شي.
  • پلیټ فارم لا دمخه د کافکا سره مدغم شوی و ، نو ډیری امنیتي مسلې حل شوې.

موږ څنګه اعلانونه منځته راوړو

په یولا کې د کارونکي لخوا رامینځته شوي یا تعدیل شوي هر اعلان لپاره ، د معلوماتو سره JSON رامینځته کیږي ، کوم چې د راتلونکي اعتدال لپاره په کافکا کې ځای په ځای کیږي. د کافکا څخه، اعلانونه په پلیټ فارم کې بار شوي، چیرته چې دوی په اتوماتيک یا لاسي ډول قضاوت کیږي. خراب اعلانونه د یو دلیل سره بند شوي، او هغه څوک چې په پلیټ فارم کې سرغړونه نه موندل کیږي د "ښه" په توګه نښه شوي. بیا ټولې پریکړې بیرته یولا ته لیږل کیږي او په خدمت کې پلي کیږي.

په نهایت کې ، د یولا لپاره دا ټول ساده عملونو ته راځي: د اوډنوکلاسنیکي پلیټ فارم ته یو اعلان واستوئ او یو ریزولوشن بیرته ترلاسه کړئ "ښه" ، یا ولې "ښه" نه.

اتومات پروسس کول

د اعلان سره څه پیښیږي کله چې دا پلیټ فارم ته ننوځي؟ هر اعلان په څو ادارو ویشل شوی دی:

  • نوم،
  • توضیحات
  • عکسونه
  • د کارن لخوا ټاکل شوې کټګورۍ او د اعلان فرعي کټګورۍ،
  • نرخ.

موږ څنګه اعلانونه منځته راوړو

پلیټ فارم بیا د نقل موندلو لپاره د هرې ادارې لپاره کلستر کول ترسره کوي. سربیره پردې ، متن او عکسونه د مختلف سکیمونو سره سم کلستر شوي.

د کلستر کولو دمخه، متنونه د ځانګړو حروفونو، بدل شوي لیکونو او نورو کثافاتو لرې کولو لپاره نورمال کیږي. ترلاسه شوي معلومات په N-ګرامو ویشل شوي، چې هر یو یې هش شوی. پایله ډیری ځانګړي هشونه دي. د متنونو ترمنځ ورته والی د دې لخوا ټاکل کیږي د جاکارډ اندازه د دوو پایله لرونکو سیټونو ترمنځ. که ورته والی له حد څخه لوی وي، نو متنونه په یوه کلستر کې یوځای کیږي. د ورته کلسترونو لټون ګړندۍ کولو لپاره ، MinHash او د ځای حساس هیشینګ کارول کیږي.

د عکسونو لپاره د ګلینګ عکسونو لپاره مختلف اختیارونه اختراع شوي ، د pHash عکسونو پرتله کولو څخه نیولې د عصبي شبکې په کارولو سره د نقلونو لټون پورې.

وروستۍ طریقه ترټولو "سخت" ده. د ماډل روزلو لپاره، د انځورونو درې ګوني (N, A, P) غوره شوي چې په کې N د A سره ورته نه دي، او P د A سره ورته دی (یو نیم نقل دی). بیا عصبي شبکې زده کړل چې A او P څومره چې امکان ولري نږدې کړي، او A او N څومره چې امکان ولري. دا په ساده ډول د مخکې روزل شوي شبکې څخه د ځای پرځای کولو په پرتله لږ غلط مثبت پایلې لري.

کله چې عصبي شبکه د ان پټ په توګه عکسونه ترلاسه کوي، دا د هر یو لپاره N (128) - ابعادي ویکتور رامینځته کوي او د عکس د نږدېوالي ارزولو لپاره غوښتنه کیږي. بیا، یو حد محاسبه کیږي په کوم کې چې نږدې عکسونه نقل ګڼل کیږي.

ماډل د دې وړتیا لري چې په مهارت سره سپیمر ومومي کوم چې په ځانګړي ډول ورته محصول د مختلف زاویو څخه عکس اخلي ترڅو د pHash پرتله کولو مخه ونیسي.

موږ څنګه اعلانونه منځته راوړوموږ څنګه اعلانونه منځته راوړو
د سپیم عکسونو یوه بیلګه د عصبي شبکې لخوا د نقلونو په توګه یوځای شوي.

په وروستي مرحله کې، نقل شوي اعلانونه د متن او عکس دواړو لخوا په ورته وخت کې پلټل کیږي.

که دوه یا ډیر اعلانونه په یوه کلستر کې یوځای ودرول شي، سیسټم په اتوماتيک ډول بلاک کول پیل کوي، کوم چې د ځانګړو الګوریتمونو په کارولو سره، دا غوره کوي چې کوم نقلونه حذف کړي او کوم یې پریږدي. د مثال په توګه، که دوه کاروونکي په یوه اعلان کې ورته عکسونه ولري، سیسټم به وروستی اعلان بند کړي.

یوځل چې رامینځته شي ، ټول کلسترونه د اتوماتیک فلټرونو لړۍ څخه تیریږي. هر فلټر کلستر ته نمرې ورکوي: څومره احتمال شته چې دا هغه ګواښ لري چې دا فلټر یې پیژني.

د مثال په توګه، سیسټم په یوه اعلان کې توضیحات تحلیلوي او د هغې لپاره احتمالي کټګورۍ غوره کوي. بیا دا د اعظمي احتمال سره یو اخلي او د اعلان لیکوال لخوا ټاکل شوي کټګورۍ سره پرتله کوي. که دوی سره سمون نه خوري، اشتھار د غلط کټګورۍ لپاره بند شوی دی. او له هغه ځایه چې موږ مهربان او صادق یو، موږ مستقیم کارونکي ته ووایو چې کوم کټګورۍ ته اړتیا لري ترڅو د اعتدال تیرولو لپاره اعلان غوره کړي.

موږ څنګه اعلانونه منځته راوړو
د غلط کټګورۍ لپاره د بندولو خبرتیا.

د ماشین زده کړه زموږ په پلیټ فارم کې په کور کې سم احساس کوي. د مثال په توګه، د دې په مرسته موږ د روسیې په فدراسیون کې د منع شوي توکو نومونه او توضیحات لټوو. او د عصبي شبکې ماډلونه په دقت سره عکسونه "تحقیق" کوي ترڅو وګوري چې ایا دوی URLs، سپیم متنونه، د تلیفون شمیرې، او ورته "منع شوي" معلومات لري.

د هغو قضیو لپاره چیرې چې دوی هڅه کوي یو منع شوي محصول وپلوري چې د یو څه قانوني بڼه وي، او په سرلیک یا توضیحاتو کې هیڅ متن شتون نلري، موږ د عکس ټیګنګ کاروو. د هر عکس لپاره، تر 11 زرو پورې مختلف ټګونه اضافه کیدی شي چې تشریح کوي چې په عکس کې څه دي.

موږ څنګه اعلانونه منځته راوړو
دوی هڅه کوي چې هوکه د سموور په بڼه وپلوري.

د پیچلي فلټرونو سره موازي، ساده هم کار کوي، د متن پورې اړوند روښانه ستونزې حل کوي:

  • ضد
  • URL او د تلیفون شمیره کشف کونکی؛
  • د فوري رسولانو او نورو اړیکو یادونه؛
  • کم شوی قیمت؛
  • هغه اعلانونه چې په کې هیڅ شی د پلور لپاره نه وي، او داسې نور.

نن ورځ، هر اعلان د 50 څخه ډیر اتوماتیک فلټرونو څخه د یوې ښې چپنې څخه تیریږي چې هڅه کوي په اعلان کې یو څه بد ومومي.

که چیرې هیڅ یو کشف کونکي کار ونه کړي ، نو یولا ته ځواب لیږل کیږي چې اعلان په بشپړ ترتیب کې "ډیری احتمال" دی. موږ دا ځواب پخپله کاروو ، او هغه کارونکي چې پلورونکي ته یې ګډون کړی د نوي محصول شتون په اړه خبرتیا ترلاسه کوي.

موږ څنګه اعلانونه منځته راوړو
خبرتیا چې پلورونکی نوی محصول لري.

د پایلې په توګه، هر اعلان د میټاډاټا سره "ډیر لوی شوی" دی، چې ځینې یې هغه وخت رامینځته کیږي کله چې اعلان رامینځته شي (د لیکوال IP پته، د کارونکي ایجنټ، پلیټ فارم، جیو ځای، او نور)، او پاتې نور د هر فلټر لخوا صادر شوي سکور دي. .

د اعلان کتارونه

کله چې یو اعلان پلیټ فارم ته ننوځي، سیسټم دا په یو قطار کې اچوي. هر قطار د ریاضياتي فارمول په کارولو سره رامینځته شوی چې د اعلان میټاډاټا په داسې طریقه سره یوځای کوي چې کوم خراب نمونې کشف کړي.

د مثال په توګه، تاسو کولی شئ د یولا کاروونکو څخه "د ګرځنده تلیفونونو" کټګورۍ کې د اعلاناتو کتار جوړ کړئ چې اټکل کیږي د سینټ پیټرزبورګ څخه وي، مګر د دوی IP پتې د مسکو یا نورو ښارونو څخه دي.

موږ څنګه اعلانونه منځته راوړو
په مختلفو ښارونو کې د یو کارونکي لخوا ځړول شوي اعلاناتو بیلګه.

یا تاسو کولی شئ د هغه نمرو پراساس قطارونه جوړ کړئ چې عصبي شبکه اعلاناتو ته ګماري، په نزولي ترتیب کې یې تنظیموي.

هر کتار، د خپل فارمول سره سم، اعلان ته وروستۍ نمره ورکوي. بیا تاسو کولی شئ په بیلابیلو لارو پرمخ ولاړ شئ:

  • هغه حد مشخص کړئ په کوم کې چې یو اعلان به یو ځانګړی ډول بلاک ترلاسه کړي؛
  • په کتار کې ټول اعلانونه د لاسي بیاکتنې لپاره مدیرانو ته واستوئ؛
  • یا پخوانۍ اختیارونه یوځای کړئ: د اتوماتیک بلاک کولو حد مشخص کړئ او مدیرانو ته هغه اعلانونه واستوئ چې دې حد ته ندي رسیدلي.

موږ څنګه اعلانونه منځته راوړو

ولې دې کتارونو ته اړتیا ده؟ راځئ چې ووایو یو کارونکي د اور وژنې عکس اپلوډ کړی. عصبي شبکه دې ته له 95 څخه تر 100 پورې نمرې ورکوي او په 99 سلنه دقت سره ټاکي چې په عکس کې وسله شتون لري. مګر که د نمرې ارزښت له 95٪ څخه ښکته وي، د ماډل دقت کمیدل پیل کیږي (دا د عصبي شبکې ماډلونو ځانګړتیا ده).

د پایلې په توګه، د سکور ماډل پراساس یو قطار جوړیږي، او هغه اعلانونه چې د 95 او 100 ترمنځ ترلاسه شوي په اتوماتيک ډول د "ممنوع محصولاتو" په توګه بند شوي. د 95 څخه ښکته نمرې سره اعلانونه د لارښود پروسس کولو لپاره مدیرانو ته لیږل کیږي.

موږ څنګه اعلانونه منځته راوړو
چاکلیټ بیریټا د کارتوس سره. یوازې د لاسي اعتدال لپاره! 🙂

لاسي اعتدال

د 2019 په پیل کې، په یولا کې د ټولو اعلاناتو شاوخوا 94٪ په اوتومات ډول تنظیم شوي.

موږ څنګه اعلانونه منځته راوړو

که پلیټ فارم په ځینو اعلاناتو پریکړه نشي کولی، دا دوی د لاسي اعتدال لپاره لیږي. Odnoklassniki خپله وسیله جوړه کړه: د مدیرانو لپاره دندې سمدلاسه ټول اړین معلومات ښیې چې ګړندي پریکړه وکړي - اعلان مناسب دی یا باید بلاک شي ، دلیل په ګوته کوي.

او د دې لپاره چې د لارښود اعتدال پرمهال د خدماتو کیفیت زیان ونه رسوي، د خلکو کار په دوامداره توګه څارل کیږي. د مثال په توګه، د کاري جریان کې، مدیر ته "جال" ښودل کیږي — اعلانونه چې د دې لپاره دمخه چمتو شوي حلونه شتون لري. که چیرې د مدیر پریکړه د پای ته رسیدو سره سمون ونلري، مدیر ته غلطي ورکول کیږي.

په اوسط ډول، یو مدیر د یو اعلان چک کولو لپاره 10 ثانیې مصرفوي. سربیره پردې، د غلطیو شمیر د ټولو تایید شویو اعلاناتو 0,5٪ څخه ډیر نه دی.

د خلکو اعتدال

د اوډنوکلاسنيکي همکاران نور هم لاړل او د "لیدونکو له مرستې" څخه یې ګټه پورته کړه: دوی د ټولنیزې شبکې لپاره د لوبې غوښتنلیک لیکلی چې په هغه کې تاسو کولی شئ په چټکۍ سره د ډیټا لوی مقدار په نښه کړئ، ځینې ناوړه نښې په ګوته کوي - د اوډنوکلاسنیکي مدیر (https://ok.ru/app/moderator). د OK کاروونکو مرستې څخه د ګټې اخیستنې یوه ښه لار چې هڅه کوي د مینځپانګې ډیر خوندور کړي.

موږ څنګه اعلانونه منځته راوړو
یوه لوبه چې په کې کاروونکي عکسونه ټګ کوي چې د تلیفون شمیره لري.

په پلیټ فارم کې د اعلاناتو هر ډول کتار د اوډنوکلاسنیکي ماډریټر لوبې ته لیږدول کیدی شي. هر هغه څه چې د لوبې کاروونکي یې په نښه کوي بیا د تایید لپاره داخلي مدیرانو ته لیږل کیږي. دا سکیم تاسو ته اجازه درکوي هغه اعلانونه بند کړئ چې فلټرونه یې لاهم ندي رامینځته شوي ، او په ورته وخت کې د روزنې نمونې رامینځته کړئ.

د اعتدال پایلې ذخیره کول

موږ د اعتدال په جریان کې ټولې شوې پریکړې خوندي کوو ترڅو موږ هغه اعلانونه بیا پروسس نه کړو چې موږ دمخه پریکړه کړې.

ملیونونه کلسترونه هره ورځ د اعلاناتو پراساس رامینځته کیږي. د وخت په تیریدو سره، هر کلستر "ښه" یا "خراب" لیبل شوی. هر نوی اعلان یا د هغې بیاکتنه، د نښه سره کلستر ته ننوځي، په اتوماتيک ډول د کلستر څخه یو حل ترلاسه کوي. هره ورځ شاوخوا 20 زره دا ډول اتوماتیک حلونه شتون لري.

موږ څنګه اعلانونه منځته راوړو

که کوم نوي اعلانونه کلستر ته ونه رسیږي، دا د حافظې څخه لیرې کیږي او د هغې هش او حل اپاچی کیسیندرا ته لیکل کیږي.

کله چې پلیټ فارم یو نوی اعلان ترلاسه کوي، نو دا لومړی هڅه کوي چې د مخکې جوړ شوي په منځ کې ورته کلستر ومومي او له هغې څخه حل واخلي. که چیرې داسې کلستر شتون ونلري، پلیټ فارم کاسندرا ته ځي او هلته ګوري. ایا تاسو یې موندلی؟ عالي ، په کلستر کې حل پلي کوي او یولا ته یې لیږي. هره ورځ په اوسط ډول 70 زره دا ډول "تکرار" پریکړې کیږي — د ټولټال 8٪.

لنډیز لپاره

موږ د دوه نیم کلونو لپاره د اوډنوکلاسنیکي اعتدال پلیټ فارم کاروو. موږ پایلې خوښوو:

  • موږ په اوتومات ډول هره ورځ د ټولو اعلاناتو 94٪ اعتدال کوو.
  • د یو اعلان منځته کولو لګښت له 2 روبل څخه 7 کوپیک ته راټیټ شوی.
  • د چمتو شوي وسیلې څخه مننه ، موږ د مدیرانو اداره کولو ستونزې هیرې کړې.
  • موږ د ورته شمیر مدیرانو او بودیجې سره په لاسي ډول پروسس شوي اعلانونو شمیر 2,5 ځله زیات کړ. د لاسي اعتدال کیفیت هم د اتوماتیک کنټرول له امله لوړ شوی، او د غلطیو شاوخوا 0,5٪ تغیر کوي.
  • موږ په چټکۍ سره د سپیم نوي ډولونه د فلټرونو سره پوښو.
  • موږ ژر تر ژره نوي ډیپارټمنټونه اعتدال ته وصل کوو "یولا عمودی". د 2017 راهیسې، یولا املاکو، خالي ځایونه او آٹو عمودی اضافه کړي.

سرچینه: www.habr.com

Add a comment