మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

వినియోగదారులు వారి స్వంత కంటెంట్‌ను (UGC - వినియోగదారు సృష్టించిన కంటెంట్) సృష్టించగల ప్రతి సేవ వ్యాపార సమస్యలను పరిష్కరించడమే కాకుండా, UGCలో విషయాలను క్రమబద్ధీకరించడానికి కూడా ఒత్తిడి చేయబడుతుంది. పేలవమైన లేదా తక్కువ-నాణ్యత కంటెంట్ నియంత్రణ అనేది వినియోగదారుల కోసం సేవ యొక్క ఆకర్షణను అంతిమంగా తగ్గిస్తుంది, దాని ఆపరేషన్‌ను కూడా ముగించవచ్చు.

ఈ రోజు మేము యులా మరియు ఓడ్నోక్లాస్నికి మధ్య సినర్జీ గురించి మీకు తెలియజేస్తాము, ఇది యులాలో ప్రకటనలను సమర్థవంతంగా మోడరేట్ చేయడంలో మాకు సహాయపడుతుంది.

సాధారణంగా సినర్జీ అనేది చాలా ఉపయోగకరమైన విషయం, మరియు ఆధునిక ప్రపంచంలో, సాంకేతికతలు మరియు పోకడలు చాలా త్వరగా మారినప్పుడు, అది లైఫ్‌సేవర్‌గా మారుతుంది. మీ ముందు కనిపెట్టిన మరియు గుర్తుకు తెచ్చిన వాటిని కనిపెట్టడానికి కొరత వనరులను మరియు సమయాన్ని ఎందుకు వృధా చేస్తారు?

చిత్రాలు, వచనం మరియు లింక్‌లు - వినియోగదారు కంటెంట్‌ని మోడరేట్ చేసే పూర్తి టాస్క్‌ని ఎదుర్కొన్నప్పుడు మేము ఇదే విషయాన్ని ఆలోచించాము. మా వినియోగదారులు ప్రతిరోజూ మిలియన్ల కొద్దీ కంటెంట్ ముక్కలను యులాకు అప్‌లోడ్ చేస్తారు మరియు ఆటోమేటిక్ ప్రాసెసింగ్ లేకుండా ఈ డేటా మొత్తాన్ని మాన్యువల్‌గా మోడరేట్ చేయడం పూర్తిగా అసాధ్యం.

అందువల్ల, మేము రెడీమేడ్ మోడరేషన్ ప్లాట్‌ఫారమ్‌ను ఉపయోగించాము, ఆ సమయానికి ఓడ్నోక్లాస్నికి చెందిన మా సహచరులు "దాదాపు పరిపూర్ణత" స్థితికి చేరుకున్నారు.

ఎందుకు Odnoklassniki?

ప్రతిరోజూ, పదిలక్షల మంది వినియోగదారులు సోషల్ నెట్‌వర్క్‌కి వస్తారు మరియు బిలియన్ల కొద్దీ కంటెంట్‌లను ప్రచురిస్తారు: ఫోటోల నుండి వీడియోలు మరియు టెక్స్ట్‌ల వరకు. Odnoklassniki మోడరేషన్ ప్లాట్‌ఫారమ్ చాలా పెద్ద వాల్యూమ్‌ల డేటాను తనిఖీ చేయడానికి మరియు స్పామర్‌లు మరియు బాట్‌లను ఎదుర్కోవడానికి సహాయపడుతుంది.

OK మోడరేషన్ బృందం 12 సంవత్సరాలుగా దాని సాధనాన్ని మెరుగుపరుస్తున్నందున, చాలా అనుభవాన్ని సేకరించింది. వారు తమ రెడీమేడ్ సొల్యూషన్‌లను పంచుకోవడం మాత్రమే కాకుండా, మా నిర్దిష్ట పనులకు అనుగుణంగా వారి ప్లాట్‌ఫారమ్ నిర్మాణాన్ని అనుకూలీకరించడం కూడా ముఖ్యం.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

ఇప్పటి నుండి, సంక్షిప్తత కోసం, మేము OK మోడరేషన్ ప్లాట్‌ఫారమ్‌ను "ప్లాట్‌ఫారమ్" అని పిలుస్తాము.

ప్రతిదీ ఎలా పని చేస్తుంది

యులా మరియు ఓడ్నోక్లాస్నికి మధ్య డేటా మార్పిడి ద్వారా స్థాపించబడింది అపాచీ కాఫ్కా.

మేము ఈ సాధనాన్ని ఎందుకు ఎంచుకున్నాము:

  • యులాలో, అన్ని ప్రకటనలు పోస్ట్-మోడరేట్ చేయబడ్డాయి, కాబట్టి ప్రారంభంలో సమకాలీకరణ ప్రతిస్పందన అవసరం లేదు.
  • పేరా తప్పు జరిగితే మరియు యులా లేదా ఓడ్నోక్లాస్నికి అందుబాటులో లేకుంటే, కొన్ని పీక్ లోడ్‌ల కారణంగా, కాఫ్కా నుండి డేటా ఎక్కడా కనిపించదు మరియు తర్వాత చదవబడుతుంది.
  • ప్లాట్‌ఫారమ్ ఇప్పటికే కాఫ్కాతో విలీనం చేయబడింది, కాబట్టి చాలా భద్రతా సమస్యలు పరిష్కరించబడ్డాయి.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

యులాలో వినియోగదారు సృష్టించిన లేదా సవరించిన ప్రతి ప్రకటన కోసం, డేటాతో కూడిన JSON రూపొందించబడుతుంది, ఇది తదుపరి నియంత్రణ కోసం కాఫ్కాలో ఉంచబడుతుంది. కాఫ్కా నుండి, ప్రకటనలు ప్లాట్‌ఫారమ్‌లోకి లోడ్ చేయబడతాయి, అవి స్వయంచాలకంగా లేదా మాన్యువల్‌గా నిర్ణయించబడతాయి. చెడు ప్రకటనలు ఒక కారణంతో బ్లాక్ చేయబడతాయి మరియు ప్లాట్‌ఫారమ్ ఉల్లంఘనలను కనుగొననివి "మంచివి"గా గుర్తించబడతాయి. అప్పుడు అన్ని నిర్ణయాలు యులాకు తిరిగి పంపబడతాయి మరియు సేవలో వర్తించబడతాయి.

చివరికి, యులా కోసం ఇవన్నీ సాధారణ చర్యలకు వస్తాయి: ఓడ్నోక్లాస్నికి ప్లాట్‌ఫారమ్‌కు ప్రకటనను పంపండి మరియు “సరే” లేదా ఎందుకు “సరే” అనే రిజల్యూషన్‌ను తిరిగి పొందండి.

ఆటోమేటిక్ ప్రాసెసింగ్

ప్లాట్‌ఫారమ్‌ను తాకిన తర్వాత ప్రకటనకు ఏమి జరుగుతుంది? ప్రతి ప్రకటన అనేక అంశాలుగా విభజించబడింది:

  • పేరు,
  • వివరణ,
  • ఫోటోలు,
  • వినియోగదారు ఎంచుకున్న వర్గం మరియు ప్రకటన యొక్క ఉపవర్గం,
  • ధర.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

ప్లాట్‌ఫారమ్ ప్రతి ఎంటిటీకి డూప్లికేట్‌లను కనుగొనడానికి క్లస్టరింగ్ చేస్తుంది. అంతేకాకుండా, టెక్స్ట్ మరియు ఛాయాచిత్రాలు వివిధ పథకాల ప్రకారం క్లస్టర్ చేయబడతాయి.

క్లస్టరింగ్ చేయడానికి ముందు, ప్రత్యేక అక్షరాలు, మార్చబడిన అక్షరాలు మరియు ఇతర చెత్తను తొలగించడానికి పాఠాలు సాధారణీకరించబడతాయి. అందుకున్న డేటా N-గ్రాములుగా విభజించబడింది, వీటిలో ప్రతి ఒక్కటి హ్యాష్ చేయబడింది. ఫలితంగా అనేక ప్రత్యేకమైన హాష్‌లు ఉన్నాయి. పాఠాల మధ్య సారూప్యత నిర్ణయించబడుతుంది జాకార్డ్ యొక్క కొలత రెండు ఫలిత సెట్ల మధ్య. సారూప్యత థ్రెషోల్డ్ కంటే ఎక్కువగా ఉంటే, అప్పుడు పాఠాలు ఒక క్లస్టర్‌లో విలీనం చేయబడతాయి. సారూప్య క్లస్టర్‌ల కోసం శోధనను వేగవంతం చేయడానికి, MinHash మరియు Locality-సెన్సిటివ్ హ్యాషింగ్ ఉపయోగించబడతాయి.

pHash చిత్రాలను పోల్చడం నుండి న్యూరల్ నెట్‌వర్క్‌ని ఉపయోగించి నకిలీల కోసం శోధించడం వరకు ఫోటోగ్రాఫ్‌ల కోసం చిత్రాలను అంటుకునే వివిధ ఎంపికలు కనుగొనబడ్డాయి.

చివరి పద్ధతి అత్యంత "తీవ్రమైనది". మోడల్‌కు శిక్షణ ఇవ్వడానికి, త్రిపాది చిత్రాలు (N, A, P) ఎంపిక చేయబడ్డాయి, దీనిలో N Aకి సారూప్యంగా ఉండదు మరియు P అనేది A వలె ఉంటుంది (సెమీ డూప్లికేట్). అప్పుడు న్యూరల్ నెట్‌వర్క్ A మరియు Pలను వీలైనంత దగ్గరగా, A మరియు Nలను వీలైనంత దగ్గరగా చేయడం నేర్చుకుంది. ఇది కేవలం ముందస్తు శిక్షణ పొందిన నెట్‌వర్క్ నుండి పొందుపరచడం కంటే తక్కువ తప్పుడు పాజిటివ్‌లను కలిగిస్తుంది.

న్యూరల్ నెట్‌వర్క్ ఇమేజ్‌లను ఇన్‌పుట్‌గా స్వీకరించినప్పుడు, అది వాటిలో ప్రతిదానికి ఒక N(128)-డైమెన్షనల్ వెక్టర్‌ను ఉత్పత్తి చేస్తుంది మరియు చిత్రం యొక్క సామీప్యాన్ని అంచనా వేయడానికి అభ్యర్థన చేయబడుతుంది. తర్వాత, దగ్గరి చిత్రాలు నకిలీలుగా పరిగణించబడే థ్రెషోల్డ్ లెక్కించబడుతుంది.

pHash పోలికను దాటవేయడానికి ఒకే ఉత్పత్తిని వేర్వేరు కోణాల నుండి ప్రత్యేకంగా చిత్రీకరించే స్పామర్‌లను మోడల్ నైపుణ్యంగా కనుగొనగలదు.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాముమేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము
న్యూరల్ నెట్‌వర్క్ ద్వారా నకిలీలుగా అతుక్కొని ఉన్న స్పామ్ ఫోటోల ఉదాహరణ.

చివరి దశలో, నకిలీ ప్రకటనలు వచనం మరియు చిత్రం రెండింటి ద్వారా ఏకకాలంలో శోధించబడతాయి.

రెండు లేదా అంతకంటే ఎక్కువ ప్రకటనలు క్లస్టర్‌లో కలిసి ఉంటే, సిస్టమ్ స్వయంచాలకంగా నిరోధించడాన్ని ప్రారంభిస్తుంది, ఇది నిర్దిష్ట అల్గారిథమ్‌లను ఉపయోగించి, ఏ నకిలీలను తొలగించాలో మరియు ఏది వదిలివేయాలో ఎంచుకుంటుంది. ఉదాహరణకు, ఇద్దరు వినియోగదారులు ఒక ప్రకటనలో ఒకే ఫోటోలను కలిగి ఉంటే, సిస్టమ్ ఇటీవలి ప్రకటనను బ్లాక్ చేస్తుంది.

సృష్టించిన తర్వాత, అన్ని క్లస్టర్‌లు ఆటోమేటిక్ ఫిల్టర్‌ల శ్రేణి ద్వారా వెళ్తాయి. ప్రతి ఫిల్టర్ క్లస్టర్‌కి ఒక స్కోర్‌ను కేటాయిస్తుంది: ఈ ఫిల్టర్ గుర్తించే ముప్పును కలిగి ఉండే అవకాశం ఎంతవరకు ఉంది.

ఉదాహరణకు, సిస్టమ్ ప్రకటనలోని వివరణను విశ్లేషిస్తుంది మరియు దాని కోసం సంభావ్య వర్గాలను ఎంచుకుంటుంది. ఆపై అది గరిష్ట సంభావ్యతతో ఉన్న దానిని తీసుకుంటుంది మరియు ప్రకటన రచయిత పేర్కొన్న వర్గంతో పోల్చింది. అవి సరిపోలకపోతే, తప్పు వర్గం కోసం ప్రకటన బ్లాక్ చేయబడుతుంది. మరియు మేము దయతో మరియు నిజాయితీగా ఉన్నందున, ప్రకటన మోడరేషన్‌లో ఉత్తీర్ణత సాధించడానికి వినియోగదారు ఏ కేటగిరీని ఎంచుకోవాలని మేము నేరుగా తెలియజేస్తాము.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము
తప్పు వర్గం కోసం నిరోధించే నోటిఫికేషన్.

మెషిన్ లెర్నింగ్ మా ప్లాట్‌ఫారమ్‌లో ఇంట్లోనే ఉన్నట్లు అనిపిస్తుంది. ఉదాహరణకు, దాని సహాయంతో మేము రష్యన్ ఫెడరేషన్లో నిషేధించబడిన వస్తువుల పేర్లు మరియు వివరణలలో శోధిస్తాము. మరియు న్యూరల్ నెట్‌వర్క్ మోడల్‌లు చిత్రాలలో URLలు, స్పామ్ టెక్స్ట్‌లు, టెలిఫోన్ నంబర్‌లు మరియు అదే “నిషిద్ధ” సమాచారాన్ని కలిగి ఉన్నాయో లేదో తెలుసుకోవడానికి వాటిని నిశితంగా “పరిశీలిస్తాయి”.

వారు ఏదైనా చట్టబద్ధమైన వస్తువుగా మారువేషంలో నిషేధించబడిన ఉత్పత్తిని విక్రయించడానికి ప్రయత్నిస్తున్న సందర్భాలలో మరియు టైటిల్ లేదా వివరణలో ఎటువంటి వచనం లేనప్పుడు, మేము ఇమేజ్ ట్యాగింగ్‌ని ఉపయోగిస్తాము. ప్రతి చిత్రానికి, చిత్రంలో ఉన్న వాటిని వివరించే 11 వేల వరకు వివిధ ట్యాగ్‌లను జోడించవచ్చు.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము
హుక్కాను సమోవర్‌గా మార్చి అమ్మేందుకు ప్రయత్నిస్తున్నారు.

సంక్లిష్ట ఫిల్టర్‌లతో సమాంతరంగా, సరళమైనవి కూడా పని చేస్తాయి, వచనానికి సంబంధించిన స్పష్టమైన సమస్యలను పరిష్కరిస్తాయి:

  • యాంటీమాట్;
  • URL మరియు ఫోన్ నంబర్ డిటెక్టర్;
  • తక్షణ దూతలు మరియు ఇతర పరిచయాల ప్రస్తావన;
  • తగ్గిన ధర;
  • ఏదీ అమ్మకానికి లేని ప్రకటనలు మొదలైనవి.

ఈ రోజు, ప్రతి ప్రకటన 50 కంటే ఎక్కువ ఆటోమేటిక్ ఫిల్టర్‌ల ద్వారా చక్కటి జల్లెడ ద్వారా వెళుతుంది, అది ప్రకటనలో ఏదైనా చెడును కనుగొనడానికి ప్రయత్నిస్తుంది.

డిటెక్టర్లు ఏవీ పని చేయకపోతే, ప్రకటన ఖచ్చితమైన క్రమంలో "చాలా మటుకు" అని యులాకు ప్రతిస్పందన పంపబడుతుంది. మేము ఈ సమాధానాన్ని మనమే ఉపయోగిస్తాము మరియు విక్రేతకు సభ్యత్వం పొందిన వినియోగదారులు కొత్త ఉత్పత్తి లభ్యత గురించి నోటిఫికేషన్‌ను అందుకుంటారు.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము
విక్రేత కొత్త ఉత్పత్తిని కలిగి ఉన్నట్లు నోటిఫికేషన్.

ఫలితంగా, ప్రతి ప్రకటన మెటాడేటాతో “అతిగా పెరిగింది”, వాటిలో కొన్ని ప్రకటన సృష్టించబడినప్పుడు (రచయిత యొక్క IP చిరునామా, వినియోగదారు-ఏజెంట్, ప్లాట్‌ఫారమ్, జియోలొకేషన్, మొదలైనవి) రూపొందించబడతాయి మరియు మిగిలినవి ప్రతి ఫిల్టర్ ద్వారా జారీ చేయబడిన స్కోర్. .

ప్రకటన క్యూలు

ప్లాట్‌ఫారమ్‌పై ప్రకటన వచ్చినప్పుడు, సిస్టమ్ దానిని క్యూలలో ఒకదానిలో ఉంచుతుంది. ఏదైనా చెడు నమూనాలను గుర్తించే విధంగా ప్రకటన మెటాడేటాను మిళితం చేసే గణిత సూత్రాన్ని ఉపయోగించి ప్రతి క్యూ సృష్టించబడుతుంది.

ఉదాహరణకు, మీరు సెయింట్ పీటర్స్‌బర్గ్‌కు చెందిన యులా వినియోగదారుల నుండి "సెల్ ఫోన్‌లు" వర్గంలో ప్రకటనల క్యూను సృష్టించవచ్చు, కానీ వారి IP చిరునామాలు మాస్కో లేదా ఇతర నగరాల నుండి వచ్చినవి.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము
వివిధ నగరాల్లో ఒక వినియోగదారు పోస్ట్ చేసిన ప్రకటనల ఉదాహరణ.

లేదా మీరు న్యూరల్ నెట్‌వర్క్ ప్రకటనలకు కేటాయించే స్కోర్‌ల ఆధారంగా క్యూలను ఏర్పరచవచ్చు, వాటిని అవరోహణ క్రమంలో అమర్చవచ్చు.

ప్రతి క్యూ, దాని స్వంత ఫార్ములా ప్రకారం, ప్రకటనకు తుది స్కోర్‌ను కేటాయిస్తుంది. అప్పుడు మీరు వివిధ మార్గాల్లో కొనసాగవచ్చు:

  • ఒక ప్రకటన నిర్దిష్ట రకమైన బ్లాకింగ్‌ను స్వీకరించే థ్రెషోల్డ్‌ను పేర్కొనండి;
  • మాన్యువల్ సమీక్ష కోసం క్యూలో ఉన్న అన్ని ప్రకటనలను మోడరేటర్‌లకు పంపండి;
  • లేదా మునుపటి ఎంపికలను కలపండి: ఆటోమేటిక్ బ్లాకింగ్ థ్రెషోల్డ్‌ని పేర్కొనండి మరియు ఈ థ్రెషోల్డ్‌ను చేరుకోని ప్రకటనలను మోడరేటర్‌లకు పంపండి.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

ఈ క్యూలు ఎందుకు అవసరం? ఒక వినియోగదారు తుపాకీ యొక్క ఫోటోను అప్‌లోడ్ చేసారని అనుకుందాం. న్యూరల్ నెట్‌వర్క్ దీనికి 95 నుండి 100 వరకు స్కోర్‌ని కేటాయిస్తుంది మరియు చిత్రంలో ఆయుధం ఉందని 99 శాతం ఖచ్చితత్వంతో నిర్ణయిస్తుంది. కానీ స్కోర్ విలువ 95% కంటే తక్కువగా ఉంటే, మోడల్ యొక్క ఖచ్చితత్వం తగ్గడం ప్రారంభమవుతుంది (ఇది న్యూరల్ నెట్‌వర్క్ మోడల్‌ల లక్షణం).

ఫలితంగా, స్కోర్ మోడల్ ఆధారంగా క్యూ ఏర్పడుతుంది మరియు 95 మరియు 100 మధ్య వచ్చిన ప్రకటనలు ఆటోమేటిక్‌గా "నిషేధించబడిన ఉత్పత్తులు"గా బ్లాక్ చేయబడతాయి. 95 కంటే తక్కువ స్కోర్ ఉన్న ప్రకటనలు మాన్యువల్ ప్రాసెసింగ్ కోసం మోడరేటర్‌లకు పంపబడతాయి.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము
గుళికలతో చాక్లెట్ బెరెట్టా. మాన్యువల్ మోడరేషన్ కోసం మాత్రమే! 🙂

మాన్యువల్ మోడరేషన్

2019 ప్రారంభంలో, యులాలో దాదాపు 94% ప్రకటనలు స్వయంచాలకంగా నియంత్రించబడతాయి.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

ప్లాట్‌ఫారమ్ కొన్ని ప్రకటనలపై నిర్ణయం తీసుకోలేకపోతే, అది వాటిని మాన్యువల్ మోడరేషన్ కోసం పంపుతుంది. Odnoklassniki వారి స్వంత సాధనాన్ని అభివృద్ధి చేసింది: మోడరేటర్‌ల కోసం పనులు త్వరిత నిర్ణయం తీసుకోవడానికి అవసరమైన అన్ని సమాచారాన్ని వెంటనే ప్రదర్శిస్తాయి - ప్రకటన అనుకూలంగా ఉంటుంది లేదా బ్లాక్ చేయబడాలి, కారణాన్ని సూచిస్తుంది.

మాన్యువల్ మోడరేషన్ సమయంలో సేవ యొక్క నాణ్యత దెబ్బతినకుండా ఉండటానికి, ప్రజల పని నిరంతరం పర్యవేక్షించబడుతుంది. ఉదాహరణకు, టాస్క్ స్ట్రీమ్‌లో, మోడరేటర్‌కు "ట్రాప్స్" చూపబడుతుంది—ఇప్పటికే సిద్ధంగా ఉన్న పరిష్కారాలు ఉన్న ప్రకటనలు. మోడరేటర్ నిర్ణయం పూర్తయిన దానితో ఏకీభవించకపోతే, మోడరేటర్‌కు ఎర్రర్ ఇవ్వబడుతుంది.

సగటున, ఒక మోడరేటర్ ఒక ప్రకటనను తనిఖీ చేయడానికి 10 సెకన్లు వెచ్చిస్తారు. అంతేకాకుండా, అన్ని ధృవీకరించబడిన ప్రకటనలలో ఎర్రర్‌ల సంఖ్య 0,5% కంటే ఎక్కువ కాదు.

ప్రజల మితవాదం

Odnoklassniki నుండి సహోద్యోగులు మరింత ముందుకు వెళ్లి “ప్రేక్షకుల సహాయం” యొక్క ప్రయోజనాన్ని పొందారు: వారు సోషల్ నెట్‌వర్క్ కోసం ఒక గేమ్ అప్లికేషన్‌ను వ్రాశారు, దీనిలో మీరు పెద్ద మొత్తంలో డేటాను త్వరగా గుర్తించవచ్చు, కొన్ని చెడు సంకేతాలను హైలైట్ చేయవచ్చు - Odnoklassniki మోడరేటర్ (https://ok.ru/app/moderator) కంటెంట్‌ను మరింత ఆనందదాయకంగా మార్చడానికి ప్రయత్నిస్తున్న సరే వినియోగదారుల సహాయాన్ని సద్వినియోగం చేసుకోవడానికి మంచి మార్గం.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము
వినియోగదారులు ఫోన్ నంబర్‌ను కలిగి ఉన్న ఫోటోలను ట్యాగ్ చేసే గేమ్.

ప్లాట్‌ఫారమ్‌లోని ఏదైనా ప్రకటనల క్యూ Odnoklassniki మోడరేటర్ గేమ్‌కి దారి మళ్లించబడుతుంది. గేమ్ వినియోగదారులు మార్క్ అప్ చేసిన ప్రతిదీ ధృవీకరణ కోసం అంతర్గత మోడరేటర్‌లకు పంపబడుతుంది. ఫిల్టర్‌లు ఇంకా సృష్టించబడని ప్రకటనలను బ్లాక్ చేయడానికి మరియు ఏకకాలంలో శిక్షణ నమూనాలను రూపొందించడానికి ఈ పథకం మిమ్మల్ని అనుమతిస్తుంది.

మోడరేషన్ ఫలితాలను నిల్వ చేస్తోంది

మేము మోడరేషన్ సమయంలో తీసుకున్న అన్ని నిర్ణయాలను సేవ్ చేస్తాము, తద్వారా మేము ఇప్పటికే నిర్ణయం తీసుకున్న ప్రకటనలను మళ్లీ ప్రాసెస్ చేయము.

ప్రకటనల ఆధారంగా ప్రతిరోజూ మిలియన్ల కొద్దీ క్లస్టర్లు సృష్టించబడతాయి. కాలక్రమేణా, ప్రతి క్లస్టర్ "మంచి" లేదా "చెడు" అని లేబుల్ చేయబడింది. ప్రతి కొత్త ప్రకటన లేదా దాని పునర్విమర్శ, మార్క్‌తో క్లస్టర్‌లోకి ప్రవేశించడం, క్లస్టర్ నుండి స్వయంచాలకంగా రిజల్యూషన్‌ను పొందుతుంది. రోజుకు దాదాపు 20 వేల ఆటోమేటిక్ రిజల్యూషన్‌లు ఉన్నాయి.

మేము ప్రకటనలను ఎలా మోడరేట్ చేస్తాము

క్లస్టర్‌కి కొత్త ప్రకటనలు ఏవీ రాకపోతే, అది మెమరీ నుండి తీసివేయబడుతుంది మరియు దాని హాష్ మరియు సొల్యూషన్ Apache Cassandraకి వ్రాయబడుతుంది.

ప్లాట్‌ఫారమ్ కొత్త ప్రకటనను స్వీకరించినప్పుడు, ఇది ముందుగా సృష్టించిన వాటిలో ఇదే విధమైన క్లస్టర్‌ను కనుగొని దాని నుండి పరిష్కారాన్ని తీసుకోవడానికి ప్రయత్నిస్తుంది. అలాంటి క్లస్టర్ లేకపోతే, ప్లాట్‌ఫారమ్ కాసాండ్రాకు వెళ్లి అక్కడ చూస్తుంది. మీరు దానిని కనుగొన్నారా? గొప్పది, క్లస్టర్‌కు పరిష్కారాన్ని వర్తింపజేస్తుంది మరియు దానిని యులాకు పంపుతుంది. ప్రతిరోజూ సగటున 70 వేల "పునరావృత" నిర్ణయాలు ఉన్నాయి-మొత్తం 8%.

సంగ్రహించేందుకు

మేము రెండున్నర సంవత్సరాలుగా Odnoklassniki మోడరేషన్ ప్లాట్‌ఫారమ్‌ని ఉపయోగిస్తున్నాము. మేము ఫలితాలను ఇష్టపడతాము:

  • మేము రోజుకు మొత్తం ప్రకటనలలో 94% ఆటోమేటిక్‌గా మోడరేట్ చేస్తాము.
  • ఒక ప్రకటనను మోడరేట్ చేసే ఖర్చు 2 రూబిళ్లు నుండి 7 కోపెక్‌లకు తగ్గించబడింది.
  • రెడీమేడ్ సాధనానికి ధన్యవాదాలు, మేము మోడరేటర్లను నిర్వహించడంలో సమస్యల గురించి మరచిపోయాము.
  • మేము అదే సంఖ్యలో మోడరేటర్లు మరియు బడ్జెట్‌తో మాన్యువల్‌గా ప్రాసెస్ చేయబడిన ప్రకటనల సంఖ్యను 2,5 రెట్లు పెంచాము. స్వయంచాలక నియంత్రణ కారణంగా మాన్యువల్ మోడరేషన్ యొక్క నాణ్యత కూడా పెరిగింది మరియు దాదాపు 0,5% లోపాలలో హెచ్చుతగ్గులకు గురవుతుంది.
  • మేము కొత్త రకాల స్పామ్‌లను ఫిల్టర్‌లతో త్వరగా కవర్ చేస్తాము.
  • మేము కొత్త విభాగాలను మోడరేషన్‌కు త్వరగా కనెక్ట్ చేస్తాము "యులా వర్టికల్స్". 2017 నుండి, యులా రియల్ ఎస్టేట్, ఖాళీలు మరియు ఆటో నిలువులను జోడించింది.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి