Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala

Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala

Ang maayong serbisyo sa taxi kinahanglan nga luwas, kasaligan ug paspas. Ang tiggamit dili moadto sa mga detalye: importante alang kaniya nga iyang i-klik ang "Order" nga buton ug makadawat sa usa ka sakyanan sa labing madali nga mahimo nga magdala kaniya gikan sa punto A ngadto sa punto B. Kung walay mga sakyanan sa duol, ang serbisyo kinahanglan ipahibalo dayon bahin niini aron ang kliyente wala’y mga sayup nga gipaabut. Apan kung ang timaan nga "Wala’y mga awto" kanunay nga makita, nan makatarunganon nga ang usa ka tawo mohunong sa paggamit niini nga serbisyo ug moadto sa usa ka kakompetensya.

Niini nga artikulo gusto nakong hisgutan kung giunsa, gamit ang pagkat-on sa makina, nasulbad namo ang problema sa pagpangita sa mga sakyanan sa mga dapit nga ubos ang densidad (sa laing pagkasulti, diin, sa unang pagtan-aw, walay mga sakyanan). Ug unsa ang gikan niini.

sa naunang kasaysayan

Sa pagtawag sa usa ka taxi, ang user naghimo sa pipila ka yano nga mga lakang, apan unsa ang mahitabo sa sulod sa serbisyo?

User Stage I-backend ang Yandex.Taxi
Gipili ang punto sa pagsugod Pin Naglunsad kami og usa ka gipasimple nga pagpangita alang sa mga kandidato - pin search. Base sa mga drayber nga nakit-an, ang oras sa pag-abot gitagna - ETA sa pin. Ang pagtaas sa coefficient sa usa ka gihatag nga punto gikalkulo.
Gipili ang destinasyon, pamasahe, mga kinahanglanon Pagtanyag Nagtukod kami usa ka ruta ug gikalkula ang mga presyo alang sa tanan nga mga taripa, nga gikonsiderar ang pagtaas sa coefficient.
Pindota ang "Tawag og Taxi" nga buton Order Naglunsad kami og bug-os nga pagpangita sa sakyanan. Gipili namo ang labing angay nga drayber ug gitanyagan siya og order.

sa ETA sa pin, kalkulasyon sa presyo ΠΈ pagpili sa labing angay nga drayber nagsulat na kami. Ug kini usa ka istorya bahin sa pagpangita sa mga drayber. Kung ang usa ka order gihimo, ang pagpangita mahitabo kaduha: sa Pin ug sa order. Ang pagpangita alang sa usa ka order mahitabo sa duha ka yugto: pagrekrut sa mga kandidato ug ranggo. Una, makit-an ang mga magamit nga kandidato nga drayber kung kinsa ang labing duol sa graph sa dalan. Unya ang mga bonus ug pagsala gipadapat. Ang nahabilin nga mga kandidato giranggo ug ang mananaog makadawat usa ka tanyag nga order. Kung mosugot siya, i-assign siya sa order ug moadto sa delivery point. Kung mobalibad siya, ang tanyag moabut sa sunod. Kung wala nay mga kandidato, magsugod na usab ang pagpangita. Kini molungtad dili molapas sa tulo ka minuto, pagkahuman ang order kanselahon ug sunugon.

Ang pagpangita sa usa ka Pin susama sa pagpangita sa usa ka order, ang han-ay lang ang wala gihimo ug ang pagpangita mismo gihimo kausa ra. Ang gipasimple nga mga setting alang sa gidaghanon sa mga kandidato ug search radius gigamit usab. Ang ingon nga mga pagpayano gikinahanglan tungod kay adunay usa ka han-ay sa magnitude nga mas daghang mga pin kaysa mga order, ug ang pagpangita usa ka lisud nga operasyon. Ang yawe nga punto alang sa among istorya: kung sa panahon sa pasiuna nga pagpangita wala’y nakit-an nga angay nga mga kandidato sa Pin, nan dili ka namon tugutan nga magbutang usa ka order. At least ingon ana na.

Mao kini ang nakita sa user sa aplikasyon:

Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala

Pangitag mga sakyanan nga walay sakyanan

Usa ka adlaw nakahimo kami og usa ka pangagpas: tingali sa pipila ka mga kaso ang order mahimo gihapon nga makompleto, bisan kung walay mga sakyanan sa pin. Human sa tanan, pipila ka panahon ang milabay tali sa pin ug sa order, ug ang pagpangita sa order mas kompleto ug usahay gisubli sa makadaghang higayon: niining panahona, ang mga available nga mga drayber mahimong makita. Nahibal-an usab namon ang sukwahi: kung makit-an ang mga drayber sa pin, dili kini kamatuoran nga makit-an sila kung mag-order. Usahay sila mawala o ang tanan mobalibad sa mando.

Aron sulayan kini nga pangagpas, naglunsad kami og usa ka eksperimento: mihunong kami sa pagsusi sa presensya sa mga sakyanan sa panahon sa pagpangita sa usa ka Pin alang sa usa ka grupo sa pagsulay sa mga tiggamit, i.e., sila adunay oportunidad sa paghimo sa usa ka "order nga walay mga sakyanan." Ang resulta wala damha: kung ang awto wala sa pin, nan sa 29% sa mga kaso nakit-an kini sa ulahi - kung nangita sa order! Dugang pa, ang mga order nga wala’y mga awto dili kaayo lahi sa mga regular nga order sa mga termino sa mga rate sa pagkansela, mga rating, ug uban pang mga timailhan sa kalidad. Ang mga pag-book nga wala’y mga awto nagkantidad sa 5% sa tanan nga mga booking, apan sobra ra sa 1% sa tanan nga malampuson nga mga pagbiyahe.

Aron masabtan kung diin gikan ang mga tigpatuman niini nga mga mando, atong tan-awon ang ilang mga kahimtang sa panahon sa pagpangita sa usa ka Pin:

Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala

  • Anaa: anaa, apan sa pipila ka rason wala maapil sa mga kandidato, pananglitan, siya layo ra kaayo;
  • Sa order: busy, apan nakahimo sa pagpalingkawas sa iyang kaugalingon o mahimong magamit alang sa han-ay sa kadena;
  • Busy: ang abilidad sa pagdawat sa mga order gipugngan, apan ang drayber mibalik sa linya;
  • Dili magamit: ang drayber dili online, apan siya nagpakita.

Atong dugangan ang kasaligan

Ang mga dugang nga mga order maayo, apan ang 29% sa malampuson nga pagpangita nagpasabot nga 71% sa panahon nga ang user naghulat sa dugay nga panahon ug wala moadto bisan asa. Bisan kung kini dili usa ka dili maayo nga butang gikan sa usa ka punto sa pagkaayo sa sistema, kini sa tinuud naghatag sa tiggamit og sayup nga paglaum ug nag-usik sa oras, pagkahuman sila nasuko ug (tingali) mohunong sa paggamit sa serbisyo. Aron masulbad kini nga problema, nahibal-an namon ang pagtagna sa posibilidad nga makit-an ang usa ka awto nga na-order.

Ang laraw sama niini:

  • Ang user nagbutang ug pin.
  • Ang pagpangita gihimo sa pin.
  • Kung walay mga sakyanan, among gitagna: tingali sila magpakita.
  • Ug depende sa kalagmitan, gitugotan ka o dili nimo tugutan nga magbutang usa ka order, apan gipasidan-an ka namon nga ang densidad sa mga awto sa kini nga lugar karon gamay.

Sa aplikasyon kini ingon niini:

Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala

Ang paggamit sa modelo nagtugot kanimo sa paghimo og bag-ong mga order nga mas tukma ug dili pagpasalig sa mga tawo nga walay kapuslanan. Kana mao, aron makontrol ang ratio sa kasaligan ug ang gidaghanon sa mga order nga walay mga makina gamit ang precision-recall nga modelo. Ang pagkakasaligan sa serbisyo nakaimpluwensya sa tinguha nga magpadayon sa paggamit sa produkto, i.e. sa katapusan kini tanan moabut sa gidaghanon sa mga biyahe.

Usa ka gamay bahin sa precision-recallUsa sa mga batakang buluhaton sa pagkat-on sa makina mao ang buluhaton sa klasipikasyon: pag-assign sa usa ka butang sa usa sa duha ka klase. Sa kini nga kaso, ang resulta sa algorithm sa pagkat-on sa makina kanunay mahimong usa ka numerical assessment sa membership sa usa sa mga klase, pananglitan, usa ka probability assessment. Bisan pa, ang mga aksyon nga gihimo kasagaran binary: kung ang awto magamit, nan tugotan ka namon nga mag-order niini, ug kung dili, nan dili kami. Aron mahimong espesipiko, tawgon nato ang usa ka algorithm nga naghimo sa usa ka numerical nga pagbanabana nga usa ka modelo, ug ang usa ka classifier usa ka lagda nga nag-assign niini sa usa sa duha ka mga klase (1 o -1). Aron makahimo og classifier base sa model assessment, kinahanglang mopili ka og assessment threshold. Unsa man gyud ang nagdepende pag-ayo sa buluhaton.

Ibutang ta nga naghimo kita usa ka pagsulay (classifier) ​​​​sa pipila ka talagsaon ug peligro nga sakit. Base sa mga resulta sa pagsulay, ipadala namo ang pasyente alang sa mas detalyado nga eksaminasyon, o moingon: "Maayo, pauli na." Alang kanamo, ang pagpauli sa usa ka masakiton nga tawo labi ka daotan kaysa wala kinahanglana nga pagsusi sa usa ka himsog nga tawo. Kana mao, gusto namon nga ang pagsulay molihok alang sa daghang mga masakiton nga tawo kutob sa mahimo. Kini nga kantidad gitawag nga recall =Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala. Ang usa ka sulundon nga classifier adunay usa ka paghinumdom sa 100%. Ang usa ka degenerate nga sitwasyon mao ang pagpadala sa tanan alang sa eksaminasyon, unya ang recall mahimo usab nga 100%.

Kini usab mahitabo sa laing paagi sa palibot. Pananglitan, naghimo kami usa ka sistema sa pagsulay alang sa mga estudyante, ug kini adunay usa ka cheating detector. Kung sa kalit ang tseke dili molihok alang sa pipila nga mga kaso sa pagpanikas, nan kini dili maayo, apan dili kritikal. Sa laing bahin, hilabihan ka daotan ang dili patas nga pag-akusar sa mga estudyante sa usa ka butang nga wala nila buhata. Sa ato pa, hinungdanon alang kanato nga taliwala sa mga positibo nga tubag sa classifier adunay daghang mga tama kutob sa mahimo, tingali sa kadaot sa ilang gidaghanon. Kini nagpasabot nga kinahanglan nimo nga mapadako ang katukma = Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala. Kung ang pag-trigger mahitabo sa tanan nga mga butang, nan ang katukma mahimong katumbas sa frequency sa gipiho nga klase sa sample.

Kung ang algorithm naghimo og usa ka numerical probability value, unya pinaagi sa pagpili sa lain-laing mga thresholds, mahimo nimong makab-ot ang lain-laing mga precision-recall values.

Sa atong problema mao ni ang sitwasyon. Ang paghinumdom mao ang gidaghanon sa mga order nga among matanyag, ang katukma mao ang kasaligan niini nga mga order. Kini ang hitsura sa precision-recall curve sa among modelo:
Giunsa pagpangita sa Yandex.Taxi ang mga awto kung wala
Adunay duha ka grabe nga mga kaso: ayaw pagtugot bisan kinsa nga mag-order ug tugoti ang tanan nga mag-order. Kung dili nimo tugutan ang bisan kinsa, nan ang paghinumdom mahimong 0: wala kami maghimo mga mando, apan wala’y usa kanila nga mapakyas. Kung tugutan namon ang tanan, nan ang paghinumdom mahimong 100% (atong madawat ang tanan nga posible nga mga order), ug ang katukma mahimong 29%, ie 71% sa mga order mahimong dili maayo.

Gigamit namon ang lainlaing mga parameter sa punto sa pagsugod ingon mga timailhan:

  • Oras/lugar.
  • Sistema sa estado (gidaghanon sa gi-okupar nga mga makina sa tanan nga mga taripa ug mga pin sa palibot).
  • Mga parameter sa pagpangita (radius, gidaghanon sa mga kandidato, mga pagdili).

Dugang pa bahin sa mga timailhan

Sa konsepto, gusto namong mailhan ang duha ka sitwasyon:

  • "Deep forest" - walay mga sakyanan dinhi niining panahona.
  • "Malas" - adunay mga sakyanan, apan sa pagpangita walay bisan unsa nga angay.

Usa ka pananglitan sa "Unlucky" kung adunay daghang panginahanglan sa sentro sa Biyernes sa gabii. Adunay daghang mga order, daghang mga tawo nga andam, ug dili igo nga mga drayber alang sa tanan. Mahimo kini nga ingon niini: wala’y angay nga mga drayber sa pin. Apan sa literal sa sulod sa mga segundo sila nagpakita, tungod kay niining panahona adunay daghang mga drayber sa niini nga dapit ug ang ilang kahimtang kanunay nga nag-usab-usab.

Busa, ang lainlaing mga indikasyon sa sistema sa palibot sa punto A nahimo nga maayong mga bahin:

  • Total nga gidaghanon sa mga sakyanan.
  • Gidaghanon sa mga sakyanan nga gi-order.
  • Ang gidaghanon sa mga sakyanan nga dili magamit alang sa pag-order sa "Busy" nga kahimtang.
  • Gidaghanon sa mga tiggamit.

Tuod man, kon mas daghan ang mga sakyanan, mas lagmit nga ang usa niini mahimong magamit.
Sa tinuud, hinungdanon alang kanamo nga dili lamang mga awto ang nahimutang, apan nahimo usab nga malampuson nga mga pagbiyahe. Busa, posible nga matagna ang kalagmitan sa usa ka malampuson nga biyahe. Apan nakahukom kami nga dili kini buhaton, tungod kay kini nga kantidad nagdepende kaayo sa tiggamit ug drayber.

Ang algorithm sa pagbansay sa modelo mao CatBoost. Ang datos nga nakuha gikan sa eksperimento gigamit alang sa pagbansay. Pagkahuman sa pagpatuman, kinahanglan nga kolektahon ang datos sa pagbansay, usahay gitugotan ang gamay nga gidaghanon sa mga tiggamit nga mag-order batok sa desisyon sa modelo.

Mga resulta

Ang mga resulta sa eksperimento sama sa gipaabut: ang paggamit sa modelo nagtugot kanimo nga madugangan ang gidaghanon sa malampuson nga mga biyahe tungod sa mga order nga walay mga sakyanan, apan walay pagkompromiso sa pagkakasaligan.

Sa pagkakaron, ang mekanismo gilunsad sa tanang siyudad ug nasod ug uban sa tabang niini, mga 1% sa malampuson nga mga biyahe ang nahitabo. Dugang pa, sa pipila ka mga siyudad nga adunay ubos nga densidad sa mga sakyanan, ang bahin sa maong mga biyahe moabot sa 15%.

Ang ubang mga post bahin sa teknolohiya sa Taxi

Source: www.habr.com

Idugang sa usa ka comment