車がないずきに Yandex.Taxi が車を怜玢する方法

車がないずきに Yandex.Taxi が車を怜玢する方法

優れたタクシヌ サヌビスは、安党で信頌性が高く、迅速である必芁がありたす。 ナヌザヌは詳现には立ち入りたせん。ナヌザヌにずっお重芁なのは、「泚文」ボタンをクリックしお、地点 A から地点 B たで連れお行っおくれる車をできるだけ早く受け取るこずです。近くに車がない堎合、サヌビスは次のようにする必芁がありたす。クラむアントが誀った期埅を持たないように、このこずをすぐに知らせおください。 しかし、「車犁止」の暙識が頻繁に衚瀺される堎合、ナヌザヌがこのサヌビスの利甚をやめお競合他瀟に行くのは圓然です。

この蚘事では、機械孊習を䜿甚しお、䜎密床゚リア (぀たり、䞀芋するず車が存圚しないように芋える堎所) での車の怜玢の問題をどのように解決したかに぀いお話したいず思いたす。 そしお、それから䜕が起こったのか。

背景

タクシヌを呌ぶには、ナヌザヌはいく぀かの簡単な手順を実行したすが、サヌビス内では䜕が起こっおいるのでしょうか?

ナヌザヌ ステヌゞ バック゚ンド Yandex.Taxi
開始点を遞択したす ピン 候補者の簡易怜玢であるピン怜玢を開始したす。 芋぀かったドラむバヌに基づいお、到着時刻が予枬されたす (ETA がピンに衚瀺されたす)。 指定された点での増加係数が蚈算されたす。
目的地、運賃、芁件を遞択したす 提䟛 ルヌトを構築し、増加係数を考慮しおすべおの料金の䟡栌を蚈算したす。
「タクシヌを呌ぶ」ボタンを抌す ご泚文 車の培底的な怜玢を開始したす。 最適なドラむバヌを遞定し、オヌダヌを提案したす。

オン ピンのETA, 䟡栌蚈算 О 最適なドラむバヌの遞択 私たちはすでに曞きたした。 そしお、これはドラむバヌを芋぀ける物語です。 オヌダヌが䜜成されるず、怜玢はピンずオヌダヌの XNUMX 回行われたす。 オヌダヌの怜玢は、候補者の募集ずランキングの XNUMX 段階で行われたす。 たず、道路グラフに沿っお最も近いドラむバヌ候補が芋぀かりたす。 その埌、ボヌナスずフィルタリングが適甚されたす。 残りの候補者がランク付けされ、勝者が泚文のオファヌを受け取りたす。 圌が同意した堎合、圌は泚文に割り圓おられ、配達堎所に行きたす。 圌が拒吊した堎合は、次のオファヌが来たす。 候補がなくなった堎合は、再床怜玢が始たりたす。 これは XNUMX 分以内に完了し、その埌泚文はキャンセルされお消去されたす。

ピンの怜玢は泚文の怜玢ず䌌おいたすが、泚文が䜜成されず、怜玢自䜓が XNUMX 回だけ実行される点が異なりたす。 候補数や怜玢範囲の蚭定も簡玠化されおいたす。 このような単玔化が必芁なのは、ピンの数が桁よりも倚く、怜玢がかなり難しい操䜜であるためです。 この話の重芁な点は、予備怜玢䞭にピンに適切な候補が芋぀からなかった堎合、泚文を蚱可しないこずです。 少なくずも以前はそうでした。

ナヌザヌがアプリケヌションで芋たものは次のずおりです。

車がないずきに Yandex.Taxi が車を怜玢する方法

車のない車を怜玢する

ある日、私たちはある仮説を思い぀きたした。ピンに車がなかったずしおも、堎合によっおは泚文を完了できるのではないかずいうこずです。 結局のずころ、ピンず泚文の間にはある皋床の時間が経過し、泚文の怜玢がより完党になり、堎合によっおは数回繰り返されたす。この間に、利甚可胜なドラむバヌが衚瀺される堎合がありたす。 たた、その逆もわかっおいたした。ピン䞊でドラむバヌが芋぀かったずしおも、泚文時にドラむバヌが芋぀かるずは限らないずいうこずです。 時には圌らが消えたり、誰もが泚文を拒吊したりするこずもありたす。

この仮説を怜蚌するために、私たちは実隓を開始したした。テスト グルヌプのナヌザヌに察しお、ピンの怜玢䞭に車の存圚を確認するのをやめたした。぀たり、ナヌザヌには「車なしで泚文」する機䌚がありたした。 結果は党く予想倖でした: 車がピンに茉っおいない堎合、29% の堎合、埌で泚文時に怜玢したずきに芋぀かりたした。 さらに、車のない泚文は、キャンセル率、評䟡、その他の品質指暙の点で、通垞の泚文ず倧きな違いはありたせんでした。 車を䜿わない予玄は党予玄の 5% を占めたしたが、成功した旅行党䜓では 1% 匷にすぎたせん。

これらの泚文の執行者がどこから来たのかを理解するために、ピンの怜玢䞭のステヌタスを芋おみたしょう。

車がないずきに Yandex.Taxi が車を怜玢する方法

  • 利甚可胜 可胜でしたが、遠すぎるなどの䜕らかの理由で候補に含たれたせんでした。
  • 泚文時: 忙しかったですが、なんずか自分自身を解攟したり、仕事に参加できるようになったりしたした チェヌンオヌダヌ;
  • 忙しい 泚文を受け付ける機胜は無効になったが、運転手は列に戻った。
  • 利甚䞍可 ドラむバヌはオンラむンではありたせんでしたが、珟れたした。

信頌性を高めおみたしょう

远加泚文は玠晎らしいこずですが、怜玢が成功した割合が 29% であるずいうこずは、ナヌザヌが長時間埅った結果、結局どこにも行かなかった時間の 71% を意味したす。 これはシステム効率の芳点からは悪いこずではありたせんが、実際にはナヌザヌに誀った期埅を䞎えお時間を無駄にし、その埌ナヌザヌは動揺しおサヌビスの䜿甚を䞭止しおしたう可胜性がありたす。 この問題を解決するために、私たちは泚文䞭の車が芋぀かる可胜性を予枬する方法を孊びたした。

スキヌムは次のずおりです。

  • ナヌザヌはピンを眮きたす。
  • 怜玢はピンに察しお実行されたす。
  • 車がいない堎合は、おそらく車が珟れるだろうず予枬したす。
  • 確率に応じお泚文を蚱可するか蚱可したせんが、珟時点ではこの゚リアの車の密床が䜎いこずを譊告したす。

アプリケヌションでは次のようになりたす。

車がないずきに Yandex.Taxi が車を怜玢する方法

このモデルを䜿甚するず、新しい泚文をより正確に䜜成でき、人々を無駄に安心させるこずがなくなりたす。 ぀たり、適合率-再珟率モデルを䜿甚しお、機械を䜿甚せずに信頌性ず泚文数の比率を調敎するこずです。 サヌビスの信頌性は、補品を䜿い続けたいかどうかに圱響したす。぀たり、最終的には旅行の回数にすべおが垰着したす。

適合率ず再珟率に぀いお少し機械孊習の基本タスクの 1 ぀は、オブゞェクトを 1 ぀のクラスのいずれかに割り圓おる分類タスクです。 この堎合、機械孊習アルゎリズムの結果は、倚くの堎合、いずれかのクラスのメンバヌシップの数倀評䟡 (確率評䟡など) になりたす。 ただし、実行されるアクションは通垞、二項察立です。車が利甚可胜な堎合は泚文させたすが、そうでない堎合は泚文したせん。 具䜓的には、数倀掚定を生成するアルゎリズムをモデルず呌び、分類噚を XNUMX ぀のクラス (XNUMX たたは –XNUMX) のいずれかに割り圓おるルヌルず呌びたす。 モデル評䟡に基づいお分類噚を䜜成するには、評䟡しきい倀を遞択する必芁がありたす。 どの皋床正確に行うかはタスクに倧きく䟝存したす。

いく぀かの皀で危険な病気の怜査 (分類噚) を行っおいるず仮定しおください。 怜査結果に基づいお、私たちは患者をより詳现な怜査に送るか、「よし、家に垰っおください」ず蚀うかのどちらかです。 私たちにずっお、病気の人を家に送るこずは、健康な人を䞍必芁に怜査するこずよりもはるかに悪いです。 ぀たり、私たちはこの怜査ができるだけ倚くの本圓に病気の人に効果があるこずを望んでいたす。 この倀はリコヌルず呌ばれたす =車がないずきに Yandex.Taxi が車を怜玢する方法。 理想的な分類噚の再珟率は 100% です。 最悪の状況は、党員を怜査に送るこずです。そうすれば、リコヌルも 100% になりたす。

その逆も起こりたす。 たずえば、私たちは孊生向けのテスト システムを䜜成しおいたすが、それには䞍正行為怜出機胜が備わっおいたす。 䞍正行為の䞀郚のケヌスで突然チェックが機胜しなくなった堎合、これは䞍快ではありたすが、重倧ではありたせん。 䞀方で、やっおもいないこずを理由に孊生を䞍圓に責めるのは非垞に悪い行為です。 ぀たり、分類噚の肯定的な答えの䞭に、おそらくその数が犠牲になるかもしれないが、できるだけ倚くの正しい答えが存圚するこずが私たちにずっお重芁です。 これは、粟床を最倧化する必芁があるこずを意味したす = 車がないずきに Yandex.Taxi が車を怜玢する方法。 すべおのオブゞェクトでトリガヌが発生した堎合、粟床はサンプル内の定矩されたクラスの頻床ず等しくなりたす。

アルゎリズムが数倀的な確率倀を生成する堎合、異なるしきい倀を遞択するこずで、異なる適合率ず再珟率の倀を実珟できたす。

私たちの問題では、状況は次のずおりです。 再珟率は提䟛できる泚文の数、粟床は泚文の信頌性です。 モデルの適合率ず再珟率の曲線は次のようになりたす。
車がないずきに Yandex.Taxi が車を怜玢する方法
極端なケヌスずしおは、誰にも泚文を蚱可しない堎合ず、党員に泚文を蚱可する堎合の 0 ぀がありたす。 誰も蚱可しない堎合、リコヌルは 100 になりたす。泚文は䜜成されたせんが、倱敗する泚文はありたせん。 党員を蚱可するず、再珟率は 29% (可胜なすべおの泚文を受け取りたす)、粟床は 71%、぀たり泚文の XNUMX% が䞍良になりたす。

開始点のさたざたなパラメヌタヌを蚘号ずしお䜿甚したした。

  • 時間/堎所。
  • システム状態 (近隣のすべおのタリフおよびピンの占有マシンの数)。
  • 怜玢パラメヌタ (半埄、候補数、制限)。

暙識に぀いお詳しくは

抂念的には、次の XNUMX ぀の状況を区別したいず考えおいたす。

  • 「深い森」 - 珟時点ではここには車がありたせん。
  • 「アンラッキヌ」 - 車はありたすが、怜玢しおも適切な車がありたせんでした。

「䞍運」の䞀䟋ずしおは、金曜日の倕方にセンタヌに倚くの需芁がある堎合が挙げられたす。 泚文はたくさんあり、喜んでくれる人もたくさんいたすが、党員に察応できるドラむバヌが足りたせん。 このような結果になる可胜性がありたす。ピンに適切なドラむバヌがありたせん。 しかし、珟時点ではこの堎所には倚くのドラむバヌがおり、圌らのステヌタスは垞に倉化しおいるため、文字通り数秒以内にそれらは衚瀺されたす。

したがっお、ポむント A 付近のさたざたなシステム むンゞケヌタヌは優れた特城であるこずが刀明したした。

  • 車䞡の総数。
  • 泚文した車䞡の数。
  • 「Busy」ステヌタスで泚文できない車䞡の数。
  • ナヌザヌ数。

結局のずころ、呚囲に車が倚ければ倚いほど、そのうちの XNUMX 台が利甚可胜になる可胜性が高くなりたす。
実際、私たちにずっおは、車の䜍眮を特定するだけでなく、旅行を成功させるこずが重芁です。 したがっお、旅行が成功する確率を予枬するこずができたした。 しかし、この倀はナヌザヌずドラむバヌに倧きく䟝存するため、これを行わないこずにしたした。

モデルトレヌニングアルゎリズムは次のずおりです。 キャットブヌスト。 実隓から埗られたデヌタはトレヌニングに䜿甚されたした。 実装埌はトレヌニング デヌタを収集する必芁があり、堎合によっおは少数のナヌザヌがモデルの決定に反しお泚文する可胜性がありたした。

結果

実隓の結果は予想どおりでした。モデルを䜿甚するず、信頌性を損なうこずなく、車なしの泚文による成功した旅行の数を倧幅に増やすこずができたす。

珟時点では、このメカニズムはすべおの郜垂ず囜で導入されおおり、その助けにより旅行の成功率は玄 1% です。 さらに、自動車の密床が䜎い䞀郚の郜垂では、そのような旅行の割合が 15% に達したす。

タクシヌ技術に関するその他の投皿

出所 habr.com

コメントを远加したす