Hallo zusammen! Mein Name ist Sasha, ich bin CTO und MitbegrĂŒnder von LoyaltyLab. Vor zwei Jahren gingen meine Freunde und ich, wie alle armen Studenten, abends zum nĂ€chsten Laden in der NĂ€he unseres Hauses, um Bier zu kaufen. Wir waren sehr verĂ€rgert darĂŒber, dass der EinzelhĂ€ndler, obwohl er wusste, dass wir Bier holen wĂŒrden, keinen Rabatt auf Chips oder Cracker anbot, obwohl das so logisch war! Wir verstanden nicht, warum diese Situation eintrat, und beschlossen, unser eigenes Unternehmen zu grĂŒnden. Nun, als Bonus gönnen Sie sich jeden Freitag Rabatte auf dieselben Chips.

Und das alles kam zu dem Punkt, an dem ich Material zur technischen Seite des Produkts prÀsentiere . Da wir unsere Arbeit gerne mit der Community teilen, veröffentliche ich meinen Bericht in Form eines Artikels.
EinfĂŒhrung
Wie alle anderen haben wir zu Beginn der Reise mit einem Ăberblick darĂŒber begonnen, wie Empfehlungssysteme hergestellt werden. Und die beliebteste Architektur erwies sich als folgender Typ:

Es besteht aus zwei Teilen:
- Auswahl von Kandidaten fĂŒr Empfehlungen mithilfe eines einfachen und schnellen Modells, normalerweise eines kollaborativen Modells.
- Ranking von Kandidaten mit einem komplexeren und langsameren Inhaltsmodell unter BerĂŒcksichtigung aller möglichen Merkmale in den Daten.
Im Folgenden verwende ich die folgenden Begriffe:
- Kandidat/Kandidat fĂŒr Empfehlungen â ein Benutzer-Produkt-Paar, das möglicherweise in Empfehlungen in der Produktion einbezogen werden könnte.
- Kandidatenextraktion/Extraktor/Kandidatenextraktionsmethode â ein Prozess oder eine Methode zur Extraktion von âEmpfehlungskandidatenâ aus verfĂŒgbaren Daten.
Der erste Schritt besteht normalerweise darin, verschiedene Varianten der kollaborativen Filterung zu verwenden. Die beliebtesten - . Es ist ĂŒberraschend, dass die meisten Artikel ĂŒber Empfehlungssysteme nur verschiedene Verbesserungen an kollaborativen Modellen in der ersten Phase offenbaren, aber niemand spricht viel ĂŒber andere Stichprobenmethoden. FĂŒr uns funktionierte der Ansatz, nur kollaborative Modelle zu verwenden und verschiedene Optimierungen damit durchzufĂŒhren, nicht mit der erwarteten QualitĂ€t, weshalb wir uns speziell auf diesen Teil der Forschung konzentrierten. Und am Ende des Artikels werde ich zeigen, wie sehr wir ALS verbessern konnten, was unser Ausgangswert war.
Bevor ich zur Beschreibung unseres Ansatzes ĂŒbergehe, ist es wichtig zu beachten, dass es bei Echtzeitempfehlungen, bei denen es fĂŒr uns wichtig ist, Daten zu berĂŒcksichtigen, die vor 30 Minuten aufgetreten sind, wirklich nicht viele AnsĂ€tze gibt, die in der erforderlichen Zeit funktionieren können. Aber in unserem Fall mĂŒssen wir Empfehlungen nur einmal am Tag einholen, in den meisten FĂ€llen sogar einmal pro Woche, was uns die Möglichkeit gibt, komplexe Modelle zu verwenden und die QualitĂ€t um ein Vielfaches zu verbessern.
Nehmen wir als Grundlage, welche Metriken nur ALS fĂŒr die Aufgabe der Kandidatenextraktion anzeigt. Die wichtigsten Kennzahlen, die wir ĂŒberwachen, sind:
- PrĂ€zision â der Anteil richtig ausgewĂ€hlter Kandidaten aus der Stichprobe.
- Der Recall ist der Anteil der Kandidaten, die tatsÀchlich im Zielintervall waren.
- F1-Score â F-MaĂ, berechnet anhand der beiden vorherigen Punkte.
Wir werden uns auch die Metriken des endgĂŒltigen Modells ansehen, nachdem wir die GradientenverstĂ€rkung mit zusĂ€tzlichen Inhaltsfunktionen trainiert haben. Auch hier gibt es drei Hauptmetriken:
- precision@5 â der durchschnittliche Prozentsatz der Produkte aus den Top 5 in Bezug auf die Wahrscheinlichkeit fĂŒr jeden KĂ€ufer.
- Response-Rate@5 â Konvertierung der Kunden von einem Ladenbesuch zum Kauf von mindestens einem persönlichen Angebot (5 Produkte in einem Angebot).
- Durchschn. Roc-AUC pro Benutzer â Durchschnitt fĂŒr jeden KĂ€ufer.
Es ist wichtig zu beachten, dass alle diese Kennzahlen gemessen werden Das heiĂt, das Training findet in den ersten k Wochen statt und k+1 Woche werden als Testdaten verwendet. Daher hatten saisonale Schwankungen nur minimale Auswirkungen auf die Interpretation der QualitĂ€t der Modelle. DarĂŒber hinaus zeigt die Abszissenachse in allen Diagrammen die Wochennummer der Kreuzvalidierung und die Ordinatenachse den Wert der angegebenen Metrik an. Alle Diagramme basieren auf Transaktionsdaten eines Kunden, sodass Vergleiche untereinander korrekt sind.
Bevor wir beginnen, unseren Ansatz zu beschreiben, werfen wir zunÀchst einen Blick auf die Basislinie, bei der es sich um ein ALS-trainiertes Modell handelt.
Kennzahlen zum Kandidatenabruf:

EndgĂŒltige Kennzahlen:

Ich behandle alle Implementierungen von Algorithmen als eine Art GeschĂ€ftshypothese. Grob lĂ€sst sich also jedes Kooperationsmodell als Hypothese betrachten, dass âMenschen dazu neigen, das zu kaufen, was ihnen Ă€hnliche Leute kaufen.â Wie ich bereits sagte, haben wir uns nicht nur auf diese Semantik beschrĂ€nkt, und hier sind einige Hypothesen, die bei Daten im Offline-Einzelhandel gut funktionieren:
- Was ich schon einmal gekauft habe.
- Ăhnlich wie das, was ich vorher gekauft habe.
- Zeitraum eines lÀngst vergangenen Kaufs.
- Beliebt nach Kategorie/Marke.
- Abwechselnder Einkauf verschiedener Waren von Woche zu Woche (Markov-Ketten).
- Ăhnliche Produkte fĂŒr KĂ€ufer, je nach Eigenschaften, die von verschiedenen Modellen (Word2Vec, DSSM usw.) erstellt wurden.
Was hast du vorher gekauft?
Die offensichtlichste Heuristik, die im Lebensmitteleinzelhandel sehr gut funktioniert. Hier nehmen wir alle Waren auf, die der Kundenkarteninhaber in den letzten K Tagen (normalerweise 1â3 Wochen) oder K Tagen vor einem Jahr gekauft hat. Wenn wir nur diese Methode anwenden, erhalten wir die folgenden Metriken:

Hier ist es ziemlich offensichtlich, dass wir umso mehr Erinnerung haben und umso weniger PrĂ€zision haben, je lĂ€nger wir den Zeitraum nehmen, und umgekehrt. Im Durchschnitt liefern die âletzten 2 Wochenâ bessere Ergebnisse fĂŒr die Kunden.
Ăhnlich wie das, was ich vorher gekauft habe
Es ist nicht verwunderlich, dass im Lebensmitteleinzelhandel âwas ich vorher gekauft habeâ gut funktioniert, aber Kandidaten nur aus dem zu extrahieren, was der Benutzer bereits gekauft hat, ist nicht sehr cool, da es unwahrscheinlich ist, dass der KĂ€ufer mit einem neuen Produkt ĂŒberrascht wird. Daher schlagen wir vor, diese Heuristik unter Verwendung derselben kollaborativen Modelle leicht zu verbessern. Aus den Vektoren, die wir wĂ€hrend des ALS-Trainings erhalten haben, können wir Ă€hnliche Produkte erhalten wie die, die der Benutzer bereits gekauft hat. Diese Idee ist den âĂ€hnlichen Videosâ in Diensten zum Ansehen von Videoinhalten sehr Ă€hnlich, aber da wir nicht wissen, was der Benutzer zu einem bestimmten Zeitpunkt isst/kauft, können wir nur nach Ă€hnlichen Videos suchen, insbesondere nach denen, die er bereits gekauft hat Da wir Wir wissen bereits, wie gut es funktioniert. Wenn wir diese Methode auf Benutzertransaktionen in den letzten zwei Wochen anwenden, erhalten wir die folgenden Messwerte:

Hier k â die Anzahl Ă€hnlicher Produkte, die fĂŒr jedes vom KĂ€ufer in den letzten 14 Tagen gekaufte Produkt abgerufen werden.
Dieser Ansatz funktionierte besonders gut fĂŒr unseren Kunden, fĂŒr den es wichtig war, nichts zu empfehlen, was sich bereits in der Kaufhistorie des Benutzers befand.
SpÀte Kauffrist
Wie wir bereits herausgefunden haben, eignet sich der erste Ansatz aufgrund der hohen Kauffrequenz fĂŒr unsere spezifischen BedĂŒrfnisse gut. Aber was ist mit Waren wie Waschpulver/Shampoo/etc. Das heiĂt, mit Produkten, die wahrscheinlich nicht alle ein bis zwei Wochen benötigt werden und die mit bisherigen Methoden nicht extrahiert werden können. Dies fĂŒhrt zu folgender Idee: Es wird vorgeschlagen, die durchschnittliche Kaufdauer jedes Produkts fĂŒr Kunden zu berechnen, die das Produkt hĂ€ufiger gekauft haben k einmal. Und dann extrahieren Sie, was dem KĂ€ufer höchstwahrscheinlich bereits ausgegangen ist. Die berechneten Warenfristen können Sie mit Ihren Augen auf Angemessenheit ĂŒberprĂŒfen:

Und dann schauen wir uns an, ob das Ende des Produktzeitraums in den Zeitraum fÀllt, in dem die Empfehlungen in Produktion gehen und probieren, was passiert. Der Ansatz lÀsst sich wie folgt veranschaulichen:

Hier haben wir zwei HauptfĂ€lle, die berĂŒcksichtigt werden können:
- Ist es notwendig, Produkte von Kunden zu testen, die das Produkt weniger als K-mal gekauft haben?
- Ist es notwendig, ein Produkt zu bemustern, wenn das Ende seines Zeitraums vor dem Beginn des Zielintervalls liegt?
Die folgende Grafik zeigt, welche Ergebnisse diese Methode mit verschiedenen Hyperparametern erzielt:

ft â Nehmen Sie nur Kunden, die das Produkt mindestens K-mal (hier K=5) gekauft haben
tm â Nehmen Sie nur Kandidaten auf, die innerhalb des Zielintervalls liegen
Es ist nicht ĂŒberraschend, dass er dazu in der Lage ist (0, 0) gröĂte erinnern und der Kleinste PrĂ€zision, da unter dieser Bedingung die meisten Kandidaten gefunden werden. Die besten Ergebnisse werden jedoch erzielt, wenn wir keine Produktproben fĂŒr Kunden durchfĂŒhren, die ein bestimmtes Produkt weniger als gekauft haben k Zeiten und Extrakt, einschlieĂlich Waren, deren Ende vor dem Zielintervall liegt.
Beliebt nach Kategorie
Eine weitere ziemlich naheliegende Idee besteht darin, beliebte Produkte verschiedener Kategorien oder Marken auszuprobieren. Hier berechnen wir fĂŒr jeden KĂ€ufer top-k âLieblingsâ-Kategorien/Marken und extrahieren Sie âbeliebtâ aus dieser Kategorie/Marke. In unserem Fall ermitteln wir âFavoritâ und âBeliebtâ anhand der Anzahl der KĂ€ufe des Produkts. Ein zusĂ€tzlicher Vorteil dieses Ansatzes ist seine Anwendbarkeit im Kaltstartfall. Das heiĂt fĂŒr Kunden, die entweder nur sehr wenig eingekauft haben, lĂ€ngere Zeit nicht im GeschĂ€ft waren oder gerade eine Kundenkarte ausgestellt haben. FĂŒr sie ist es einfacher und besser, Artikel auf Lager zu haben, die bei den Kunden beliebt sind und eine Geschichte haben. Die resultierenden Kennzahlen sind:

Hier bedeutet die Zahl nach dem Wort âKategorieâ die Verschachtelungsebene der Kategorie.
Insgesamt ist es auch nicht verwunderlich, dass engere Kategorien bessere Ergebnisse erzielen, da sie genauere âLieblingsâ-Produkte fĂŒr KĂ€ufer extrahieren.
Abwechselnder Einkauf verschiedener Waren von Woche zu Woche
Ein interessanter Ansatz, den ich in Artikeln ĂŒber Empfehlungssysteme noch nicht gesehen habe, ist eine recht einfache und gleichzeitig funktionierende statistische Methode von Markov-Ketten. Hier nehmen wir uns 2 verschiedene Wochen Zeit, dann bauen wir fĂŒr jeden Kunden Produktpaare [gekauft in Woche i]-[gekauft in Woche j], wobei j > i, und von hier aus berechnen wir fĂŒr jedes Produkt die Wahrscheinlichkeit, nĂ€chste Woche auf ein anderes Produkt umzusteigen. Das heiĂt, fĂŒr jedes Warenpaar Produkti-Produktj Wir zĂ€hlen ihre Anzahl in den gefundenen Paaren und dividieren durch die Anzahl der Paare, wo Produkti war in der ersten Woche. Um Kandidaten zu extrahieren, nehmen wir die letzte Quittung des KĂ€ufers und extrahieren sie top-k die wahrscheinlichsten nĂ€chsten Produkte aus der Ăbergangsmatrix, die wir erhalten haben. Der Prozess zum Erstellen einer Ăbergangsmatrix sieht folgendermaĂen aus:

Anhand realer Beispiele in der Ăbergangswahrscheinlichkeitsmatrix sehen wir die folgenden interessanten PhĂ€nomene:

Hier lassen sich interessante AbhĂ€ngigkeiten erkennen, die sich im Konsumentenverhalten offenbaren: etwa Liebhaber von ZitrusfrĂŒchten oder einer Milchmarke, von der sie mit groĂer Wahrscheinlichkeit auf eine andere umsteigen. Es ist auch nicht verwunderlich, dass auch Produkte mit hoher Wiederkaufsfrequenz, wie zum Beispiel Butter, hier landen.
Die Metriken in der Methode mit Markov-Ketten lauten wie folgt:

k â die Anzahl der Produkte, die fĂŒr jedes gekaufte Produkt aus der letzten Transaktion des KĂ€ufers abgerufen wurden.
Wie wir sehen, zeigt die Konfiguration mit k=4 das beste Ergebnis. Der Anstieg in Woche 4 kann durch saisonales Verhalten rund um die Feiertage erklÀrt werden.
Ăhnliche Produkte fĂŒr KĂ€ufer, je nach Eigenschaften, die von verschiedenen Modellen gebaut wurden
Jetzt sind wir beim schwierigsten und interessantesten Teil angelangt â der Suche nach nĂ€chsten Nachbarn auf der Grundlage von Kunden- und Produktvektoren, die nach verschiedenen Modellen erstellt wurden. In unserer Arbeit verwenden wir 3 solcher Modelle:
- ALS
- Word2Vec (Item2Vec fĂŒr solche Aufgaben)
- DSSM
Wir haben uns bereits mit ALS beschĂ€ftigt, Sie können nachlesen, wie es lernt . Im Fall von Word2Vec verwenden wir die bekannte Implementierung des Modells von Gensim. Analog zu den Texten verstehen wir das Angebot als Kaufbeleg. Bei der Konstruktion eines Produktvektors lernt das Modell also, fĂŒr das Produkt im Beleg seinen âKontextâ (die ĂŒbrigen Produkte im Beleg) vorherzusagen. Bei E-Commerce-Daten ist es besser, die Sitzung des KĂ€ufers anstelle einer Quittung zu verwenden; die Jungs von . Und DSSM ist interessanter zu analysieren. UrsprĂŒnglich wurde es von den Jungs von Microsoft als Modell fĂŒr die Suche geschrieben, . Die Architektur des Modells sieht folgendermaĂen aus:

Hier Q â Abfrage, Benutzersuchanfrage, D[i] â Dokument, Internetseite. Die Eingabe in das Modell sind die Attribute der Anfrage bzw. der Seiten. Nach jeder Eingabeschicht gibt es eine Reihe vollstĂ€ndig verbundener Schichten (mehrschichtiges Perzeptron). Als nĂ€chstes lernt das Modell, den Kosinus zwischen den in den letzten Schichten des Modells erhaltenen Vektoren zu minimieren.
Empfehlungsaufgaben verwenden genau die gleiche Architektur, nur gibt es anstelle einer Anfrage einen Benutzer und anstelle von Seiten Produkte. Und in unserem Fall wird diese Architektur wie folgt umgewandelt:

Um nun die Ergebnisse zu ĂŒberprĂŒfen, muss noch der letzte Punkt behandelt werden: Wenn wir im Fall von ALS und DSSM explizit Benutzervektoren definiert haben, dann haben wir im Fall von Word2Vec nur Produktvektoren. Um den Benutzervektor zu erstellen, haben wir hier drei HauptansĂ€tze definiert:
- FĂŒgen Sie einfach die Vektoren hinzu, dann stellt sich fĂŒr den Kosinusabstand heraus, dass wir einfach den Durchschnitt der Produkte in der Einkaufshistorie gebildet haben.
- Vektorsummierung mit etwas Zeitgewichtung.
- Wiegen von GĂŒtern mit TF-IDF-Koeffizient.
Bei der linearen Gewichtung des KĂ€ufervektors gehen wir von der Hypothese aus, dass das Produkt, das der Nutzer gestern gekauft hat, einen gröĂeren Einfluss auf sein Verhalten hat als das Produkt, das er vor sechs Monaten gekauft hat. Wir betrachten also die Vorwoche des KĂ€ufers mit einer Quote von 1 und das, was als NĂ€chstes geschah, mit einer Quote von œ, â
usw.:

Bei den TF-IDF-Koeffizienten machen wir genau das Gleiche wie bei TF-IDF fĂŒr Texte, nur betrachten wir den KĂ€ufer als Dokument und den Scheck als Angebot bzw. das Wort als Produkt. Auf diese Weise verschiebt sich der Fokus des Nutzers stĂ€rker auf seltene GĂŒter, wĂ€hrend hĂ€ufige und vertraute GĂŒter fĂŒr den KĂ€ufer daran kaum etwas Ă€ndern. Der Ansatz lĂ€sst sich wie folgt veranschaulichen:

Schauen wir uns nun die Kennzahlen an. So sehen die ALS-Ergebnisse aus:

Metriken fĂŒr Item2Vec mit verschiedenen Variationen der Konstruktion des KĂ€ufervektors:

In diesem Fall wird genau das gleiche Modell wie in unserer Basislinie verwendet. Der einzige Unterschied besteht darin, welches k wir verwenden werden. Um nur kollaborative Modelle zu nutzen, mĂŒssen Sie fĂŒr jeden Kunden etwa 50-70 nĂ€chstliegende Produkte nehmen.
Und Kennzahlen laut DSSM:

Wie kombiniere ich alle Methoden?
Cool, sagen Sie, aber was tun mit einem so groĂen Satz an Tools zur Kandidatenextraktion? Wie wĂ€hlen Sie die optimale Konfiguration fĂŒr Ihre Daten? Hier haben wir mehrere Probleme:
- Es ist notwendig, den Suchraum fĂŒr Hyperparameter in jeder Methode irgendwie einzuschrĂ€nken. Es ist natĂŒrlich ĂŒberall diskret, aber die Anzahl der möglichen Punkte ist sehr groĂ.
- Wie können Sie anhand einer kleinen, begrenzten Stichprobe spezifischer Methoden mit spezifischen Hyperparametern die beste Konfiguration fĂŒr Ihre Metrik auswĂ€hlen?
Auf die erste Frage haben wir noch keine definitiv richtige Antwort gefunden, daher gehen wir wie folgt vor: FĂŒr jede Methode wird ein Hyperparameter-Suchraumbegrenzer geschrieben, abhĂ€ngig von einigen Statistiken zu den uns vorliegenden Daten. Wenn wir also den durchschnittlichen Zeitraum zwischen KĂ€ufen von Personen kennen, können wir erraten, mit welchem ââZeitraum die Methode âwas bereits gekauft wurdeâ und âZeitraum eines lĂ€ngst zurĂŒckliegenden Kaufsâ verwendet werden soll.
Und nachdem wir eine bestimmte ausreichende Anzahl von Variationen verschiedener Methoden durchlaufen haben, stellen wir Folgendes fest: Jede Implementierung extrahiert eine bestimmte Anzahl von Kandidaten und hat fĂŒr uns einen bestimmten Wert der SchlĂŒsselmetrik (RĂŒckruf). Wir möchten insgesamt eine bestimmte Anzahl an Kandidaten, abhĂ€ngig von unserer zulĂ€ssigen Rechenleistung, mit einer möglichst hohen Metrik erhalten. Hier lĂ€sst sich das Problem wunderbar in das Rucksackproblem integrieren.

Hier ist die Anzahl der Kandidaten das Gewicht des Barrens und die RĂŒckrufmethode sein Wert. Es gibt jedoch noch zwei weitere Punkte, die bei der Implementierung des Algorithmus berĂŒcksichtigt werden sollten:
- Die Methoden können sich bei den von ihnen abgerufenen Kandidaten ĂŒberschneiden.
- In einigen FĂ€llen ist es richtig, eine Methode zweimal mit unterschiedlichen Parametern zu verwenden, und die Kandidatenausgabe der ersten Methode ist keine Teilmenge der zweiten.
Nehmen wir beispielsweise die Implementierung der Methode âWas ich bereits gekauft habeâ mit unterschiedlichen Abrufintervallen, dann werden ihre KandidatensĂ€tze ineinander verschachtelt. Gleichzeitig bieten unterschiedliche Parameter bei âperiodischen KĂ€ufenâ am Ausgang keinen vollstĂ€ndigen Schnittpunkt. Daher unterteilen wir die Sampling-AnsĂ€tze mit unterschiedlichen Parametern in Blöcke, so dass wir aus jedem Block höchstens einen Extraktionsansatz mit spezifischen Hyperparametern nehmen wollen. Um dies zu erreichen, mĂŒssen Sie bei der Umsetzung des Rucksackproblems ein wenig geschickt vorgehen, aber die Asymptotik und das Ergebnis werden sich nicht Ă€ndern.
Diese intelligente Kombination ermöglicht es uns, im Vergleich zu rein kollaborativen Modellen die folgenden Kennzahlen zu erhalten:

In den endgĂŒltigen Metriken sehen wir das folgende Bild:

Allerdings fĂ€llt hier auf, dass es einen ungedeckten Punkt fĂŒr Empfehlungen gibt, die fĂŒr das Unternehmen nĂŒtzlich sind. Jetzt haben wir gerade gelernt, wie man hervorragend vorhersagen kann, was der Benutzer beispielsweise nĂ€chste Woche kaufen wird. Aber einfach einen Rabatt auf etwas zu gewĂ€hren, das er bereits kaufen wird, ist nicht sehr cool. Aber es ist cool, die Erwartungen beispielsweise an die folgenden Kennzahlen zu maximieren:
- Marge/Umsatz basierend auf persönlichen Empfehlungen.
- Durchschnittlicher Kundenscheck.
- HĂ€ufigkeit der Besuche.
Also multiplizieren wir die erhaltenen Wahrscheinlichkeiten mit verschiedenen Koeffizienten und ordnen sie neu, sodass die Produkte, die die oben genannten Metriken beeinflussen, ganz oben stehen. Es gibt keine vorgefertigte Lösung, welcher Ansatz am besten geeignet ist. Mit solchen Koeffizienten experimentieren wir sogar direkt in der Produktion. Aber hier sind interessante Techniken, die uns am hÀufigsten die besten Ergebnisse liefern:
- Mit dem Preis/der Marge des Produkts multiplizieren.
- Mit dem durchschnittlichen Beleg multiplizieren, in dem das Produkt erscheint. Es werden also Waren entstehen, mit denen sie normalerweise etwas anderes nehmen.
- Multiplizieren Sie dies mit der durchschnittlichen BesuchshĂ€ufigkeit von KĂ€ufern dieses Produkts, basierend auf der Hypothese, dass dieses Produkt Menschen dazu verleitet, öfter zurĂŒckzukommen, um es zu kaufen.
Nach der DurchfĂŒhrung von Experimenten mit Koeffizienten haben wir in der Produktion die folgenden Metriken erhalten:

Hier Gesamtproduktumwandlung â der Anteil der gekauften Produkte an allen Produkten in den von uns generierten Empfehlungen.
Ein aufmerksamer Leser wird einen erheblichen Unterschied zwischen Offline- und Online-Metriken bemerken. Dieses Verhalten erklĂ€rt sich dadurch, dass nicht alle dynamischen Filter fĂŒr empfehlenswerte Produkte beim Training des Modells berĂŒcksichtigt werden können. FĂŒr uns ist es normal, dass die HĂ€lfte der gefundenen Kandidaten herausgefiltert werden kann; diese Besonderheit ist typisch fĂŒr unsere Branche.
In Bezug auf den Umsatz ergibt sich die folgende Geschichte, es ist klar, dass nach der EinfĂŒhrung der Empfehlungen der Umsatz der Testgruppe stark wĂ€chst, jetzt betrĂ€gt die durchschnittliche Umsatzsteigerung mit unseren Empfehlungen 3-4 %:

AbschlieĂend möchte ich sagen, dass, wenn Sie Empfehlungen benötigen, die nicht in Echtzeit erfolgen, eine sehr groĂe QualitĂ€tssteigerung durch Experimente mit der Extraktion von Kandidaten fĂŒr Empfehlungen erzielt werden kann. Ein groĂer Zeitaufwand fĂŒr ihre Entwicklung ermöglicht die Kombination vieler guter Methoden, die in der Summe zu groĂartigen Ergebnissen fĂŒr das Unternehmen fĂŒhren.
Ich freue mich, in den Kommentaren mit jedem zu chatten, der das Material interessant findet. Fragen können Sie mir persönlich unter stellen . Ich teile auch meine Gedanken ĂŒber KI/Startups in meinem - Willkommen :)
Source: habr.com
