كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

أهلاً بكم! اسمي ساشا ، أنا رئيس قسم التكنولوجيا وشريك مؤسس في LoyaltyLab. قبل عامين ، كنت أنا وأصدقائي ، مثل جميع الطلاب الفقراء ، نذهب في المساء لتناول الجعة إلى أقرب متجر بالقرب من المنزل. لقد شعرنا بالضيق الشديد لأن بائع التجزئة ، مع علمه بأننا سنأتي للبيرة ، لم يقدم خصمًا على الرقائق أو البسكويت ، على الرغم من أن هذا منطقي جدًا! لم نفهم سبب حدوث هذا الموقف وقررنا إنشاء شركة خاصة بنا. حسنًا ، كمكافأة ، اكتب خصومات لنفسك كل يوم جمعة لتلك الرقائق نفسها.

كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

ووصل كل شيء إلى النقطة التي أتحدث فيها مع المواد المتعلقة بالجانب التقني للمنتج في نفيديا جي تي سي. يسعدنا مشاركة عملنا مع المجتمع ، لذلك أقوم بنشر تقريري في شكل مقال.

مقدمة

مثل أي شخص في بداية الرحلة ، بدأنا بنظرة عامة حول كيفية صنع أنظمة الاقتراحات. وتبين أن الهندسة المعمارية من النوع التالي هي الأكثر شعبية:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

وهو يتألف من جزأين:

  1. أخذ عينات من المرشحين للحصول على توصيات من خلال نموذج بسيط وسريع ، وعادة ما يكون تعاونيًا.
  2. ترتيب المرشحين حسب نموذج محتوى أكثر تعقيدًا وأبطأ ، مع مراعاة جميع الميزات الممكنة في البيانات.

هنا وأدناه سأستخدم المصطلحات التالية:

  • مرشح / مرشح للتوصيات - زوج من منتج المستخدم ، والذي من المحتمل أن يدخل في توصيات في الإنتاج.
  • طريقة استخراج المرشحين / المستخرج / المرشح - عملية أو طريقة لاستخراج "المرشحين للتوصيات" من البيانات المتاحة.

في الخطوة الأولى ، عادةً ما يتم استخدام أشكال مختلفة من التصفية التعاونية. الاكثر شهرة - ALS. من المثير للدهشة أن معظم المقالات حول أنظمة التوصية تكشف فقط عن تحسينات مختلفة للنماذج التعاونية في المرحلة الأولى ، لكن لا أحد يتحدث عن طرق أخذ العينات الأخرى. بالنسبة لنا ، لم يعمل نهج استخدام النماذج التعاونية والتحسينات المختلفة معهم بالجودة التي توقعناها ، لذلك تعمقنا في البحث على وجه التحديد في هذا الجزء. وفي نهاية المقالة سأوضح إلى أي مدى تمكنا من تحسين ALS ، والذي كان خط الأساس لدينا.

قبل أن أنتقل إلى وصف نهجنا ، من المهم أن نلاحظ أنه مع توصيات الوقت الفعلي ، عندما يكون من المهم بالنسبة لنا النظر في البيانات التي حدثت قبل 30 دقيقة ، لا توجد بالفعل العديد من الأساليب التي يمكن أن تعمل في الوقت المناسب. ولكن ، في حالتنا ، لا يتعين علينا جمع التوصيات أكثر من مرة في اليوم ، وفي معظم الحالات - مرة واحدة في الأسبوع ، مما يمنحنا الفرصة لاستخدام نماذج معقدة ومضاعفة الجودة.

لنأخذ كمقاييس أساسية لا تعرضها سوى ALS في مهمة استخراج المرشحين. المقاييس الرئيسية التي نراقبها هي:

  • الدقة - نسبة المرشحين المختارين بشكل صحيح من العينة.
  • استدعاء - نسبة المرشحين الذين حدثوا من بين أولئك الذين كانوا بالفعل في الفترة الزمنية المستهدفة.
  • درجة F1 - درجة F محسوبة على النقطتين السابقتين.

سننظر أيضًا في مقاييس النموذج النهائي بعد تدريب التدرج المعزز بميزات محتوى إضافية. هناك أيضًا 3 مقاييس رئيسية:

  • الدقة @ 5 - متوسط ​​النسبة المئوية للزيارات من أعلى 5 حسب الاحتمال لكل عميل.
  • معدل الاستجابة @ 5 - تحويل المشترين من زيارة المتجر إلى شراء عرض شخصي واحد على الأقل (عرض واحد يحتوي على 5 منتجات).
  • متوسط ​​roc-auc لكل مستخدم - متوسط روك أوك لكل مشتر.

من المهم ملاحظة أنه يتم قياس كل هذه المقاييس التحقق عبر السلاسل الزمنية، أي أن التدريب يتم في الأسابيع k الأولى ، ويتم أخذ k + 1 أسبوعًا كبيانات اختبار. وبالتالي ، كان لتقلبات الصعود والهبوط الموسمية تأثير ضئيل على تفسير جودة النماذج. علاوة على ذلك ، في جميع الرسوم البيانية ، سيشير محور الإحداثي إلى رقم الأسبوع في التحقق المتقاطع ، وسيشير المحور الإحداثي إلى قيمة المقياس المحدد. تستند جميع الرسوم البيانية إلى بيانات المعاملات لعميل واحد ، بحيث تكون المقارنة بينهما صحيحة.

قبل أن نبدأ في وصف نهجنا ، دعنا أولاً نلقي نظرة على خط الأساس ، وهو نموذج ALS المُدرب.
مقاييس استخراج المرشح:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

المقاييس النهائية:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

أعامل جميع تطبيقات الخوارزميات على أنها نوع من فرضيات العمل. وبالتالي ، تقريبًا جدًا ، يمكن اعتبار أي نماذج تعاونية فرضية أن "الناس يميلون إلى شراء ما يشتريه الأشخاص مثلهم". كما قلت ، لم نقتصر على مثل هذه الدلالات ، وإليك بعض الفرضيات التي لا تزال تعمل بشكل رائع على البيانات في البيع بالتجزئة دون اتصال بالإنترنت:

  1. ماذا اشتريت من قبل.
  2. على غرار ما اشتريته من قبل.
  3. فترة الشراء في الماضي الطويل.
  4. شعبية حسب الفئة / العلامة التجارية.
  5. مشتريات بديلة لسلع مختلفة من أسبوع لآخر (سلاسل ماركوف).
  6. منتجات مماثلة للمشترين ، وفقًا للخصائص التي تم إنشاؤها بواسطة نماذج مختلفة (Word2Vec ، DSSM ، إلخ).

ماذا اشتريت من قبل

الاستدلال الأكثر وضوحًا والذي يعمل جيدًا في متاجر البقالة بالتجزئة. نأخذ هنا جميع السلع التي اشتراها حامل بطاقة الولاء في آخر K أيام (عادةً من 1 إلى 3 أسابيع) ، أو K أيام قبل عام. بتطبيق هذه الطريقة فقط ، نحصل على المقاييس التالية:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

من الواضح تمامًا هنا أنه كلما استغرقت الفترة الزمنية ، زاد الاستدعاء والدقة لدينا والعكس صحيح. نتائج أفضل في المتوسط ​​للعملاء في "آخر أسبوعين".

على غرار ما اشتريته من قبل

ليس من المستغرب أن "ما تم شراؤه من قبل" يعمل جيدًا في متاجر البقالة بالتجزئة ، ولكن استخراج المرشحين فقط مما اشتراه المستخدم بالفعل ليس أمرًا رائعًا ، لأنه من غير المحتمل أن يفاجئ المشتري ببعض المنتجات الجديدة. لذلك ، نقترح إجراء تحسين طفيف على هذا الاكتشاف باستخدام نفس النماذج التعاونية. من المتجهات التي تلقيناها أثناء تدريب ALS ، يمكنك الحصول على منتجات مماثلة لما اشتراه المستخدم بالفعل. تشبه هذه الفكرة إلى حد كبير "مقاطع الفيديو المماثلة" في خدمات عرض محتوى الفيديو ، ولكن نظرًا لأننا لا نعرف ما يأكله / يشتريه المستخدم في لحظة معينة ، يمكننا فقط البحث عن شيء مشابه لما اشتراه بالفعل ، خاصة وأننا نعلم بالفعل مدى نجاحها. بتطبيق هذه الطريقة على معاملات المستخدم على مدار الأسبوعين الماضيين ، نحصل على المقاييس التالية:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

ومن k - عدد المنتجات المماثلة التي تم استردادها لكل منتج اشتراه المشتري في آخر 14 يومًا.
نجح هذا النهج بشكل خاص بالنسبة لنا مع العميل الذي كان حاسمًا في عدم التوصية على الإطلاق بما كان موجودًا بالفعل في سجل شراء المستخدم.

فترة شراء طويلة في الماضي

كما اكتشفنا بالفعل ، نظرًا لتكرار شراء السلع ، فإن النهج الأول يعمل جيدًا مع تفاصيلنا. ولكن ماذا عن سلع مثل مسحوق الغسيل / الشامبو / إلخ. أي مع المنتجات التي من غير المحتمل أن تكون هناك حاجة إليها كل أسبوع أو أسبوعين والتي لا يمكن استخلاصها بالطرق السابقة. هذا يعني الفكرة التالية - يُقترح حساب فترة شراء كل منتج في المتوسط ​​للمشترين الذين اشتروا المنتج أكثر k مرة واحدة. ثم استخرج ما يرجح أن المشتري قد نفد بالفعل. يمكن التحقق من الفترات المحسوبة للبضائع بالعين للتأكد من كفاءتها:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

وبعد ذلك سنرى ما إذا كانت نهاية فترة المنتج تقع ضمن الفترة الزمنية التي ستكون فيها التوصيات قيد الإنتاج وأخذ عينات من ما يقع. يمكن توضيح النهج على النحو التالي:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

هنا لدينا حالتان رئيسيتان يمكن اعتبارهما:

  1. ما إذا كان سيتم أخذ عينات من المنتجات للعملاء الذين اشتروا المنتج أقل من ألف مرة.
  2. ما إذا كان يجب أخذ عينة من المنتج إذا كانت نهاية فترته تقع قبل بداية الفترة الزمنية المستهدفة.

يوضح الرسم البياني التالي النتائج التي تحققها هذه الطريقة باستخدام معلمات تشعبية مختلفة:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
ft - خذ فقط المشترين الذين اشتروا المنتج على الأقل K (هنا K = 5) مرات
tm - خذ فقط المرشحين الذين يقعون في الفترة الزمنية المستهدفة

ليس من المستغرب ، قادرة (0، 0) الأكبر تذكر وأصغر دقة، لأنه في ظل هذا الشرط يتم استخراج معظم المرشحين. ومع ذلك ، يتم الحصول على أفضل النتائج عندما لا نختبر المنتجات للعملاء الذين اشتروا منتجًا معينًا أقل من k مرات واستخراج ، من بين أمور أخرى ، البضائع التي تقع نهاية فترتها قبل الفترة الزمنية المستهدفة.

شعبية حسب الفئة

فكرة أخرى واضحة إلى حد ما هي أخذ عينات من المنتجات الشعبية عبر فئات أو علامات تجارية مختلفة. هنا نحسب لكل عميل أعلى ك الفئات / العلامات التجارية "المفضلة" واستخراج "الشعبية" من تلك الفئة / العلامة التجارية. في حالتنا ، نحدد "المفضلة" و "الشعبية" بعدد مشتريات المنتج. ميزة إضافية لهذا النهج هي قابليته للتطبيق في حالة البداية الباردة. أي للعملاء الذين أجروا عمليات شراء قليلة جدًا ، أو لم يتواجدوا في المتجر لفترة طويلة ، أو بشكل عام أصدروا بطاقة ولاء فقط. بالنسبة لهم ، من الأسهل والأفضل طرح البضائع من المشترين ذوي التاريخ الحالي. المقاييس هي كما يلي:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
هنا ، الرقم بعد كلمة "فئة" يعني مستوى تداخل الفئة.

بشكل عام ، ليس من المستغرب أيضًا أن تحقق الفئات الأضيق نتائج أفضل ، حيث إنها تستخرج منتجات "مفضلة" أكثر دقة للمشترين.

مشتريات بديلة لسلع مختلفة من أسبوع لآخر

نهج مثير للاهتمام لم أره في المقالات حول أنظمة التوصية هو أسلوب بسيط إلى حد ما ويعمل في نفس الوقت على طريقة إحصائية لسلاسل ماركوف. نحن هنا نأخذ أسبوعين مختلفين ، ثم نقوم ببناء أزواج من المنتجات لكل عميل [تم شراؤه في الأسبوع الأول] - [تم شراؤه في الأسبوع j] ، حيث j> i، ومن هنا نحسب لكل منتج احتمال التحول إلى منتج آخر الأسبوع المقبل. هذا هو ، لكل زوج من السلع منتج منتجj عد عددهم في الأزواج التي تم العثور عليها واقسمها على عدد الأزواج ، أين المنتج كان في الأسبوع الأول. لاستخراج المرشحين ، نتخذ آخر فحص للمشتري ونحصل عليه أعلى ك المنتجات التالية الأكثر احتمالاً من مصفوفة الانتقال التي حصلنا عليها. تبدو عملية بناء مصفوفة انتقالية كما يلي:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

من الأمثلة الحقيقية في مصفوفة احتمالات الانتقال ، نرى الظواهر الشيقة التالية:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
هنا يمكنك ملاحظة التبعيات المثيرة للاهتمام التي تم الكشف عنها في سلوك المستهلك: على سبيل المثال ، عشاق الحمضيات أو علامة تجارية من الحليب ، والتي من المرجح أن يتحولوا منها إلى نوع آخر. كما أنه ليس من المستغرب أن ينتهي الأمر بالعناصر ذات عمليات الشراء المتكررة العالية ، مثل الزبدة ، هنا أيضًا.

المقاييس في الطريقة مع سلاسل ماركوف هي كما يلي:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
k - عدد المنتجات التي يتم استردادها لكل سلعة تم شراؤها من آخر معاملة للمشتري.
كما نرى ، يُظهر التكوين بـ k = 4 أفضل نتيجة. يمكن تفسير الارتفاع المفاجئ في الأسبوع 4 بالسلوك الموسمي في أيام العطلات. 

منتجات مماثلة للمشترين ، وفقًا للخصائص التي تم إنشاؤها بواسطة نماذج مختلفة

لذلك نأتي إلى الجزء الأكثر صعوبة وإثارة للاهتمام - البحث عن أقرب الجيران في ناقلات المشترين والمنتجات المبنية وفقًا لنماذج مختلفة. في عملنا ، نستخدم 3 نماذج من هذا القبيل:

  • ALS
  • Word2Vec (Item2Vec لمثل هذه المهام)
  • دسم

لقد تعاملنا بالفعل مع ALS ، يمكنك أن تقرأ عن كيفية تعلمه هنا. في حالة Word2Vec ، نستخدم التنفيذ المعروف للنموذج من جنس. بالقياس مع النصوص ، نحدد العرض على أنه إيصال شراء. وبالتالي ، عند إنشاء ناقل المنتج ، يتعلم النموذج أن يتنبأ بـ "سياقه" للمنتج في الإيصال (باقي البضائع في الإيصال). في بيانات التجارة الإلكترونية ، من الأفضل استخدام جلسة المشتري بدلاً من الإيصال ، الرجال من الأوزون. و DSSM أكثر إثارة للاهتمام في التفكيك. تمت كتابته في الأصل بواسطة شباب من Microsoft كنموذج بحث ، يمكنك قراءة ورقة البحث الأصلية هنا. تبدو بنية النموذج كما يلي:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

ومن Q - الاستعلام ، استعلام بحث المستخدم ، د [i] - وثيقة ، صفحة ويب. يتلقى إدخال النموذج إشارات الطلب والصفحات على التوالي. يتبع كل طبقة إدخال عدد من الطبقات المتصلة بالكامل (إدراك متعدد الطبقات). بعد ذلك ، يتعلم النموذج تقليل جيب التمام بين المتجهات التي تم الحصول عليها في الطبقات الأخيرة من النموذج.
تستخدم مهام التوصية نفس البنية تمامًا ، ولكن بدلاً من الطلب ، يوجد مستخدم ، وبدلاً من الصفحات ، هناك منتجات. وفي حالتنا ، تتحول هذه البنية إلى ما يلي:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

الآن ، للتحقق من النتائج ، يبقى تغطية النقطة الأخيرة - إذا قمنا في حالة ALS و DSSM بتحديد متجهات المستخدم بوضوح ، ففي حالة Word2Vec لدينا فقط متجهات المنتج. هنا ، لبناء ناقل المستخدم ، حددنا 3 مناهج رئيسية:

  1. ما عليك سوى إضافة المتجهات ، ثم بالنسبة لمسافة جيب التمام ، يتبين أننا قمنا للتو بتقييم متوسط ​​المنتجات في سجل التسوق.
  2. جمع النواقل مع ترجيح بعض الوقت.
  3. وزن البضائع بمعامل TF-IDF.

في حالة الترجيح الخطي لمتجه المشتري ، ننطلق من الفرضية القائلة بأن المنتج الذي اشتراه المستخدم بالأمس له تأثير أكبر على سلوكه من المنتج الذي اشتراه قبل ستة أشهر. لذلك نعتبر الأسبوع السابق للمشتري بمعامل 1 ، وما حدث بعد ذلك مع معاملات ½ و وما إلى ذلك:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

بالنسبة لمعاملات TF-IDF ، نقوم بنفس الشيء تمامًا كما في TF-IDF للنصوص ، فقط نعتبر المشتري مستندًا ، والإيصال كعرض ، على التوالي ، الكلمة منتج. لذلك سيتحول ناقل المستخدم بشكل أكبر نحو السلع النادرة ، ولن تغير البضائع المألوفة والمألوفة للمشتري كثيرًا. يمكن توضيح النهج على النحو التالي:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

الآن دعونا نلقي نظرة على المقاييس. هذا ما تبدو عليه نتائج ALS:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
المقاييس حسب Item2Vec مع اختلافات مختلفة لبناء متجه المشتري:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
في هذه الحالة ، يتم استخدام نفس النموذج تمامًا كما في خط الأساس الخاص بنا. الاختلاف الوحيد هو أي k سنستخدمه. من أجل استخدام النماذج التعاونية فقط ، عليك أن تأخذ حوالي 50-70 منتجًا أقرب لكل عميل.

ومقاييس DSSM:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

كيف تجمع كل الطرق؟

رائع ، كما تقول ، ولكن ماذا تفعل بمثل هذه المجموعة الكبيرة من أدوات الاستخراج المرشحة؟ كيف تختار التكوين الأمثل لبياناتك؟ هنا لدينا عدة مشاكل:

  1. من الضروري تحديد مساحة البحث بطريقة أو بأخرى عن المعلمات الفائقة في كل طريقة. إنه ، بالطبع ، منفصل في كل مكان ، لكن عدد النقاط المحتملة كبير جدًا.
  2. كيف تختار أفضل تكوين للمقياس الخاص بك باستخدام عينة صغيرة محدودة من طرق محددة مع معلمات تشعبية محددة؟

لم نعثر حتى الآن على إجابة صحيحة لا لبس فيها على السؤال الأول ، لذلك ننطلق من التالي: لكل طريقة ، تتم كتابة محدد مساحة البحث في المعامل الفائق ، اعتمادًا على بعض الإحصائيات الخاصة بالبيانات التي لدينا. وبالتالي ، بمعرفة متوسط ​​الفترة بين عمليات الشراء من الأشخاص ، يمكننا تخمين الفترة التي يجب استخدام طريقة "ما تم شراؤه بالفعل" و "فترة الشراء الماضي الطويل".

وبعد أن مررنا بعدد كافٍ من الأشكال المختلفة للطرق المختلفة ، نلاحظ ما يلي: يستخرج كل تنفيذ عددًا معينًا من المرشحين وله قيمة معينة للمقياس (الاسترجاع) الذي يعد أمرًا أساسيًا بالنسبة لنا. نريد الحصول على عدد معين من المرشحين بشكل إجمالي ، اعتمادًا على قوة الحوسبة المسموح بها ، بأعلى مقياس ممكن. هنا تنهار المشكلة بشكل جيد في مشكلة الحقيبة على الظهر.
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

هنا يكون عدد المرشحين هو وزن السبيكة ، وطريقة الاسترجاع هي قيمتها. ومع ذلك ، هناك نقطتان إضافيتان يجب مراعاتهما عند تنفيذ الخوارزمية:

  • قد تتداخل الأساليب في المرشحين الذين يسحبونهم.
  • في بعض الحالات ، سيكون من الصحيح استخدام طريقة واحدة مرتين باستخدام معلمات مختلفة ، ولن يكون المرشحون عند إخراج الطريقة الأولى مجموعة فرعية من الثانية.

على سبيل المثال ، إذا أخذنا تنفيذ طريقة "ما تم شراؤه بالفعل" بفواصل زمنية مختلفة للاستخراج ، فسيتم دمج مجموعاتهم من المرشحين في بعضها البعض. في الوقت نفسه ، لا تعطي المعلمات المختلفة في "عمليات الشراء الدورية" عند المخرج تقاطعًا كاملاً. لذلك ، نقسم طرق أخذ العينات ذات المعلمات المختلفة إلى كتل بحيث نرغب في اتباع نهج استخراج واحد على الأكثر من كل كتلة بمعلمات تشعبية محددة. للقيام بذلك ، تحتاج إلى الخداع قليلاً في تنفيذ مشكلة الحقيبة ، لكن التقارب والنتيجة لن تتغير من هذا.

تتيح لنا هذه المجموعة الذكية الحصول على المقاييس التالية مقارنة بالنماذج التعاونية ببساطة:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
في المقاييس النهائية نرى الصورة التالية:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

ومع ذلك ، يمكنك هنا أن ترى أن هناك نقطة واحدة مكشوفة للتوصيات المفيدة للأعمال. الآن تعلمنا للتو كيف نتوقع بهدوء ما سيشتريه المستخدم ، على سبيل المثال ، الأسبوع المقبل. لكن مجرد إعطاء خصم على حقيقة أنه سيشتري على أي حال ليس أمرًا رائعًا. ولكن من الرائع زيادة التوقع ، على سبيل المثال ، للمقاييس التالية:

  1. الهامش / معدل الدوران بناءً على التوصيات الشخصية.
  2. متوسط ​​فحص المشترين.
  3. تكرار الزيارة.

لذلك نقوم بضرب الاحتمالات التي تم الحصول عليها بواسطة معاملات مختلفة وإعادة ترتيبها بحيث يشمل الجزء العلوي المنتجات التي تؤثر على المقاييس أعلاه. لا يوجد حل جاهز هنا ، ما هو النهج الأفضل للاستخدام. حتى أننا نجرب مثل هذه المعاملات مباشرة في الإنتاج. ولكن إليك بعض الحيل الممتعة التي غالبًا ما تقدم لنا أفضل النتائج:

  1. اضرب في السعر / هامش السلعة.
  2. اضرب في متوسط ​​الشيك الذي يحدث فيه المنتج. لذلك ستخرج البضائع التي عادة ما يأخذون بها شيئًا آخر.
  3. اضرب في متوسط ​​تواتر زيارات المشترين لهذا المنتج ، بناءً على الفرضية القائلة بأن هذا المنتج يؤدي إلى زيادة عوائده بشكل متكرر.

بعد تجربة المعاملات ، حصلنا على المقاييس التالية في الإنتاج:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت
ومن إجمالي تحويل المنتج - حصة المنتجات المشتراة من جميع المنتجات في التوصيات التي أنشأناها.

سيلاحظ القارئ اليقظ فرقًا كبيرًا بين المقاييس المتصلة بالإنترنت وغير المتصلة بالإنترنت. يفسر هذا السلوك بحقيقة أنه لا يمكن أخذ جميع المرشحات الديناميكية للمنتجات التي يمكن التوصية بها في الاعتبار عند تدريب النموذج. إنها قصة طبيعية بالنسبة لنا عندما يمكن تصفية نصف المرشحين المستخرجين ، فهذه الخصوصية نموذجية في صناعتنا.

فيما يتعلق بالإيرادات ، يتم الحصول على القصة التالية ، فمن الواضح أنه بعد إطلاق التوصيات ، تنمو عائدات مجموعة الاختبار بقوة ، والآن يبلغ متوسط ​​الزيادة في الإيرادات مع توصياتنا 3-4٪:
كيف قمنا بتحسين جودة التوصيات بشكل كبير في البيع بالتجزئة دون اتصال بالإنترنت

في الختام ، أود أن أقول إنه إذا كنت بحاجة إلى توصيات غير واقعية ، فستجد زيادة كبيرة جدًا في الجودة في التجارب مع استخلاص المرشحين للتوصيات. يتيح مقدار الوقت الكبير لإنشائها إمكانية الجمع بين العديد من الأساليب الجيدة ، والتي ستعطي في المجمل نتائج رائعة للأعمال.

سأكون سعيدًا للدردشة في التعليقات مع كل من يجد المادة ممتعة. يمكنك طرح الأسئلة علي شخصيًا تيليجرام. أشارك أيضًا أفكاري حول الذكاء الاصطناعي / الشركات الناشئة في بلدي قناة برقية - اهلا وسهلا 🙂

المصدر: www.habr.com

إضافة تعليق