لقد لاحظت سلوكًا غريبًا في التقييمات من قبل، لكن الغرابة أصبحت واضحة جدًا مؤخرًا. وقررت التحقيق في المشكلة باستخدام الأساليب العلمية المتاحة لي، وهي: تحليل ديناميكيات الزائد والسالب. هل تخيلت فجأة؟
ما زلت مبرمجًا، لكن يمكنني القيام بأشياء أساسية جدًا. لذلك قمت بترميز أداة مساعدة بسيطة تجمع الإحصائيات من لوحات منشور خابروف: الإيجابيات والسلبيات والمشاهدات والإشارات المرجعية وما إلى ذلك.
يتم عرض الإحصائيات في الرسوم البيانية، وبعد دراستها تمكنا من اكتشاف بضع مفاجآت أخرى، أصغر. ولكن أول الأشياء أولا.
الغرابة 1.
هذا هو المكان الذي بدأت فيه أبحاثي الإحصائية بالفعل.
بدا لي غريبًا أنه في الساعات الأولى بعد نشر بعض منشوراتي أصبحت سلبية بشكل حاد، ثم ذهبت إلى الصفر وحصلت في النهاية على الإضافة المتوقعة. لماذا حصل هذا؟
كنت على وشك نشر مشاركة أخرى - في جزأين. قررت إخضاعه للتحليل الإحصائي.
نشر الجزء الأول. في الوقت نفسه، قمت بتشغيل الأداة المساعدة وبدأت في انتظار النتيجة. ولسوء الحظ، في الليل - أثناء نومي - توقف البرنامج عن جمع المعلومات بسبب خطأ ما. في صباح اليوم التالي، قمت بتصحيح الخطأ، لكن الإحصائيات تبين أنها أقل من يوم واحد. ومع ذلك، فإن الاتجاهات واضحة أيضًا بالنسبة لوقت العمل.
يتم توفير البيانات لأول 14 ساعة من لحظة النشر، والفاصل الزمني بين القياسات هو 10 دقائق.
العيون لم تخدعنا: أغلب السلبيات تحدث في الساعة الأولى من وجود المنشور. في البداية ذهب المنشور إلى المنطقة السلبية، ثم تعافى. فيما يلي الأرقام المستخدمة لرسم الرسم البياني:
وهذا على الرغم من أن المشاهدات تتزايد بسلاسة!
يتم شرح الخطوات التي تبدأ من قيم الألف من خلال حقيقة أن الاختصارات تبدأ في لوحة خبروف: لا يوجد مكان للحصول على العدد الدقيق للمشاهدات (ربما كان من الممكن الحصول عليها من خدمات الطرف الثالث، لكنني لم أستخدمها ).
أنا لست خبيرا في الإحصاء، لكن توزيع السلبيات هذا غير طبيعي على حد علمي؟!
انظر، يتم توزيع الإشارات المرجعية بشكل أو بآخر بالتساوي خلال فترة التسجيل:
يتم أيضًا توزيع التعليقات بالتساوي:
هناك دفقات من النشاط والسلبية، لكنها موزعة أيضًا على مدار الفترة: التعليق إما يتلاشى أو يستأنف.
نفس الشيء بالنسبة للمشتركين – هناك زيادة طفيفة موحدة:
لم تتغير الكارما خلال الفترة المشمولة بالتقرير - وأنا لا أذكر ذلك. والتقييم يحسب بالحبر فلا فائدة من إدراجه.
كل المؤشرات تتغير بما يتناسب مع عدد المشاهدات، وفقط مع السلبيات يكون هناك خطأ: فورة الغضب تحدث في الساعة الأولى من بداية النشر. حدث نفس الشيء مع مشاركاتي السابقة. ولكن إذا كانت هذه في وقت سابق، إذا جاز التعبير، انطباعات شخصية، فقد تم تأكيدها الآن عن طريق التسجيل.
في رأيي الجديد تمامًا، يعني هذا التوزيع: أن هناك العديد من المستخدمين على الموقع الذين يشاهدون عن قصد أحدث المنشورات المنشورة ويصوتون بشكل سلبي على بعض المنشورات - بناءً على حاجة معروفة لهم فقط. أكتب "بعض المشاركات" لأنني لاحظت هذا التأثير ليس فقط في منشوراتي. في جميع الحالات، يكون التأثير واضحا، وإلا فلن أهتم به.
لدي أربعة إصدارات لماذا يحدث هذا.
نسخة 1. الانحراف العقلي. يتعمد الأشخاص المرضى مراقبة المؤلفين الذين يجدونهم مزعجين وينتقدونهم بهدف إيذائهم.
أنا لا أؤمن بهذا الإصدار.
نسخة 2. تأثير نفسي. أي واحد - لا أعرف. حسنًا، لماذا يقوم القراء أولاً بطرح المنشور بالإجماع، ثم لا يقل ذلك بالإجماع عن تأييده؟ هل هم ناقصون غير موضوعيين، ولكن زائد بعد أن يجد خبراء الجمال أنفسهم في الأغلبية؟ لا أعلم.
إذا كان هناك علماء نفس بين القراء، فليدلوا برأيهم.
نسخة 3. الخدم يتصرفون. ولماذا ينشر رؤساؤهم العفن على مناصب خبروف؟ والله أعلم. ومع ذلك، هناك جنود ليس فقط في بلدنا. من سيفهمهم يا روسوفوبيا؟!
نسخة 4. الآثار مجتمعة للعوامل المذكورة سابقا.
يمكن تصوره تماما.
مهما كان الأمر، يتمكن المستخدمون الناقصون من تقليل عدد مرات المشاهدة. لست على دراية بقواعد رفع منشورات خابروف إلى الأعلى، ولا أعرف حتى ما إذا كانت هذه الخوارزميات قد تم نشرها أم لا، لكن الأمر واضح بالنسبة لي: الطرح المبكر لا يسمح للمشاركات المنبوذة بالوصول إلى القمة - بتعبير أدق، فإنه يؤخر الوصول إلى هناك، مما يؤدي بدوره بشكل كبير، في بعض الأحيان، إلى تقليل عدد المشاهدات.
وبقدر ما أفهم، لا توجد طرق فعالة لمكافحة هذا الشر. الطريقة الوحيدة هي التصويت الشخصي. في هذه الحالة فقط يمكنك تحديد الملفات الشخصية التي يتم تتبعها بشكل دوري وحذف أحدث المشاركات. ومع ذلك، لا يوجد تصويت شخصي على حبري (أو بالأحرى، لم يتم الإعلان عنه).
ولكن ليس كل شيء في غاية البساطة.
كما قلت، تم نشر المادة التي تم تشريحها في أجزاء. بعد نشر الجزء الثاني، كنت أتوقع صورة مماثلة: مع الإخراج الأولي في الطرح واللاحق في علامة الزائد. ومع ذلك، فقد تبين أن التأثير كان أكثر سلاسة: لم يتحول المنشور إلى ناقص.
بحلول وقت نشر الجزء الثاني، تم إصلاح الخلل، لذلك يتم تقديم البيانات يوميًا:
لا أعرف من أين جاء التجانس. ربما لأنه تم نشره يوم السبت (التصويتات السلبية لا تعمل في أيام السبت؟) أو لأن هذه هي نهاية المواد المنشورة مسبقًا.
ومع ذلك، فإن توزيع السلبيات لا يزال غير متساو: تحدث جميع السلبيات في النصف الأول من فترة التسجيل، وينتهي ناقص في وقت سابق بكثير من زائد. وفي الوقت نفسه، يتم توزيع المشاهدات خلال الفترة تمامًا كما في المرة الأخيرة - بالتساوي:
الارتفاع الذي حدث حوالي الساعة الثالثة بعد الظهر ليس مادة سرية. لقد انقطع الإنترنت الخاص بي لمدة ساعة فقط. تعذر على الأداة المساعدة الاتصال بالموقع.
كل شيء آخر قياسي تمامًا.
إشارات مرجعية:
التعليقات: مثل المرة السابقة، تتناوب فترات النشاط مع فترات الصمت.
كارما. تم تسجيل زيادة في وحدتين - بالطبع، ليست متزامنة:
والمشتركين. بقي العدد الإجمالي دون تغيير (على ما يبدو، قام المهتمون بالتسجيل عند نشر الجزء الأول). في حوالي الساعة الواحدة ظهرًا كان هناك تقلب واحد: قام شخص ما بإلغاء اشتراكه - ربما عن طريق الخطأ - ولكنه قام بالتسجيل مرة أخرى على الفور. إذا كان شخصًا مختلفًا، حدث التعويض: لم يتغير العدد الإجمالي للمشتركين.
لذلك، تتصرف المقاييس اللاحقة بطريقة واضحة ويمكن التنبؤ بها. جميع المؤشرات، باستثناء السلبيات. وبما أنني لا أرى سببًا واضحًا لذلك، أجد أن الذروة السالبة غريبة على الأقل.
الغرابة 2.
في بعض الأحيان ينخفض عدد المشاهدات (وهو أمر مستحيل بالطبع)، لكنه سرعان ما يعود إلى طبيعته.
لقد قمت بتتبعه عن طريق الصدفة، أثناء تصحيح أخطاء البرنامج، عندما لم يتم إرفاق وظيفة التصدير والاستيراد بعد، وبالتالي فإن الخط المتعرج المقابل مفقود في الرسم البياني. يمكنك أن تصدق كلامي - تمت ملاحظة هذا التأثير مرتين. عدة آلاف من المشاهدات، فجأة ينخفض \u10b\u20bعدد المشاهدات بمقدار بضع مئات، بعد XNUMX-XNUMX دقيقة يتم استعادتها إلى مستواها السابق (دون مراعاة الزيادة الطبيعية).
هذا بسيط للغاية: خطأ في الموقع. وليس هناك ما يفكر فيه.
الغرابة 3.
وهذا ما بدا لي أكثر غرابة من التأثيرات الطوعية الأولى والتقنية الثانية. لا تحدث الإيجابيات بشكل فردي، مع توزيع متساوٍ خلال الفترة، ولكن في كتل. لكن الإضافة ليست تعليقا، فعندما يتبع السؤال إجابة بطبيعة الحال، فهو عمل فردي!
ألق نظرة فاحصة على الرسوم البيانية للنتائج المنشورة أعلاه: الكتل ملحوظة.
أومأ لي الأشخاص ذوو المعرفة بشأن توزيع بواسون، لكنني غير قادر على حساب الاحتمال بمفردي. إذا كنت قادرًا، قم بالحسابات. من الواضح بالنسبة لي أن عدد الإضافات المزدوجة يتجاوز بكثير القاعدة.
فيما يلي البيانات الرقمية حول مزايا الجزء الأول من المنشور. يوضح الرسم البياني عدد الإيجابيات للمواضع الفردية والمزدوجة والثلاثية في إجمالي عدد التقييمات المقدمة. كما ذكرنا سابقًا، الفاصل الزمني للقياس هو 10 دقائق.
ومن بين 30 وخزًا في 84 زنزانة، تم وخز زنزانتين ثلاث مرات. حسنًا، لا أعرف مدى توافق هذا مع نظرية الاحتمالات...
بيانات الجزء الثاني من التدوينة (نظرًا لأن فترة القياس أطول، سأختصرها وفقًا لمدة الجزء الأول للمقارنة):
بالمناسبة، هنا إحدى الإيجابيات الفردية مجاورة في الوقت المناسب للثلاثة أضعاف، أي في حوالي 20 دقيقة كان هناك زيادة في الإيجابيات (29٪ من إجمالي عددها كانت إيجابيات). وهذا لم يحدث في الدقائق الأولى من النشر.
العلاقة بين المواضع الفردية والمزدوجة والثلاثية هي نفسها تقريبًا كما في الجزء الأول. ويتم تفسير الانخفاض في حصة التصنيفات في القياسات من خلال حقيقة أن التقييمات تم تقديمها بشكل أقل تكرارًا. تم إجراء القياسات، ولكن لم يتم تسجيل أي مزايا.
لا أستطيع أن أشرح هذا التأثير الإضافي للكتلة بأي شكل من الأشكال، أي لا على الإطلاق. بالنسبة للسلبيات، فإن مثل هذا السلوك "الممتلئ" لا يبدو نموذجيًا.
هل ترسل بواعث الخير الاقتراحات على دفعات، تشتغل وتنطفئ؟ هيهيهيهي...
PS
إذا كان أي شخص يرغب في تحليل إحصائيات النشر باستخدام طرق أكثر تقدمًا أو التحقق من العمليات الحسابية، فإن الملفات التي تحتوي على البيانات المصدر موجودة هنا:
أنا لا أصر على شكوكي، وربما أكون مخطئا، خاصة وأن الإحصائيات قاتمة. آمل أن توضح تعليقات الإحصائيين المحترفين وعلماء النفس وغيرهم من المستخدمين المهتمين الارتباك الذي نشأ.
شكرا لكم على اهتمامكم.
المصدر: www.habr.com