حول شذوذ habrostatistics

لقد لاحظت سلوكًا غريبًا في التقييمات من قبل، لكن الغرابة أصبحت واضحة جدًا مؤخرًا. وقررت التحقيق في المشكلة باستخدام الأساليب العلمية المتاحة لي، وهي: تحليل ديناميكيات الزائد والسالب. هل تخيلت فجأة؟

ما زلت مبرمجًا، لكن يمكنني القيام بأشياء أساسية جدًا. لذلك قمت بترميز أداة مساعدة بسيطة تجمع الإحصائيات من لوحات منشور خابروف: الإيجابيات والسلبيات والمشاهدات والإشارات المرجعية وما إلى ذلك.

حول شذوذ habrostatistics

يتم عرض الإحصائيات في الرسوم البيانية، وبعد دراستها تمكنا من اكتشاف بضع مفاجآت أخرى، أصغر. ولكن أول الأشياء أولا.

الغرابة 1.
هذا هو المكان الذي بدأت فيه أبحاثي الإحصائية بالفعل.

بدا لي غريبًا أنه في الساعات الأولى بعد نشر بعض منشوراتي أصبحت سلبية بشكل حاد، ثم ذهبت إلى الصفر وحصلت في النهاية على الإضافة المتوقعة. لماذا حصل هذا؟

كنت على وشك نشر مشاركة أخرى - في جزأين. قررت إخضاعه للتحليل الإحصائي.

نشر الجزء الأول. في الوقت نفسه، قمت بتشغيل الأداة المساعدة وبدأت في انتظار النتيجة. ولسوء الحظ، في الليل - أثناء نومي - توقف البرنامج عن جمع المعلومات بسبب خطأ ما. في صباح اليوم التالي، قمت بتصحيح الخطأ، لكن الإحصائيات تبين أنها أقل من يوم واحد. ومع ذلك، فإن الاتجاهات واضحة أيضًا بالنسبة لوقت العمل.

يتم توفير البيانات لأول 14 ساعة من لحظة النشر، والفاصل الزمني بين القياسات هو 10 دقائق.

حول شذوذ habrostatistics

العيون لم تخدعنا: أغلب السلبيات تحدث في الساعة الأولى من وجود المنشور. في البداية ذهب المنشور إلى المنطقة السلبية، ثم تعافى. فيما يلي الأرقام المستخدمة لرسم الرسم البياني:

حول شذوذ habrostatistics

وهذا على الرغم من أن المشاهدات تتزايد بسلاسة!

حول شذوذ habrostatistics

يتم شرح الخطوات التي تبدأ من قيم الألف من خلال حقيقة أن الاختصارات تبدأ في لوحة خبروف: لا يوجد مكان للحصول على العدد الدقيق للمشاهدات (ربما كان من الممكن الحصول عليها من خدمات الطرف الثالث، لكنني لم أستخدمها ).

أنا لست خبيرا في الإحصاء، لكن توزيع السلبيات هذا غير طبيعي على حد علمي؟!

انظر، يتم توزيع الإشارات المرجعية بشكل أو بآخر بالتساوي خلال فترة التسجيل:

حول شذوذ habrostatistics

يتم أيضًا توزيع التعليقات بالتساوي:

حول شذوذ habrostatistics

هناك دفقات من النشاط والسلبية، لكنها موزعة أيضًا على مدار الفترة: التعليق إما يتلاشى أو يستأنف.

نفس الشيء بالنسبة للمشتركين – هناك زيادة طفيفة موحدة:

حول شذوذ habrostatistics

لم تتغير الكارما خلال الفترة المشمولة بالتقرير - وأنا لا أذكر ذلك. والتقييم يحسب بالحبر فلا فائدة من إدراجه.

كل المؤشرات تتغير بما يتناسب مع عدد المشاهدات، وفقط مع السلبيات يكون هناك خطأ: فورة الغضب تحدث في الساعة الأولى من بداية النشر. حدث نفس الشيء مع مشاركاتي السابقة. ولكن إذا كانت هذه في وقت سابق، إذا جاز التعبير، انطباعات شخصية، فقد تم تأكيدها الآن عن طريق التسجيل.

في رأيي الجديد تمامًا، يعني هذا التوزيع: أن هناك العديد من المستخدمين على الموقع الذين يشاهدون عن قصد أحدث المنشورات المنشورة ويصوتون بشكل سلبي على بعض المنشورات - بناءً على حاجة معروفة لهم فقط. أكتب "بعض المشاركات" لأنني لاحظت هذا التأثير ليس فقط في منشوراتي. في جميع الحالات، يكون التأثير واضحا، وإلا فلن أهتم به.

لدي أربعة إصدارات لماذا يحدث هذا.

نسخة 1. الانحراف العقلي. يتعمد الأشخاص المرضى مراقبة المؤلفين الذين يجدونهم مزعجين وينتقدونهم بهدف إيذائهم.

أنا لا أؤمن بهذا الإصدار.

نسخة 2. تأثير نفسي. أي واحد - لا أعرف. حسنًا، لماذا يقوم القراء أولاً بطرح المنشور بالإجماع، ثم لا يقل ذلك بالإجماع عن تأييده؟ هل هم ناقصون غير موضوعيين، ولكن زائد بعد أن يجد خبراء الجمال أنفسهم في الأغلبية؟ لا أعلم.

إذا كان هناك علماء نفس بين القراء، فليدلوا برأيهم.

نسخة 3. الخدم يتصرفون. ولماذا ينشر رؤساؤهم العفن على مناصب خبروف؟ والله أعلم. ومع ذلك، هناك جنود ليس فقط في بلدنا. من سيفهمهم يا روسوفوبيا؟!

نسخة 4. الآثار مجتمعة للعوامل المذكورة سابقا.

يمكن تصوره تماما.

مهما كان الأمر، يتمكن المستخدمون الناقصون من تقليل عدد مرات المشاهدة. لست على دراية بقواعد رفع منشورات خابروف إلى الأعلى، ولا أعرف حتى ما إذا كانت هذه الخوارزميات قد تم نشرها أم لا، لكن الأمر واضح بالنسبة لي: الطرح المبكر لا يسمح للمشاركات المنبوذة بالوصول إلى القمة - بتعبير أدق، فإنه يؤخر الوصول إلى هناك، مما يؤدي بدوره بشكل كبير، في بعض الأحيان، إلى تقليل عدد المشاهدات.

وبقدر ما أفهم، لا توجد طرق فعالة لمكافحة هذا الشر. الطريقة الوحيدة هي التصويت الشخصي. في هذه الحالة فقط يمكنك تحديد الملفات الشخصية التي يتم تتبعها بشكل دوري وحذف أحدث المشاركات. ومع ذلك، لا يوجد تصويت شخصي على حبري (أو بالأحرى، لم يتم الإعلان عنه).

ولكن ليس كل شيء في غاية البساطة.

كما قلت، تم نشر المادة التي تم تشريحها في أجزاء. بعد نشر الجزء الثاني، كنت أتوقع صورة مماثلة: مع الإخراج الأولي في الطرح واللاحق في علامة الزائد. ومع ذلك، فقد تبين أن التأثير كان أكثر سلاسة: لم يتحول المنشور إلى ناقص.

بحلول وقت نشر الجزء الثاني، تم إصلاح الخلل، لذلك يتم تقديم البيانات يوميًا:

حول شذوذ habrostatistics

لا أعرف من أين جاء التجانس. ربما لأنه تم نشره يوم السبت (التصويتات السلبية لا تعمل في أيام السبت؟) أو لأن هذه هي نهاية المواد المنشورة مسبقًا.

ومع ذلك، فإن توزيع السلبيات لا يزال غير متساو: تحدث جميع السلبيات في النصف الأول من فترة التسجيل، وينتهي ناقص في وقت سابق بكثير من زائد. وفي الوقت نفسه، يتم توزيع المشاهدات خلال الفترة تمامًا كما في المرة الأخيرة - بالتساوي:

حول شذوذ habrostatistics

الارتفاع الذي حدث حوالي الساعة الثالثة بعد الظهر ليس مادة سرية. لقد انقطع الإنترنت الخاص بي لمدة ساعة فقط. تعذر على الأداة المساعدة الاتصال بالموقع.

حول شذوذ habrostatistics

كل شيء آخر قياسي تمامًا.

إشارات مرجعية:

حول شذوذ habrostatistics

التعليقات: مثل المرة السابقة، تتناوب فترات النشاط مع فترات الصمت.

حول شذوذ habrostatistics

كارما. تم تسجيل زيادة في وحدتين - بالطبع، ليست متزامنة:

حول شذوذ habrostatistics

والمشتركين. بقي العدد الإجمالي دون تغيير (على ما يبدو، قام المهتمون بالتسجيل عند نشر الجزء الأول). في حوالي الساعة الواحدة ظهرًا كان هناك تقلب واحد: قام شخص ما بإلغاء اشتراكه - ربما عن طريق الخطأ - ولكنه قام بالتسجيل مرة أخرى على الفور. إذا كان شخصًا مختلفًا، حدث التعويض: لم يتغير العدد الإجمالي للمشتركين.

حول شذوذ habrostatistics

لذلك، تتصرف المقاييس اللاحقة بطريقة واضحة ويمكن التنبؤ بها. جميع المؤشرات، باستثناء السلبيات. وبما أنني لا أرى سببًا واضحًا لذلك، أجد أن الذروة السالبة غريبة على الأقل.

الغرابة 2.
في بعض الأحيان ينخفض ​​عدد المشاهدات (وهو أمر مستحيل بالطبع)، لكنه سرعان ما يعود إلى طبيعته.

لقد قمت بتتبعه عن طريق الصدفة، أثناء تصحيح أخطاء البرنامج، عندما لم يتم إرفاق وظيفة التصدير والاستيراد بعد، وبالتالي فإن الخط المتعرج المقابل مفقود في الرسم البياني. يمكنك أن تصدق كلامي - تمت ملاحظة هذا التأثير مرتين. عدة آلاف من المشاهدات، فجأة ينخفض ​​\u10b\u20bعدد المشاهدات بمقدار بضع مئات، بعد XNUMX-XNUMX دقيقة يتم استعادتها إلى مستواها السابق (دون مراعاة الزيادة الطبيعية).

هذا بسيط للغاية: خطأ في الموقع. وليس هناك ما يفكر فيه.

الغرابة 3.
وهذا ما بدا لي أكثر غرابة من التأثيرات الطوعية الأولى والتقنية الثانية. لا تحدث الإيجابيات بشكل فردي، مع توزيع متساوٍ خلال الفترة، ولكن في كتل. لكن الإضافة ليست تعليقا، فعندما يتبع السؤال إجابة بطبيعة الحال، فهو عمل فردي!

ألق نظرة فاحصة على الرسوم البيانية للنتائج المنشورة أعلاه: الكتل ملحوظة.

أومأ لي الأشخاص ذوو المعرفة بشأن توزيع بواسون، لكنني غير قادر على حساب الاحتمال بمفردي. إذا كنت قادرًا، قم بالحسابات. من الواضح بالنسبة لي أن عدد الإضافات المزدوجة يتجاوز بكثير القاعدة.

فيما يلي البيانات الرقمية حول مزايا الجزء الأول من المنشور. يوضح الرسم البياني عدد الإيجابيات للمواضع الفردية والمزدوجة والثلاثية في إجمالي عدد التقييمات المقدمة. كما ذكرنا سابقًا، الفاصل الزمني للقياس هو 10 دقائق.

حول شذوذ habrostatistics

ومن بين 30 وخزًا في 84 زنزانة، تم وخز زنزانتين ثلاث مرات. حسنًا، لا أعرف مدى توافق هذا مع نظرية الاحتمالات...

بيانات الجزء الثاني من التدوينة (نظرًا لأن فترة القياس أطول، سأختصرها وفقًا لمدة الجزء الأول للمقارنة):

حول شذوذ habrostatistics

بالمناسبة، هنا إحدى الإيجابيات الفردية مجاورة في الوقت المناسب للثلاثة أضعاف، أي في حوالي 20 دقيقة كان هناك زيادة في الإيجابيات (29٪ من إجمالي عددها كانت إيجابيات). وهذا لم يحدث في الدقائق الأولى من النشر.

العلاقة بين المواضع الفردية والمزدوجة والثلاثية هي نفسها تقريبًا كما في الجزء الأول. ويتم تفسير الانخفاض في حصة التصنيفات في القياسات من خلال حقيقة أن التقييمات تم تقديمها بشكل أقل تكرارًا. تم إجراء القياسات، ولكن لم يتم تسجيل أي مزايا.

لا أستطيع أن أشرح هذا التأثير الإضافي للكتلة بأي شكل من الأشكال، أي لا على الإطلاق. بالنسبة للسلبيات، فإن مثل هذا السلوك "الممتلئ" لا يبدو نموذجيًا.

هل ترسل بواعث الخير الاقتراحات على دفعات، تشتغل وتنطفئ؟ هيهيهيهي...

PS
إذا كان أي شخص يرغب في تحليل إحصائيات النشر باستخدام طرق أكثر تقدمًا أو التحقق من العمليات الحسابية، فإن الملفات التي تحتوي على البيانات المصدر موجودة هنا:
yadi.sk/d/iN4SL6tzsGEQxw

أنا لا أصر على شكوكي، وربما أكون مخطئا، خاصة وأن الإحصائيات قاتمة. آمل أن توضح تعليقات الإحصائيين المحترفين وعلماء النفس وغيرهم من المستخدمين المهتمين الارتباك الذي نشأ.

شكرا لكم على اهتمامكم.

المصدر: www.habr.com

إضافة تعليق