در مورد عجیب و غریب آمارها

من قبلاً متوجه رفتارهای عجیب و غریب در رتبه بندی شده بودم، اما اخیراً عجیب بودن بیش از حد آشکار شده است. و من تصمیم گرفتم با استفاده از روش های علمی در دسترسم به بررسی این مشکل بپردازم، یعنی: تجزیه و تحلیل پویایی مثبت و منفی. ناگهان تصور کردی؟

من هنوز یک برنامه نویس هستم، اما می توانم کارهای بسیار ابتدایی انجام دهم. بنابراین من یک ابزار ساده را کدنویسی کردم که آمار را از پانل های پست Khabrov جمع آوری می کند: جوانب مثبت، منفی، نمایش ها، نشانک ها و غیره.

در مورد عجیب و غریب آمارها

آمارها در نمودارها نمایش داده می شوند که پس از مطالعه آنها توانستیم چند شگفتی دیگر را کشف کنیم، موارد کوچکتر. اما اول از همه.

عجیب بودن 1.
این جایی بود که تحقیقات آماری من در واقع شروع شد.

برای من عجیب بود که در اولین ساعات پس از انتشار برخی از پست های من، آنها به شدت منفی شدند، سپس به صفر رسیدند و در نهایت امتیاز مثبت مورد انتظار را کسب کردند. چرا این اتفاق افتاد؟

من فقط می خواستم یک پست دیگر را منتشر کنم - در دو بخش. تصمیم گرفتم او را مورد تجزیه و تحلیل آماری قرار دهم.

قسمت اول را منتشر کرد. در همان زمان، من ابزار را راه اندازی کردم و شروع به منتظر ماندن برای نتیجه کردم. متأسفانه شب ها - در حالی که من خواب بودم - برنامه جمع آوری اطلاعات را به دلیل یک باگ متوقف کرد. صبح روز بعد خطا را تصحیح کردم، اما معلوم شد که آمار کمتر از یک روز است. با این حال، روندها برای زمان کار نیز آشکار است.

داده ها برای 14 ساعت اول از لحظه انتشار ارائه شده است، فاصله بین اندازه گیری ها 10 دقیقه است.

در مورد عجیب و غریب آمارها

چشم ها ما را فریب ندادند: بیشتر موارد منفی در اولین ساعت وجود پست رخ می دهد. در ابتدا پست وارد قلمرو منفی شد، سپس بهبود یافت. در اینجا اعداد مورد استفاده برای رسم نمودار آمده است:

در مورد عجیب و غریب آمارها

و این با وجود این واقعیت است که بازدیدها به آرامی در حال افزایش هستند!

در مورد عجیب و غریب آمارها

مراحل شروع از مقادیر هزارم با این واقعیت توضیح داده می شود که اختصارات در پانل Khabrov شروع می شوند: جایی برای دریافت تعداد دقیق بازدیدها وجود ندارد (احتمالا می تواند از خدمات شخص ثالث گرفته شده باشد ، اما من از آنها استفاده نکردم. ).

من متخصص آمار نیستم، اما تا جایی که من فهمیدم چنین توزیع منفی غیرعادی است؟!

نگاه کنید، نشانک ها در طول دوره ثبت نام کم و بیش به طور مساوی توزیع می شوند:

در مورد عجیب و غریب آمارها

نظرات همچنین به طور مساوی توزیع می شوند:

در مورد عجیب و غریب آمارها

انبوهی از فعالیت و انفعال وجود دارد، اما آنها همچنین در طول دوره توزیع می شوند: اظهار نظر یا محو می شود یا از سر گرفته می شود.

در مورد مشترکین هم همینطور - یک افزایش جزئی یکنواخت وجود دارد:

در مورد عجیب و غریب آمارها

کارما در طول دوره گزارش تغییر نکرد - من به آن اشاره نمی کنم. و رتبه توسط هابر محاسبه می شود، درج آن فایده ای ندارد.

همه شاخص‌ها متناسب با تعداد بازدیدها تغییر می‌کنند و فقط با موارد منفی چیزی اشتباه است: فوران خشم در اولین ساعت از شروع انتشار رخ می‌دهد. در پست های قبلی من هم همین اتفاق افتاد. اما اگر قبلاً اینها، به اصطلاح، برداشت های شخصی بودند، اکنون با ثبت نام تأیید می شوند.

به نظر من، چنین توزیعی به این معنی است: چندین کاربر در سایت وجود دارند که به طور هدفمند آخرین پست های منتشر شده را مشاهده می کنند و به برخی از پست ها رأی منفی می دهند - بر اساس نیازی که فقط برای آنها شناخته شده است. من "برخی از پست ها" را می نویسم زیرا این تأثیر را نه تنها در انتشاراتم مشاهده کردم. در همه موارد، اثر تلفظ می شود، در غیر این صورت من به سادگی به آن توجه نمی کردم.

من چهار نسخه دارم که چرا این اتفاق می افتد.

نسخه 1. انحراف ذهنی افراد بیمار عمداً مراقب نویسندگانی هستند که آنها را ناخوشایند می‌دانند و به آنها رأی منفی می‌دهند تا به آنها آسیب برسانند.

من به این نسخه اعتقادی ندارم

نسخه 2. اثر روانی. کدام یک - من نمی دانم. خوب، چرا خوانندگان ابتدا به اتفاق آرا پست را حذف می کنند، سپس به اتفاق آرا به آن رای نمی دهند؟ آیا آنها منهای به عنوان غیر موضوعی هستند، اما به علاوه بعد از خبره زیبایی خود را در اکثریت می یابند؟ نمی دانم.

اگر در بین خوانندگان روانشناس هستند، نظرشان را بگویند.

نسخه 3. خدمتگزاران اقدام می کنند. چرا باید روسای آنها روی پست های خابروف پوسیدگی بپاشند؟ خدا می داند. با این حال، سربازان نه تنها در کشور ما وجود دارند. چه کسی آنها را درک خواهد کرد، روسوفوب ها؟!

نسخه 4. اثرات ترکیبی عوامل ذکر شده قبلی.

کاملا قابل تصور

به هر حال، منهای کاربر موفق به کاهش تعداد بازدیدها می شوند. من با قوانین بالا بردن پست های خبروف آشنا نیستم، حتی نمی دانم که آیا این الگوریتم ها عمومی شده اند یا نه، اما برای من واضح است: منهای اولیه اجازه نمی دهد پست های طرد شده به بالا برسند - به طور دقیق تر، رسیدن به آنجا را به تاخیر می اندازد، که به نوبه خود به طور قابل توجهی، در مواقعی، تعداد بازدیدها را کاهش می دهد.

تا آنجا که من درک می کنم، هیچ راه موثری برای مبارزه با این شر وجود ندارد. تنها راه رای دادن شخصی است. فقط در این صورت می‌توانید مشخص کنید که کدام نمایه‌ها به صورت دوره‌ای ردیابی می‌شوند و منهای آخرین پست‌ها. با این حال، هیچ رأی گیری شخصی در مورد Habré وجود ندارد (یا بهتر است بگوییم، این رای گیری عمومی نیست).

اما همه چیز خیلی ساده نیست.

همانطور که گفتم مطالب کالبدشکافی شده به صورت قسمتی منتشر شد. پس از انتشار قسمت دوم، انتظار تصویر مشابهی را داشتم: خروجی اولیه در منهای و بعدی در مثبت. با این حال، این اثر بسیار هموارتر شد: پست به منفی تبدیل نشد.

تا زمان انتشار قسمت دوم، باگ برطرف شده بود، بنابراین داده ها در هر روز ارائه می شوند:

در مورد عجیب و غریب آمارها

من نمی دانم صاف شدن از کجا آمده است. شاید به این دلیل که شنبه منتشر شده است (رای منفی شنبه ها کار نمی کند؟) یا به این دلیل که این پایان مطالب منتشر شده قبلی است.

با این حال، توزیع منفی ها هنوز ناهموار است: همه منفی ها در نیمه اول دوره ثبت نام رخ می دهند و منفی ها خیلی زودتر از مثبت به پایان می رسد. در همان زمان، نماها در طول دوره دقیقاً مانند دفعه قبل توزیع می شوند - به طور مساوی:

در مورد عجیب و غریب آمارها

سنبله ای که حوالی سه بعد از ظهر اتفاق افتاد، مواد طبقه بندی نشده است. اینترنت من فقط یک ساعت قطع شد. ابزار نمی تواند به سایت متصل شود.

در مورد عجیب و غریب آمارها

بقیه چیزها کاملا استاندارد هستند.

نشانک ها:

در مورد عجیب و غریب آمارها

نظرات: مانند دفعه قبل، دوره های فعالیت با دوره های سکوت متناوب می شود.

در مورد عجیب و غریب آمارها

کارما. افزایش چند واحدی ثبت شد - البته نه همزمان:

در مورد عجیب و غریب آمارها

و مشترکین. تعداد کل بدون تغییر باقی ماند (ظاهراً علاقه مندان در زمان انتشار قسمت اول ثبت نام کردند). درست حوالی ساعت یک بعد از ظهر یک نوسان داشت: شخصی اشتراکش را لغو کرد - شاید به اشتباه - اما بلافاصله دوباره ثبت نام کرد. اگر شخص دیگری بود، جبران خسارت رخ داد: تعداد کل مشترکین تغییر نکرد.

در مورد عجیب و غریب آمارها

بنابراین، معیارهای پست به روشی واضح و قابل پیش بینی رفتار می کنند. همه شاخص ها، به جز موارد منفی. از آنجایی که هیچ دلیل واضحی برای این نمی بینم، منهای اوج حداقل عجیب است.

عجیب بودن 2.
گاهی اوقات تعداد بازدیدها کاهش می یابد (که البته غیرممکن است) اما به زودی به حالت عادی باز می گردد.

من آن را به طور تصادفی ردیابی کردم، در حالی که برنامه را اشکال زدایی می کردم، زمانی که تابع صادرات-واردات هنوز ضمیمه نشده بود، بنابراین زیگزاگ مربوطه در نمودار وجود ندارد. می توانید حرف من را قبول کنید - این تأثیر دو بار مشاهده شد. چندین هزار بازدید، ناگهان تعداد بازدیدها چند صد نفر کاهش می یابد، پس از 10-20 دقیقه به سطح قبلی خود باز می گردد (بدون در نظر گرفتن افزایش طبیعی).

این بسیار ساده است: یک اشکال در سایت. و چیزی برای فکر کردن وجود ندارد.

عجیب بودن 3.
این چیزی است که به نظر من بسیار عجیب تر از اثرات اول و فنی دوم داوطلبانه است. بعلاوه ها به تنهایی و با توزیع یکنواخت در طول دوره اتفاق نمی افتند، بلکه در بلوک ها. اما اضافه کردن یک نظر نیست، وقتی یک سوال به طور طبیعی جواب می دهد، یک عمل فردی است!

به نمودارهای نتیجه منتشر شده در بالا نگاه دقیق تری بیندازید: بلوک ها قابل توجه هستند.

افراد آگاه در مورد توزیع پواسون به من سر تکان دادند، اما من به تنهایی قادر به محاسبه احتمال نیستم. اگر توانایی دارید، حساب کنید. در حال حاضر برای من واضح است که تعداد مثبت های دوگانه بسیار بیشتر از حد معمول است.

در اینجا داده های دیجیتالی در مورد مزایای قسمت اول پست آمده است. نمودار تعداد امتیازهای مثبت برای موقعیت های تک، دو و سه گانه را در مجموع رتبه بندی های داده شده نشان می دهد. همانطور که قبلا ذکر شد، فاصله اندازه گیری 10 دقیقه است.

در مورد عجیب و غریب آمارها

از 30 پوک در 84 سلول، دو سلول سه بار پوک شدند. خوب، من نمی دانم این چقدر با نظریه احتمال مطابقت دارد ...

داده‌های قسمت دوم پست (از آنجایی که دوره اندازه‌گیری طولانی‌تر است، برای مقایسه آن را با توجه به مدت زمان قسمت اول کوتاه می‌کنم):

در مورد عجیب و غریب آمارها

به هر حال، در اینجا یکی از پلاس های مجرد از نظر زمانی با پلاس سه برابری مجاور است، یعنی در حدود 20 دقیقه افزایش مثبت وجود دارد (29٪ از تعداد کل آنها پلاس بود). و این اتفاق در اولین دقایق انتشار نیفتاد.

رابطه بین پوزیشن های تک، دوتایی و سه گانه تقریباً مانند قسمت اول است. و کاهش سهم رتبه بندی در اندازه گیری ها با این واقعیت توضیح داده می شود که رتبه بندی ها کمتر داده می شود. اندازه گیری ها انجام شد، اما هیچ مزیتی ثبت نشد.

من به هیچ وجه نمی توانم این اثر بلاک پلاس را توضیح دهم، یعنی اصلا. برای معایب، به نظر نمی رسد چنین رفتار "مسدود" معمولی باشد.

آیا ساطع کننده های خوبی پیشنهادات را به صورت دسته ای ارسال می کنند، روشن و خاموش می شوند؟ ههههه...

PS
اگر کسی می‌خواهد آمار پست را با استفاده از روش‌های پیشرفته‌تر تجزیه و تحلیل کند یا محاسبات را بررسی کند، فایل‌های حاوی داده‌های منبع اینجا هستند:
yadi.sk/d/iN4SL6tzsGEQxw

من بر تردیدهای خود پافشاری نمی کنم - شاید من اشتباه می کنم، به خصوص که آمار تیره و تار است. امیدوارم نظرات آماردانان حرفه ای، روانشناسان و سایر کاربران علاقه مند، سردرگمی ایجاد شده را روشن کند.

با تشکر از توجه شما.

منبع: www.habr.com

اضافه کردن نظر