ฉันสังเกตเห็นพฤติกรรมแปลก ๆ ในการให้คะแนนมาก่อน แต่เมื่อเร็ว ๆ นี้ความแปลกประหลาดนั้นชัดเจนเกินไป และฉันตัดสินใจตรวจสอบปัญหาโดยใช้วิธีการทางวิทยาศาสตร์ที่มีให้ฉัน นั่นคือ เพื่อวิเคราะห์พลวัตของบวก-ลบ จู่ๆ คุณก็จินตนาการใช่ไหม?
ฉันยังเป็นโปรแกรมเมอร์ แต่ฉันสามารถทำสิ่งพื้นฐานได้ ดังนั้นฉันจึงเขียนโปรแกรมอรรถประโยชน์ง่ายๆ ที่รวบรวมสถิติจากแผงของโพสต์ Khabrov: ข้อดี ข้อเสีย การดู บุ๊กมาร์ก ฯลฯ
สถิติจะแสดงเป็นกราฟ หลังจากศึกษาแล้ว เราก็สามารถค้นพบความประหลาดใจอีกสองสามอย่างอันที่เล็กกว่าได้ แต่สิ่งแรกก่อน
ความแปลกประหลาด1.
นี่คือจุดเริ่มต้นของการวิจัยทางสถิติของฉัน
มันดูแปลกสำหรับฉันที่ในชั่วโมงแรกๆ หลังจากการตีพิมพ์โพสต์บางโพสต์ของฉัน พวกเขากลับกลายเป็นเชิงลบอย่างรวดเร็ว จากนั้นก็กลายเป็นศูนย์และในที่สุดก็ได้รับผลบวกที่คาดหวังไว้ ทำไมมันถึงเกิดขึ้น?
ฉันกำลังจะเผยแพร่โพสต์อื่น - แบ่งออกเป็นสองส่วน ฉันตัดสินใจส่งเขาไปวิเคราะห์ทางสถิติ
ตีพิมพ์ภาคแรกแล้ว ในเวลาเดียวกัน ฉันเปิดตัวยูทิลิตี้และเริ่มรอผลลัพธ์ น่าเสียดายที่ตอนกลางคืน - ในขณะที่ฉันกำลังหลับอยู่ - โปรแกรมหยุดรวบรวมข้อมูลเนื่องจากมีข้อบกพร่อง เช้าวันรุ่งขึ้น ฉันแก้ไขข้อผิดพลาด แต่สถิติปรากฏว่าน้อยกว่าหนึ่งวัน อย่างไรก็ตาม แนวโน้มยังชัดเจนสำหรับเวลาทำงานด้วย
ข้อมูลมีให้ใน 14 ชั่วโมงแรกนับจากช่วงเวลาที่เผยแพร่ ช่วงเวลาระหว่างการวัดคือ 10 นาที
ดวงตาไม่ได้หลอกลวงเรา: ข้อเสียส่วนใหญ่เกิดขึ้นในชั่วโมงแรกของการโพสต์ ในตอนแรกโพสต์เข้าสู่แดนลบ จากนั้นจึงฟื้นตัว ตัวเลขที่ใช้ในการพล็อตกราฟมีดังนี้
และแม้ว่ายอดวิวจะเพิ่มขึ้นอย่างราบรื่นก็ตาม!
ขั้นตอนที่เริ่มต้นจากค่าที่พันนั้นอธิบายได้จากข้อเท็จจริงที่ว่าตัวย่อเริ่มต้นในแผง Khabrov: ไม่มีที่ไหนที่จะได้รับจำนวนการดูที่แน่นอน (อาจเป็นไปได้ว่าอาจถูกนำมาจากบริการของบุคคลที่สาม แต่ฉันไม่ได้ใช้พวกเขา ).
ฉันไม่ใช่ผู้เชี่ยวชาญด้านสถิติ แต่การกระจายตัวของ minuses นั้นผิดปกติเท่าที่ฉันเข้าใจ?!
ดูสิ บุ๊กมาร์กมีการกระจายเท่าๆ กันไม่มากก็น้อยตลอดระยะเวลาการลงทะเบียน:
ความคิดเห็นก็มีการกระจายอย่างเท่าเทียมกัน:
มีกิจกรรมและความเฉื่อยชาเกิดขึ้นมากมาย แต่ก็มีการกระจายไปตามช่วงเวลาเช่นกัน การแสดงความคิดเห็นจางหายไปหรือดำเนินการต่อ
เช่นเดียวกับสมาชิก – มีการเพิ่มขึ้นเล็กน้อยสม่ำเสมอ:
กรรมไม่เปลี่ยนแปลงในช่วงระยะเวลาการรายงาน - ฉันไม่ได้อ้างอิงถึงมัน และการให้คะแนนจะคำนวณโดย Habr ไม่มีประเด็นใดในการแสดงรายการ
ตัวชี้วัดทั้งหมดเปลี่ยนแปลงตามสัดส่วนของจำนวนการดู และมีเพียงข้อเสียเท่านั้นที่มีสิ่งผิดปกติ: ความโกรธที่ปะทุเกิดขึ้นในชั่วโมงแรกนับจากเริ่มตีพิมพ์ สิ่งเดียวกันนี้เกิดขึ้นกับโพสต์ก่อนหน้าของฉัน แต่ถ้าก่อนหน้านี้เป็นความรู้สึกส่วนตัว ตอนนี้พวกเขาได้รับการยืนยันโดยการลงทะเบียน
ในความเห็น noob ล้วนๆ ของฉัน การเผยแพร่ดังกล่าวหมายถึง: มีผู้ใช้หลายคนบนไซต์ที่จงใจดูโพสต์ที่เผยแพร่ล่าสุดและลงคะแนนเสียงบางโพสต์ - ตามความต้องการที่พวกเขารู้จักเท่านั้น ฉันเขียน “บางโพสต์” เพราะฉันสังเกตเห็นผลกระทบนี้ไม่เพียงแต่ในสิ่งพิมพ์ของฉันเท่านั้น ในทุกกรณีเอฟเฟกต์จะเด่นชัดไม่เช่นนั้นฉันก็คงไม่สนใจมัน
ฉันมีสี่เวอร์ชันว่าทำไมสิ่งนี้ถึงเกิดขึ้น
เวอร์เซีย 1. การบิดเบือนทางจิต คนป่วยจงใจดูแลผู้เขียนที่พวกเขาพบว่าไม่เป็นที่พอใจและลงคะแนนเสียงให้พวกเขา โดยมีเป้าหมายที่จะทำร้ายพวกเขา
ฉันไม่เชื่อในเวอร์ชันนี้
เวอร์เซีย 2. ผลทางจิตวิทยา อันไหน - ฉันไม่รู้ เหตุใดผู้อ่านจึงลบโพสต์อย่างเป็นเอกฉันท์ก่อนแล้วจึงโหวตเห็นด้วยเป็นเอกฉันท์ไม่น้อย พวกเขาลบว่าไม่ใช่ประเด็น แต่บวกกับผู้ที่ชื่นชอบความงามพบว่าตัวเองเป็นคนส่วนใหญ่หรือไม่? ฉันไม่รู้.
หากมีนักจิตวิทยาในหมู่ผู้อ่านก็ให้พวกเขาพูดไป
เวอร์เซีย 3. คนรับใช้กำลังทำหน้าที่ เหตุใดเจ้านายของพวกเขาจึงเน่าเปื่อยในโพสต์ของ Khabrov? พระเจ้ารู้ อย่างไรก็ตาม มีทหารไม่เพียงแต่ในประเทศของเราเท่านั้น ใครจะเข้าใจพวกเขา Russophobes!
เวอร์เซีย 4. ผลรวมของปัจจัยที่กล่าวมาข้างต้น
ค่อนข้างจะจินตนาการได้
อาจเป็นไปได้ว่า minusers จัดการเพื่อลดจำนวนการดู ฉันไม่คุ้นเคยกับกฎในการนำโพสต์ของ Khabrov ไปที่ด้านบน ฉันไม่รู้ด้วยซ้ำว่าอัลกอริธึมเหล่านี้ได้รับการเปิดเผยต่อสาธารณะหรือไม่ แต่สำหรับฉันเห็นได้ชัดเจน: การลบในช่วงต้นไม่อนุญาตให้โพสต์ที่ถูกเนรเทศขึ้นไปถึงด้านบน - แม่นยำยิ่งขึ้นคือทำให้การเดินทางล่าช้า ส่งผลให้จำนวนการดูลดลงอย่างมาก
เท่าที่ฉันเข้าใจ ไม่มีวิธีใดที่มีประสิทธิภาพในการต่อสู้กับความชั่วร้ายนี้ วิธีเดียวคือการลงคะแนนส่วนตัว เฉพาะในกรณีนี้เท่านั้นที่คุณจะสามารถกำหนดได้ว่าโปรไฟล์ใดที่ติดตามเป็นระยะและลบโพสต์ล่าสุด อย่างไรก็ตาม ไม่มีการลงคะแนนส่วนตัวในHabré (หรือค่อนข้างจะไม่ได้เปิดเผยต่อสาธารณะ)
แต่ไม่ใช่ทุกอย่างง่ายมาก
อย่างที่ฉันบอกไป เนื้อหาที่ผ่านั้นได้รับการตีพิมพ์เป็นบางส่วน หลังจากการตีพิมพ์ส่วนที่สอง ฉันคาดหวังภาพที่คล้ายกัน: โดยเอาต์พุตเริ่มต้นอยู่ในเครื่องหมายลบและเอาต์พุตถัดไปอยู่ในเครื่องหมายบวก อย่างไรก็ตามเอฟเฟกต์ดูเรียบเนียนขึ้นมาก: โพสต์ไม่ได้กลายเป็นลบ
เมื่อถึงเวลาเผยแพร่ส่วนที่สอง จุดบกพร่องได้รับการแก้ไขแล้ว ดังนั้นข้อมูลจะได้รับต่อวัน:
ไม่รู้ว่าความเนียนมาจากไหน อาจเป็นเพราะเผยแพร่เมื่อวันเสาร์ (การลงคะแนนไม่ทำงานในวันเสาร์ใช่ไหม) หรือเพราะนี่คือจุดสิ้นสุดของเนื้อหาที่เผยแพร่ก่อนหน้านี้
อย่างไรก็ตาม การกระจายของ minuses ยังคงไม่สม่ำเสมอ: minuses ทั้งหมดจะเกิดขึ้นในช่วงครึ่งแรกของระยะเวลาการลงทะเบียน และการลบจะสิ้นสุดเร็วกว่าบวกมาก ในเวลาเดียวกัน จำนวนการดูจะถูกกระจายในช่วงเวลาเหมือนกับครั้งล่าสุดอย่างเท่าๆ กัน:
การเพิ่มขึ้นอย่างรวดเร็วที่เกิดขึ้นประมาณบ่ายสามโมงไม่ใช่ข้อมูลลับ อินเตอร์เน็ตของฉันเพิ่งหมดไปหนึ่งชั่วโมง ยูทิลิตี้นี้ไม่สามารถเชื่อมต่อกับไซต์ได้
ทุกสิ่งทุกอย่างเป็นมาตรฐานอย่างสมบูรณ์
ที่คั่นหน้า:
ความคิดเห็น : เหมือนครั้งที่แล้วช่วงกิจกรรมสลับกับช่วงเงียบๆ
กรรม. มีการบันทึกการเพิ่มขึ้นสองสามหน่วย - แน่นอนว่าไม่ใช่พร้อมกัน:
และสมาชิก จำนวนรวมยังคงไม่เปลี่ยนแปลง (เห็นได้ชัดว่าผู้สนใจลงทะเบียนเมื่อภาคแรกเผยแพร่) ประมาณบ่ายโมงก็เกิดความผันผวน: มีคนยกเลิกการสมัคร - อาจเกิดจากความผิดพลาด - แต่กลับสมัครใหม่ทันที หากเป็นบุคคลอื่นจะมีการชดเชย: จำนวนสมาชิกทั้งหมดไม่เปลี่ยนแปลง
ดังนั้น ตัวชี้วัดของโพสต์จะทำงานในลักษณะที่ชัดเจนและคาดเดาได้ ตัวชี้วัดทั้งหมด ยกเว้นข้อเสีย เนื่องจากฉันไม่เห็นเหตุผลที่ชัดเจนสำหรับเรื่องนี้ ฉันจึงพบว่ายอดลบนั้นอย่างน้อยก็แปลก
ความแปลกประหลาด2.
บางครั้งจำนวนการดูก็ลดลง (ซึ่งแน่นอนว่าเป็นไปไม่ได้) แต่ในไม่ช้าก็กลับมาเป็นปกติ
ฉันติดตามมันโดยบังเอิญขณะทำการดีบั๊กโปรแกรมเมื่อยังไม่ได้แนบฟังก์ชันส่งออกและนำเข้า ดังนั้นกราฟซิกแซกที่เกี่ยวข้องจึงหายไป คุณสามารถใช้คำพูดของฉันได้ - ผลกระทบนี้ถูกสังเกตสองครั้ง การดูหลายพันครั้ง ทันใดนั้นจำนวนการดูก็ลดลงสองสามร้อยครั้ง หลังจากผ่านไป 10-20 นาที ก็จะกลับคืนสู่ระดับก่อนหน้า (โดยไม่คำนึงถึงการเพิ่มขึ้นตามธรรมชาติ)
มันค่อนข้างง่าย: มีข้อบกพร่องบนเว็บไซต์ และไม่มีอะไรต้องคิด
ความแปลกประหลาด3.
นี่คือสิ่งที่ดูเหมือนแปลกสำหรับฉันมากกว่าเอฟเฟกต์แรกและวินาทีทางเทคนิคโดยสมัครใจ ข้อดีไม่ได้เกิดขึ้นเพียงลำพัง โดยมีการกระจายสม่ำเสมอตลอดช่วงเวลา แต่เกิดขึ้นเป็นช่วงๆ แต่การเพิ่มไม่ใช่ความคิดเห็น เมื่อคำถามตามมาด้วยคำตอบอย่างเป็นธรรมชาติ นั่นเป็นการกระทำของแต่ละคน!
ลองดูกราฟผลลัพธ์ที่เผยแพร่ด้านบนให้ละเอียดยิ่งขึ้น: บล็อกต่างๆ จะสังเกตเห็นได้ชัดเจน
ผู้มีความรู้พยักหน้าให้ฉันเกี่ยวกับการแจกแจงแบบปัวซอง แต่ฉันไม่สามารถคำนวณความน่าจะเป็นได้ด้วยตัวเอง หากคุณสามารถทำได้ให้ทำคณิตศาสตร์ สำหรับฉันเห็นได้ชัดว่าจำนวนเครื่องหมายบวกสองเท่านั้นเกินกว่าปกติมาก
นี่คือข้อมูลดิจิทัลเกี่ยวกับข้อดีของส่วนแรกของโพสต์ กราฟแสดงจำนวนข้อดีสำหรับตำแหน่งเดี่ยว สอง และสามในจำนวนคะแนนทั้งหมดที่ให้ไว้ ตามที่กล่าวไว้ข้างต้น ช่วงเวลาการวัดคือ 10 นาที
จาก 30 การกระตุ้นใน 84 เซลล์ มีสองเซลล์ถูกกระตุ้นสามครั้ง ฉันไม่รู้ว่าสิ่งนี้สอดคล้องกับทฤษฎีความน่าจะเป็นมากแค่ไหน...
ข้อมูลสำหรับส่วนที่สองของโพสต์ (เนื่องจากระยะเวลาการวัดนานขึ้น ฉันจึงย่อให้สั้นลงตามระยะเวลาของส่วนแรกเพื่อให้สามารถเปรียบเทียบได้):
อย่างไรก็ตาม หนึ่งในข้อดีเดียวที่อยู่ติดกันทันเวลากับสามเท่านั่นคือในเวลาประมาณ 20 นาที มีข้อดีเพิ่มขึ้นอย่างรวดเร็ว (29% ของจำนวนทั้งหมดเป็นข้อดี) และสิ่งนี้ไม่ได้เกิดขึ้นในนาทีแรกของการตีพิมพ์
ความสัมพันธ์ระหว่างตำแหน่งเดี่ยว สอง และสามจะใกล้เคียงกับส่วนแรกโดยประมาณ และส่วนแบ่งการให้คะแนนที่ลดลงในการวัดนั้นอธิบายได้จากข้อเท็จจริงที่ว่าการให้คะแนนนั้นได้รับความถี่น้อยลง มีการวัดผล แต่ไม่มีการบันทึกข้อดีใดๆ
ฉันไม่สามารถอธิบายบล็อกนี้บวกเอฟเฟกต์ได้ แต่อย่างใดนั่นคือไม่ใช่เลย สำหรับข้อเสีย พฤติกรรม "บล็อก" ดังกล่าวดูเหมือนจะไม่เป็นเรื่องปกติ
ผู้ส่งความดีส่งข้อเสนอแนะเป็นชุด ๆ เปิดและปิดหรือไม่? อิอิอิ...
PS
หากใครต้องการวิเคราะห์โพสต์สถิติโดยใช้วิธีการขั้นสูงหรือตรวจสอบเลขคณิต ไฟล์ที่มีแหล่งข้อมูลอยู่ที่นี่:
ฉันไม่ยืนกรานที่จะสงสัย - บางทีฉันอาจจะผิด โดยเฉพาะอย่างยิ่งเมื่อสถิติดูเยือกเย็น ฉันหวังว่าความคิดเห็นจากนักสถิติมืออาชีพ นักจิตวิทยา และผู้ใช้ที่สนใจคนอื่นๆ จะช่วยชี้แจงความสับสนที่เกิดขึ้นได้
ขอบคุณสำหรับความสนใจของคุณ
ที่มา: will.com