Thành phố chìm vào giấc ngủ, người dân Khabrovsk thức giấc

Nếu số lượng bình luận dưới một bài viết nhanh chóng lên tới con số 1000, hãy yên tâm rằng bất kể chủ đề được tác giả nêu ra là gì, bên trong vẫn đang diễn ra một cuộc tranh cãi: những điểm sáng của chính trị, xung quanh là các chuyên gia ngồi ghế bành về mọi vấn đề, chẩn đoán tâm thần từ xa bằng avatar và biệt danh, nhận những cuộc tấn công cá nhân, mỉa mai, tính ăn da của nó vượt xa máu của xenomorph, và tất nhiên, món ăn bắt buộc trong những trường hợp như vậy là cáo buộc lẫn nhau rằng đối tác của bạn đang thảo luận với bạn chỉ vì thù lao hoặc vì nghĩa vụ. Điều này rõ ràng là nguy hiểm và khó khăn, thoạt nhìn tưởng chừng như không thể nhìn thấy, ba mươi đồng bạc cũng không nằm trên đường.

Điều buồn cười trong tình huống này làrằng mọi người bị ảnh hưởng sâu sắc bởi hội chứng trên-internet-ai-sai, thường dành rất nhiều thời gian và tâm trí để hoàn toàn miễn phí chứng minh cho một người khác cũng ngạc nhiên không kém rằng anh ta cũng đang làm điều tương tự bằng tiền hoặc theo đơn đặt hàng. Bạn đang tìm kiếm logic ở đây? Cô ấy đi rồi. Đó là internet, em yêu.

Chúng ta hãy lấy một trong tương đối mới mẻ về cáo buộc phân biệt đối xử lãnh thổ trên Gitlab. Đã 4 ngày trôi qua kể từ khi bài báo được xuất bản và tất nhiên, cuộc thảo luận đã rời xa chủ đề đã nêu ban đầu từ lâu. Các cụm từ sau đây vang lên:

Một người thực sự sẽ không thể phản đối bất cứ điều gì đối với một nhà bình luận chuyên nghiệp trên một thuê bao...

Người dùng (tương tự) dành một lượng thời gian không thực tế cho các nhận xét...
Hơn nữa, hoạt động của nó không có các mẫu thường đặc trưng của người dùng thông thường....

ps nhưng điều này đã cho tôi ý tưởng viết một trình phân tích cú pháp cho những người bình luận như vậy) Với dấu hiệu hoạt động theo giờ, lượng thời gian mỗi ngày, mỗi tuần, v.v... Một chủ đề hay cho một bài viết)

Được rồi, dừng lại. Những kiểu mẫu nào “thường dành cho người dùng bình thường”? Rất tiếc, tác giả của cụm từ này trong chủ đề đó đã được phiên âm lại nên bạn sẽ phải ghi ngẫu nhiên.

Câu hỏi mà tôi muốn đặt ra trước mắt các bạn là: liệu có thể sử dụng các phương pháp thống kê để xác định ít nhất một cách đáng tin cậy các mẫu tương tự này để tạo ra một bộ phân loại chính thức giúp phân biệt các nhà bình luận thông thường với các nhà bình luận chuyên nghiệp không? Hãy tưởng tượng - “theo Habra-botometer, 76% bạn có khả năng là một Kremlinbot.” Điều này sẽ mát mẻ hơn nhiều so với việc nghiệp chướng tấn công lẫn nhau.
Thật không may, năng lực của tôi không đủ để đề xuất nên tìm hướng đi nào để giải quyết một vấn đề như vậy. Tuy nhiên, đêm qua tôi đã hack cùng một trình phân tích cú pháp nguyên thủy nhỏ, (may mắn thay, các trang có nhận xét được mở ngay cả đối với những khách truy cập trái phép) cho đến nay thực hiện được hai việc - a) thu thập số liệu thống kê từ tên người dùng nhất định của tất cả các nhận xét của anh ấy (hiện tại chỉ là time -stamp ) và thêm nó vào cơ sở dữ liệu MySQL; b) vẽ sơ đồ thời gian, đánh dấu trên đó các sự kiện gửi nhận xét được lấy từ cơ sở dữ liệu này. Ngay cả khi không có bất kỳ phân tích phức tạp nào, nó vẫn trở nên khá buồn cười. Đây là biểu đồ nhận xét của tôi trông như thế nào. Giải thích dưới đây. Tốt nhất là xem nó trong một cửa sổ riêng ở tỷ lệ 100% trở lên.

Thành phố chìm vào giấc ngủ, người dân Khabrovsk thức giấc

Trục ngang là thời gian, mỗi pixel bằng một phút, giá trị của các vạch chia màu xám bằng một giờ, toàn bộ đường ngang bằng một ngày. Ngày đi từ dưới lên trên theo trục tung, giá trị chia trên đó là 365 ngày.

Không có gì đặc biệt thú vị trong sơ đồ của tôi. Có thể thấy, tôi thích ngủ 7-8 tiếng, thường đi ngủ sau nửa đêm và đôi khi có những cuộc chạy marathon bình luận kéo dài hàng giờ đồng hồ và hoạt động đó trong năm qua lớn hơn hoặc xấp xỉ so với XNUMX năm trước đó. .
Hoặc đây là đồng chí con tắc kè Tôi đã giữ lời thề im lặng trong ba năm rưỡi, và rồi nó đột phá...

Thành phố chìm vào giấc ngủ, người dân Khabrovsk thức giấc

Sơ đồ hoạt động của một người bình luận habra điển hình trông giống như thế này (đây là QtRoS)

Thành phố chìm vào giấc ngủ, người dân Khabrovsk thức giấc

Một “khoảng trống buồn ngủ” riêng biệt ở bên trái đâu đó trong đêm châu Âu và bình luận nhàn nhã vào ban ngày, có lẽ có thời gian nghỉ trong nửa năm.

Nhưng không phải tất cả các sơ đồ đều nhàm chán như vậy! Thế còn điều này thì sao, ví dụ:

Thành phố chìm vào giấc ngủ, người dân Khabrovsk thức giấc

Chỉ trong hơn hai năm, đồng nghiệp của chúng tôi dường như đã điều chỉnh lại nhịp sinh học của mình để ngủ từ đêm châu Âu ở đâu đó dưới Dãy núi Trung Đại Tây Dương, đều đặn và dần dần, rồi mất thêm hai năm nữa để quay trở lại bờ biển Bồ Đào Nha. Bạn đã đi bộ à? Bơi? Tôi không thể đưa ra những lời giải thích hợp lý... Trong ba giờ đầu tiên khi thức dậy, bình luận bay như súng máy, nhưng cuối ngày thì như vậy, cứ một giờ tôi lại nhìn vào xem chuyện gì đang xảy ra đó và thế là xong.

Nhân tiện, đó là 0xd34df00d.

Và đây là một câu đố khác:

Thành phố chìm vào giấc ngủ, người dân Khabrovsk thức giấc

Người đồng nghiệp này đã không đưa ra một bình luận nào trong bốn năm rưỡi - rõ ràng là anh ta đang được đào tạo ở đâu đó trong các tu viện bí mật về cách giữ tỉnh táo trong nhiều ngày, dựa trên số lượng bình luận được đăng trong "buồn ngủ".

Nhưng điều thú vị nhất ở đây là hiện tượng dị thường ở giờ thứ 16, kéo dài hơn ba năm và mất dần vào năm ngoái. Phá khói? Dắt chó đi dạo? Chạy bộ? Điều gì khác có thể khiến một cư dân Khabrov rời xa nguồn bình luận giữa một ngày làm việc với những định kiến ​​hàng ngày như vậy? Tôi là một người lười biếng và lười biếng, tôi không thể tưởng tượng được kiểu kỷ luật tự giác mà mọi người tôn trọng khim.

Cuối cùng, một sơ đồ cuối cùng để suy nghĩ:

Thành phố chìm vào giấc ngủ, người dân Khabrovsk thức giấc

Không có "khoảng trống buồn ngủ" được xác định rõ ràng trên đó. Chỉ một người hầu như không thể nhận ra sự dư thừa rõ ràng về số lượng bình luận được gửi sau buổi trưa so với những bình luận được gửi trước đó.

Với tất cả sự nghiêm khắc của Komsomol, tôi kêu gọi những người đáng kính MTyrz hãy tự tước vũ khí trước bữa tiệc và thành thật thừa nhận có bao nhiêu ông bà, cháu gái, bọ và chuột cai trị tài khoản của bạn và viết bình luận.

Và cuối cùng, một câu hỏi thâm hiểm - liệu ai đó có thể quan tâm đến tất cả những điều này đến mức họ muốn phát triển mã trình phân tích cú pháp hoặc lấy kết xuất cơ sở dữ liệu hoặc quyền truy cập vào nó, v.v.? Kiến thức của riêng tôi về phương pháp khai thác dữ liệu và trực quan hóa dữ liệu hầu như không vượt quá mức độ hiểu biết chung. Tôi khó có thể nghĩ ra điều gì thông minh và thú vị hơn những sơ đồ đơn giản này. Nếu ai quan tâm thì viết thư cho tôi bằng telegram (biệt danh trong hồ sơ).

Cảm ơn bạn!

CẬP NHẬT. Đã đăng nó nguồn trên GitHub.

Nguồn: www.habr.com

Thêm một lời nhận xét