Εάν ο αριθμός των σχολίων σε ένα άρθρο πλησιάζει γρήγορα τα 1000, να είστε βέβαιοι ότι ανεξάρτητα από το θέμα που αναφέρει ο συγγραφέας, μέσα μαίνεται ένας καβγάς: σημεία ανάφλεξης της πολιτικής, περιτριγυρισμένα από ειδικούς σε πολυθρόνα για όλα τα θέματα, ψυχιατρικές διαγνώσεις εξ αποστάσεως με άβαταρ και παρατσούκλι, να πάρεις προσωπικές, σαρκαστικές επιθέσεις, η καυστικότητα των οποίων ξεπερνά το αίμα των ξενομόρφων, και, φυσικά, το υποχρεωτικό πιάτο σε τέτοιες περιπτώσεις είναι αμοιβαίες κατηγορίες που ο ομόλογός σου συζητά μαζί σου αποκλειστικά για αμοιβή ή λόγω καθήκοντος. Το οποίο, προφανώς, είναι επικίνδυνο και δύσκολο, και με την πρώτη ματιά φαίνεται να μην φαίνεται, και τριάντα ασήμι δεν βρίσκονται στο δρόμο.
Το αστείο με αυτή την κατάσταση είναι ότι
Ας πάρουμε ένα από τα
Ένας πραγματικός άνθρωπος δεν θα μπορεί να αντιτάξει τίποτα σε έναν επαγγελματία σχολιαστή σε μια συνδρομή...
Ο χρήστης (έτσι) ξοδεύει εξωπραγματικό χρόνο σε σχόλια...
Επιπλέον, η δραστηριότητά του δεν έχει μοτίβα που είναι συνήθως χαρακτηριστικά ενός απλού χρήστη....ps αλλά αυτό μου έδωσε την ιδέα να γράψω έναν αναλυτή-ανάλυση για τέτοιους σχολιαστές) Με ένδειξη δραστηριότητας ανά ώρα, χρόνο ανά ημέρα, ανά εβδομάδα κλπ... Ένα καλό θέμα για άρθρο)
Εντάξει, σταμάτα. Και τι είδους μοτίβα είναι «συνήθως εγγενή στον μέσο χρήστη»; Ο συγγραφέας αυτής της φράσης σε αυτό το νήμα, δυστυχώς, έχει ήδη μεταγραφεί, επομένως θα πρέπει να πάτε τυχαία.
Το ερώτημα που θέλω να θέσω μπροστά στα καθαρά σας μάτια είναι το εξής: είναι ακόμη δυνατό, χρησιμοποιώντας στατιστικές μεθόδους, να προσδιορίσετε τουλάχιστον με αξιοπιστία αυτά τα ίδια μοτίβα, ώστε να δημιουργηθεί ένας επίσημος ταξινομητής που να διακρίνει τους περιστασιακούς από τους επαγγελματίες σχολιαστές; Φανταστείτε - "σύμφωνα με το Habra-botometer, είναι 76% πιθανό να είστε Kremlinbot." Αυτό θα είναι πολύ πιο δροσερό από τις καρμικές επιδρομές μεταξύ τους.
Δυστυχώς, οι αρμοδιότητές μου δεν είναι αρκετές για να προτείνω καν ποια κατεύθυνση να σκάψω για να λύσω ένα τέτοιο πρόβλημα. Ωστόσο, χθες το βράδυ χάκαρα μαζί έναν μικρό πρωτόγονο αναλυτή, ο οποίος (ευτυχώς οι σελίδες με σχόλια είναι ανοιχτές ακόμα και σε μη εξουσιοδοτημένους επισκέπτες) μέχρι στιγμής κάνει δύο πράγματα - α) συλλέγει στατιστικά στοιχεία από ένα δεδομένο όνομα χρήστη όλων των σχολίων του (προς το παρόν μόνο time-stamp ) και το προσθέτει στη βάση δεδομένων MySQL. β) σχεδιάζει ένα διάγραμμα χρόνου, σημειώνοντας πάνω του τα γεγονότα αποστολής σχολίων που λαμβάνονται από αυτή τη βάση δεδομένων. Ακόμη και χωρίς καμία περίπλοκη ανάλυση, αποδείχτηκε αρκετά αστείο. Αυτό είναι το γράφημα των σχολίων μου. Οι εξηγήσεις είναι παρακάτω. Είναι καλύτερο να το προβάλετε σε ξεχωριστό παράθυρο σε κλίμακα 100% ή περισσότερο.
Ο οριζόντιος άξονας είναι ο χρόνος, κάθε εικονοστοιχείο είναι ίσο με ένα λεπτό, η τιμή των γκρίζων διαιρέσεων είναι ίση με μία ώρα, ολόκληρη η οριζόντια γραμμή είναι ίση με μία ημέρα. Οι ημέρες πηγαίνουν από κάτω προς τα πάνω κατά μήκος του κατακόρυφου άξονα, η τιμή διαίρεσης σε αυτόν είναι 365 ημέρες.
Δεν υπάρχει τίποτα ιδιαίτερα ενδιαφέρον στο διάγραμμα μου. Μπορεί να φανεί ότι μου αρέσει να κοιμάμαι 7-8 ώρες, συχνά πηγαίνω για ύπνο μετά τα μεσάνυχτα και μερικές φορές έχω μαραθώνιους σχολιασμού πολλών ωρών και ότι η δραστηριότητα τον περασμένο χρόνο είναι μεγαλύτερη ή περίπου ίση με εκείνη των προηγούμενων πέντε ετών .
Ή εδώ είναι ένας σύντροφος
Το διάγραμμα δραστηριότητας ενός τυπικού habracommentator μοιάζει κάπως έτσι (αυτό είναι
Ένα ευδιάκριτο «sleepy hollow» στα αριστερά κάπου στην ευρωπαϊκή νύχτα και χαλαρό σχόλιο κατά τη διάρκεια της ημέρας, ίσως με διαλείμματα για μισό χρόνο.
Αλλά δεν είναι όλα τα διαγράμματα τόσο βαρετά! Τι λέτε για αυτό, για παράδειγμα:
Σε λίγο περισσότερο από δύο χρόνια, ο συνάδελφός μας προφανώς επανεκπαίδευσε τους βιορυθμούς του για να κοιμάται από την ευρωπαϊκή νύχτα κάπου κάτω από την κορυφογραμμή του Μεσοατλαντικού, ομοιόμορφα και σταδιακά, και μετά πέρασε άλλα δύο χρόνια για να επιστρέψει στις ακτές της Πορτογαλίας. Περπάτησες; Ζάλη? Δεν μπορώ να βρω εύλογες εξηγήσεις... Τις πρώτες τρεις ώρες που είμαι ξύπνιος, τα σχόλια πετάνε σαν πολυβόλο, αλλά στο τέλος της ημέρας είναι έτσι, μια φορά κάθε ώρα κοιτάζω μέσα να δω τι συμβαίνει εκεί και τέλος.
Παρεμπιπτόντως, ήταν
Και εδώ είναι ένας άλλος γρίφος:
Ο συνάδελφος άντεξε τεσσεράμισι χρόνια χωρίς ούτε ένα σχόλιο - προφανώς εκπαιδευόταν κάπου σε μυστικά μοναστήρια για το πώς να μένει ξύπνιος για μέρες, αν κρίνουμε από το πόσα σχόλια δημοσιεύτηκαν στο "sleepy hollow".
Αλλά το πιο ενδιαφέρον εδώ είναι η ανωμαλία στη 16η ώρα, η οποία διαρκεί για περισσότερα από τρία χρόνια και σταδιακά εξαφανίζεται τον τελευταίο χρόνο. Διάλειμμα για τσιγάρο? Βγάζοντας βόλτα τον σκύλο? Τζόκινγκ; Τι άλλο μπορεί να αποσπάσει έναν κάτοικο του Khabrov από τα σχόλια που τροφοδοτούνται εν μέσω μιας εργάσιμης ημέρας με τόσο καθημερινό προκαθορισμό; Είμαι χυδαίος και τεμπέλης, δεν μπορώ να φανταστώ το είδος της αυτοπειθαρχίας που έχει ο σεβαστός
Τέλος, ένα τελευταίο διάγραμμα για να σκεφτείτε:
Δεν υπάρχει καθόλου σαφώς καθορισμένο "sleepy hollow" σε αυτό. Μόνο κάποιος μπορεί μετά βίας να διακρίνει την ορατή υπέρβαση στον αριθμό των σχολίων που αποστέλλονται μετά το μεσημέρι σε σχέση με αυτά που στάλθηκαν πριν.
Με όλη την αυστηρότητα της Komsomol προτρέπω τους σεβαστούς
Και τέλος, μια ύπουλη ερώτηση - θα μπορούσε κάποιος να ενδιαφέρεται τόσο πολύ για όλα αυτά που να θέλει να αναπτύξει τον κώδικα ανάλυσης ή να αποκτήσει μια απόθεση βάσης δεδομένων ή πρόσβαση σε αυτόν, και ούτω καθεξής; Οι γνώσεις μου για τις μεθόδους εξόρυξης δεδομένων και οπτικοποίησης δεδομένων δύσκολα ξεπερνούν τη γενική γνώση. Δεν μπορώ να σκεφτώ κάτι πιο έξυπνο και πιο ενδιαφέρον από αυτά τα απλά διαγράμματα. Όποιος ενδιαφέρεται ας μου γράψει σε τηλεγράφημα (ψευδώνυμο στο προφίλ).
Спасибо за внимание!
UPD. Το δημοσίευσε
Πηγή: www.habr.com