Naukowcy z Carnegie Mellon University, North Carolina State University i Socket opracowali narzędzie umożliwiające identyfikację projektów z zawyżonymi ocenami w serwisie GitHub. Narzędzie wykryło 3.1 miliona fałszywych gwiazd w 15835 278 repozytoriach. Do promocji wykorzystano XNUMX tysięcy kont.
Proces dodawania fałszywych gwiazdek został wprowadzony do strumienia i był głównie wykorzystywany do zwiększenia poziomu zaufania do repozytoriów dystrybuujących złośliwy kod pod przykrywką pirackich kopii programów komercyjnych, botów kryptowalutowych i oszustw w grach. Oszukiwanie gwiazdek było również wykorzystywane do promowania produktów, samopotwierdzania się programistów, umniejszania konkurencji i zwiększania znaczenia w oczach użytkowników. Podano przykłady 7 komercyjnych usług oszustw, których koszt pracy waha się od 0.10 do 1.62 USD za gwiazdkę.
W ramach badania przetworzono 6 miliardów zdarzeń odzwierciedlonych w 20-terabajtowym archiwum aktywności w serwisie GitHub, monitorowanym przez projekt GHArchive. Analizowano zdarzenia pod kątem anomalii, takich jak synchroniczne przyznawanie ocen gwiazdkami grupom projektów, nagłe wzrosty ocen dla nieaktywnych projektów i stronniczość w aktywności użytkowników mająca na celu promowanie. Zestaw narzędzi StarScout, który wykorzystuje analizę skupień i wykrywanie typowych powtarzających się wzorców zachowań mających związek z oszustwami, jest udostępniany na licencji Apache 2.0.
Narzędzie wykryło nieprawidłowości w wyglądzie 4.53 mln gwiazdek w serwisie GitHub, przypisanych do 1.32 mln kont i obejmujących 22915 XNUMX repozytoriów. Aby wyeliminować wyniki fałszywie pozytywne, przeprowadzono dodatkowe filtrowanie wyników, w wyniku którego pozostawiono tylko wyraźne serie ocen gwiazdkowych i repozytoria z wysokim odsetkiem podejrzanych gwiazdek.
W rezultacie zidentyfikowano 278 tysięcy kont z typowymi, powtarzającymi się wzorcami zachowań sprzyjających oszukiwaniu. Konta te posłużyły do przyznania 3.1 miliona gwiazdek 15835 90.75 repozytoriom. Do października 61.95 r. GitHub usunęło 2024% oflagowanych repozytoriów i XNUMX% kont.




Źródło: opennet.ru
