Rezultati šestmesečnega dela projekta Repology, ki analizira informacije o različicah paketov

Minilo je še šest mesecev in projekt Repologija, ki zbira in primerja informacije o različicah paketov iz številnih skladišč, objavlja drugo poročilo. Cilj projekta je izboljšati interakcijo vzdrževalcev paketov iz različnih distribucij tako med seboj kot tudi z avtorji programske opreme - predvsem pomaga pri hitrem odkrivanju izdaj novih različic programske opreme, spremljanju ustreznosti paketov, poenotenju shem poimenovanja in različic. , posodabljajte metainformacije, delite popravke in rešitve težav ter izboljšajte prenosljivost programske opreme.

  • Število podprtih skladišč je preseglo 250. Dodana podpora za Cygwin, distri, Homebrew Casks, just-install, KISS Linux, Kwort, LuaRocks, Npackd, OS4Depot, RPM Sphere. Repozitorij Antergos, ki se je prenehal razvijati, je bil odstranjen. Podpora za GNU Guix je bila odstranjena (zaradi sprememb na spletnem mestu Guix, ki so onemogočile razčlenjevanje) in pozneje vrnjena (zahvaljujoč Guixu, ki je izvajal redne izpise metapodatkov v formatu JSON), in hkrati izboljšana.
  • Za repozitorije je bila uvedena zahteva, da poleg imena paketa in različice zagotovijo URL (domače strani ali povezavo do distribucije) - te informacije vam omogočajo zanesljivo razreševanje številnih sporov pri poimenovanju, s katerimi se srečuje projekt. Repozitoriji, trenutno ne zagotavlja takšni podatki so predvideni za izbris.
  • Glavni repozitorij izvorne kode projekta je razdeljen na dva dela (daemon za posodabljanje podatkov repozitorija in spletna aplikacija, ki zagotavlja delovanje spletnega mesta), dokončana je implementacija opomb tipa v kodi (vsa projektna koda zdaj izvaja mypy -strogo) in uskladitev s PEP8.
  • Dodana podpora za veje stare različice. Na primer, zdaj lahko Repology poroča, da je PostgreSQL 11.2 zastarel (ker je zadnja različica v 11. veji 11.5), tudi če je v skladišču novejša različica 12.0 (prej so bile vse različice pod najnovejšo v skladišču označene kot podedovane in ne more imeti zastarelega statusa). V zvezi s tem je bila večina projektov, ki so bili prej razdeljeni na glavne različice (na primer wxwidgets28/wxwidgets30), združenih.
  • Dodana zmožnost pravilne obdelave projektov z vzporednimi nezdružljivimi shemami različic. na primer FreeCAD v kateri 0.18.4 in 0.18.16146 ustrezata eni izdaji.
  • Predelano Seznam и posamezne strani vzdrževalci - zdaj se statistika vzdrževalcev zbira ločeno po repozitoriju. Praksa je pokazala, da je reprezentativna agregatna statistika nemogoča zaradi dejstva, da lahko paketi, medtem ko hranijo vzdrževalca v metapodatkih, migrirajo v druge repozitorije brez njegove vednosti in ga dejansko prikrajšajo za njegovo podporo (čeprav temu ni mogoče samodejno slediti). . Pozneje lahko postanejo zastareli in napačno bi bilo to dejstvo povezovati s prvotnim vzdrževalcem – ta situacija je povzročila nezadovoljstvo Vzdrževalci Gentoo zaradi prisotnosti Funtooja - v bistvu razcepa Gentooja, ki ga ne nadzirajo in ki shranjuje informacije o vzdrževalcih. Povezava statistike z repozitoriji je omogočila rešitev tega problema, hkrati pa so podatki o vzdrževalcih postali bolj podrobni in strukturirani.
  • Dodano eksperimentalno podporo nov tip značke, ki je matrika različic izbranih projektov v vseh repozitorijih. To orodje je uporabno na primer za pridobitev splošne predstave o statusu (razpoložljivost paketa, različica, njegova ustreznost in skladnost z danim minimumom) odvisnosti projekta (ali samo poljuben seznam projektov). Ta funkcija je bila zahtevana (in rabljeni) s projektom PostGIS.
  • Izboljšana podpora za strani projekta 404 - še posebej, če zahtevani projekt ne obstaja, vendar je bilo ime predhodno naletelo (na primer kot ime paketa, ki je bil dodeljen projektu z drugačnim imenom), potem je uporabnik ponudil možnosti za projekte, ki bi jih morda imel v mislih, na način "razločevalne strani» Wikipedia. Primer.
  • Izboljšana integracija z Wikidata — poleg izboljšav pri uvozu podatkov implementirano in lansirano bot, ki posodablja informacije o programski opremi v Wikidata z uporabo podatkov iz Repology. Naj spomnimo, da Wikidata postopoma postaja glavni vir strukturiranih informacij za Wikipedijo (v kontekstu novic - dejstva o programski opremi, kot so zgodovina različic, licenca, spletna stran, podprti OS, avtor, paketi v različnih distribucijah itd.), ki vam omogoča, da ohranjate relevantnost podatkov na enem mestu, namesto na desetine lokaliziranih različic vsake strani projekta. Na primer projektna kartica Nginx Wikipedia oddaja informacije samo iz Wikipodatkov.
  • V zadnjih šestih mesecih je bilo obdelanih več kot 500 zahtevkov (poročil) za dodajanje/spremembo pravil za bolj pravilno obdelavo posameznih projektov.

Ocena skladišča po skupnem številu paketov:

  • AUR (49462)
  • nix (48660)
  • Debian in izpeljanke (32972) (Raspbian vodi)
  • FreeBSD (26921)
  • Fedora (22337)

Ocena repozitorijev glede na število needinstvenih paketov (tj. paketov, ki so prisotni tudi v drugih distribucijah):

  • nix (41815)
  • Debian in izpeljanke (24284) (Raspbian vodi)
  • AUR (22176)
  • FreeBSD (21831)
  • Fedora (19215)

Ocena skladišča po številu svežih paketov:

  • nix (23210)
  • Debian in izpeljanke (16107) (Raspbian vodi)
  • FreeBSD (16095)
  • Fedora (13109)
  • AUR (12417)

Ocena skladišča glede na odstotek svežih paketov (samo za repozitorije s 1000 ali več paketi in brez štetja zbirk modulov v zgornjem toku, kot so CPAN, Hackage, PyPi):

  • Ravenports (99.16%)
  • Arch in derivati ​​(85.23%)
  • Homebrew (84.57%)
  • nix (84.55%)
  • zajemalka (84.02%)

Splošna statistika:

  • 252 skladišč
  • 180 tisoč projektov
  • 2.3 milijona posameznih paketov
  • 36 tisoč vzdrževalcev
  • 153 tisoč zabeleženih objav v zadnjih šestih mesecih (zadnji pregled je vseboval napako; 150 tisoč objav je bilo zabeleženih v zadnjih šestih mesecih)
  • 9.5 % znanih projektov je v zadnjih šestih mesecih izdalo vsaj eno novo različico

Vir: opennet.ru

Dodaj komentar