Výsledky šestiměsíční práce projektu Repology, který analyzuje informace o verzích balíčků

Uplynulo dalších šest měsíců a projekt Repologie, která shromažďuje a porovnává informace o verzích balíčků z mnoha úložišť, publikuje další zprávu. Cílem projektu je zlepšit interakci správců balíčků z různých distribucí jak mezi nimi samotnými, tak s autory softwaru – projekt pomáhá zejména rychle detekovat vydání nových verzí softwaru, sledovat relevanci balíčků, sjednotit schémata pojmenování a verzování , udržovat metainformace aktuální, sdílet záplaty a řešení problémů a zlepšovat přenositelnost softwaru.

  • Počet podporovaných repozitářů přesáhl 250. Přidána podpora pro Cygwin, distri, Homebrew Casks, just-install, KISS Linux, Kwort, LuaRocks, Npackd, OS4Depot, RPM Sphere. Úložiště Antergos, jehož vývoj se zastavil, bylo odstraněno. Podpora pro GNU Guix byla odstraněna (kvůli změnám na webu Guix, které znemožňovaly analýzu) a později vrácena (díky Guixu implementujícímu pravidelné výpisy metadat ve formátu JSON) a zároveň vylepšena.
  • Pro repozitáře byl zaveden požadavek, aby kromě názvu a verze balíčku uváděly URL (domovské stránky nebo odkaz na distribuci) – tato informace umožňuje spolehlivě vyřešit četné konflikty názvů, na které projekt narazí. V současné době úložiště neposkytování takové informace jsou naplánovány k vymazání.
  • Hlavní úložiště zdrojového kódu projektu je rozděleno na dvě (démon pro aktualizaci dat úložiště a webová aplikace zajišťující chod webu), byla dokončena implementace typových anotací do kódu (veškerý kód projektu nyní běží mypy -striktní) a sladění s PEP8.
  • Přidána podpora pro větve starších verzí. Například nyní Repology může hlásit, že PostgreSQL 11.2 je zastaralý (protože nejnovější verze v 11. větvi je 11.5), i když je v úložišti novější verze 12.0 (dříve byly všechny verze pod nejnovější v úložišti označeny jako starší a nemohl mít stav zastaralý). V tomto ohledu byla sloučena většina projektů dříve rozdělených do hlavních verzí (například wxwidgets28/wxwidgets30).
  • Přidána možnost správně zpracovávat projekty s paralelními nekompatibilními schématy verzování. Například, FreeCAD ve kterém 0.18.4 a 0.18.16146 odpovídají jednomu vydání.
  • Přepracováno seznam и jednotlivé stránky správci - nyní jsou statistiky správců shromažďovány odděleně podle úložiště. Praxe ukázala, že reprezentativní agregované statistiky jsou nemožné kvůli skutečnosti, že balíčky, když jsou správce uloženy v metadatech, mohou migrovat do jiných úložišť bez jeho vědomí a ve skutečnosti ho připravit o jeho podporu (i když to není možné automaticky sledovat) . Později mohou být zastaralé a bylo by nesprávné spojovat tuto skutečnost s původním správcem - tato situace způsobila nespokojenost Správci Gentoo kvůli přítomnosti Funtoo - v podstatě jimi nekontrolovaný fork Gentoo, který uchovává informace o správcích. Propojení statistik s repozitáři umožnilo tento problém vyřešit a zároveň se informace o správcích staly podrobnějšími a strukturovanějšími.
  • Přidáno experimentální podpora nový typ odznaku, který je maticí verzí vybraných projektů ve všech úložištích. Tento nástroj je užitečný například pro získání obecné představy o stavu (dostupnost balíčku, verze, jeho relevance a soulad s daným minimem) závislostí projektu (nebo jen libovolného seznamu projektů). Tato funkce byla požadována (a použitý) projektem PostGIS.
  • Vylepšená podpora pro 404 stránek projektu – zejména pokud požadovaný projekt neexistuje, ale název byl dříve nalezen (například jako název balíčku, který byl přiřazen k projektu s jiným názvem), pak je uživatel nabídl možnosti pro projekty, které by mohl mít na mysli, způsobem „jednoznačné stránky» Wikipedie. příklad.
  • Vylepšená integrace s Wikidata — kromě zlepšení v importu údajů implementováno a spuštěno bot, která aktualizuje informace o softwaru ve Wikidatech pomocí dat z Repology. Připomeňme, že Wikidata se postupně stávají hlavním zdrojem strukturovaných informací pro Wikipedii (v kontextu novinek – fakta o softwaru, jako je historie verzí, licence, web, podporovaný OS, autor, balíčky v různých distribucích atd.), což vám umožňuje udržovat relevanci dat na jednom místě namísto desítek lokalizovaných verzí každé stránky projektu. Například karta projektu Nginx Wikipedie vysílá informace pouze z Wikidat.
  • Za posledních šest měsíců bylo zpracováno více než 500 požadavků (reportů) na přidání/změnu pravidel pro korektnější zpracování jednotlivých projektů.

Hodnocení úložiště podle celkového počtu balíků:

  • AUR (49462)
  • nix (48660)
  • Debian a deriváty (32972) (vedoucí Raspbian)
  • FreeBSD (26921)
  • Fedora (22337)

Hodnocení repozitářů podle počtu nejedinečných balíčků (tj. balíčků, které jsou přítomny i v jiných distribucích):

  • nix (41815)
  • Debian a deriváty (24284) (vedoucí Raspbian)
  • AUR (22176)
  • FreeBSD (21831)
  • Fedora (19215)

Hodnocení úložiště podle počtu čerstvých balení:

  • nix (23210)
  • Debian a deriváty (16107) (vedoucí Raspbian)
  • FreeBSD (16095)
  • Fedora (13109)
  • AUR (12417)

Hodnocení úložiště podle procenta nových balíčků (pouze pro úložiště s 1000 nebo více balíčky a nepočítaje upstream kolekce modulů, jako je CPAN, Hackage, PyPi):

  • Ravenports (99.16 %)
  • Arch a deriváty (85.23 %)
  • Homebrew (84.57 %)
  • nix (84.55 %)
  • Kopeček (84.02 %)

Obecné statistiky:

  • 252 úložišť
  • 180 tisíc projektů
  • 2.3 milionu jednotlivých balíčků
  • 36 tisíc správců
  • 153 tisíc zaznamenaných vydání za posledních šest měsíců (poslední kontrola obsahovala chybu; 150 tisíc vydání bylo zaznamenáno za posledních šest měsíců)
  • 9.5 % známých projektů vydalo za posledních šest měsíců alespoň jednu novou verzi

Zdroj: opennet.ru

Přidat komentář