ProHoster > Blog > internetové zprávy > Výsledky šestiměsíční práce projektu Repology, který analyzuje informace o verzích balíčků
Výsledky šestiměsíční práce projektu Repology, který analyzuje informace o verzích balíčků
Uplynulo dalších šest měsíců a projekt Repologie, která shromažďuje a porovnává informace o verzích balíčků z mnoha úložišť, publikuje další zprávu. Cílem projektu je zlepšit interakci správců balíčků z různých distribucí jak mezi nimi samotnými, tak s autory softwaru – projekt pomáhá zejména rychle detekovat vydání nových verzí softwaru, sledovat relevanci balíčků, sjednotit schémata pojmenování a verzování , udržovat metainformace aktuální, sdílet záplaty a řešení problémů a zlepšovat přenositelnost softwaru.
Počet podporovaných repozitářů přesáhl 250. Přidána podpora pro Cygwin, distri, Homebrew Casks, just-install, KISS Linux, Kwort, LuaRocks, Npackd, OS4Depot, RPM Sphere. Úložiště Antergos, jehož vývoj se zastavil, bylo odstraněno. Podpora pro GNU Guix byla odstraněna (kvůli změnám na webu Guix, které znemožňovaly analýzu) a později vrácena (díky Guixu implementujícímu pravidelné výpisy metadat ve formátu JSON) a zároveň vylepšena.
Pro repozitáře byl zaveden požadavek, aby kromě názvu a verze balíčku uváděly URL (domovské stránky nebo odkaz na distribuci) – tato informace umožňuje spolehlivě vyřešit četné konflikty názvů, na které projekt narazí. V současné době úložiště neposkytování takové informace jsou naplánovány k vymazání.
Hlavní úložiště zdrojového kódu projektu je rozděleno na dvě (démon pro aktualizaci dat úložiště a webová aplikace zajišťující chod webu), byla dokončena implementace typových anotací do kódu (veškerý kód projektu nyní běží mypy -striktní) a sladění s PEP8.
Přidána podpora pro větve starších verzí. Například nyní Repology může hlásit, že PostgreSQL 11.2 je zastaralý (protože nejnovější verze v 11. větvi je 11.5), i když je v úložišti novější verze 12.0 (dříve byly všechny verze pod nejnovější v úložišti označeny jako starší a nemohl mít stav zastaralý). V tomto ohledu byla sloučena většina projektů dříve rozdělených do hlavních verzí (například wxwidgets28/wxwidgets30).
Přidána možnost správně zpracovávat projekty s paralelními nekompatibilními schématy verzování. Například, FreeCAD ve kterém 0.18.4 a 0.18.16146 odpovídají jednomu vydání.
Přepracováno seznam и jednotlivé stránky správci - nyní jsou statistiky správců shromažďovány odděleně podle úložiště. Praxe ukázala, že reprezentativní agregované statistiky jsou nemožné kvůli skutečnosti, že balíčky, když jsou správce uloženy v metadatech, mohou migrovat do jiných úložišť bez jeho vědomí a ve skutečnosti ho připravit o jeho podporu (i když to není možné automaticky sledovat) . Později mohou být zastaralé a bylo by nesprávné spojovat tuto skutečnost s původním správcem - tato situace způsobila nespokojenost Správci Gentoo kvůli přítomnosti Funtoo - v podstatě jimi nekontrolovaný fork Gentoo, který uchovává informace o správcích. Propojení statistik s repozitáři umožnilo tento problém vyřešit a zároveň se informace o správcích staly podrobnějšími a strukturovanějšími.
Přidáno experimentální podpora nový typ odznaku, který je maticí verzí vybraných projektů ve všech úložištích. Tento nástroj je užitečný například pro získání obecné představy o stavu (dostupnost balíčku, verze, jeho relevance a soulad s daným minimem) závislostí projektu (nebo jen libovolného seznamu projektů). Tato funkce byla požadována (a použitý) projektem PostGIS.
Vylepšená podpora pro 404 stránek projektu – zejména pokud požadovaný projekt neexistuje, ale název byl dříve nalezen (například jako název balíčku, který byl přiřazen k projektu s jiným názvem), pak je uživatel nabídl možnosti pro projekty, které by mohl mít na mysli, způsobem „jednoznačné stránky» Wikipedie. příklad.
Vylepšená integrace s Wikidata — kromě zlepšení v importu údajů implementováno a spuštěno bot, která aktualizuje informace o softwaru ve Wikidatech pomocí dat z Repology. Připomeňme, že Wikidata se postupně stávají hlavním zdrojem strukturovaných informací pro Wikipedii (v kontextu novinek – fakta o softwaru, jako je historie verzí, licence, web, podporovaný OS, autor, balíčky v různých distribucích atd.), což vám umožňuje udržovat relevanci dat na jednom místě namísto desítek lokalizovaných verzí každé stránky projektu. Například karta projektu Nginx Wikipedie vysílá informace pouze z Wikidat.
Za posledních šest měsíců bylo zpracováno více než 500 požadavků (reportů) na přidání/změnu pravidel pro korektnější zpracování jednotlivých projektů.
Hodnocení úložiště podle procenta nových balíčků (pouze pro úložiště s 1000 nebo více balíčky a nepočítaje upstream kolekce modulů, jako je CPAN, Hackage, PyPi):
Ravenports (99.16 %)
Arch a deriváty (85.23 %)
Homebrew (84.57 %)
nix (84.55 %)
Kopeček (84.02 %)
Obecné statistiky:
252 úložišť
180 tisíc projektů
2.3 milionu jednotlivých balíčků
36 tisíc správců
153 tisíc zaznamenaných vydání za posledních šest měsíců (poslední kontrola obsahovala chybu; 150 tisíc vydání bylo zaznamenáno za posledních šest měsíců)
9.5 % známých projektů vydalo za posledních šest měsíců alespoň jednu novou verzi