Pakettiversioita koskevia tietoja analysoivan Repology-projektin kuuden kuukauden työn tulokset

Toiset kuusi kuukautta on kulunut ja projekti Repologia, joka kerää ja vertaa tietoja pakettiversioista useista arkistoista, julkaisee toisen raportin. Projektin tavoitteena on parantaa eri jakeluista tulevien pakettien ylläpitäjien vuorovaikutusta sekä keskenään että ohjelmistojen tekijöiden kanssa - erityisesti projekti auttaa tunnistamaan nopeasti uusien ohjelmistoversioiden julkaisut, seuraamaan pakettien relevanssia, yhtenäistämään nimeämis- ja versiointimalleja. , pitää metatiedot ajan tasalla, jakaa korjaustiedostoja ja ratkaisuja ongelmiin ja parantaa ohjelmistojen siirrettävyyttä.

  • Tuettujen arkistojen määrä on ylittänyt 250. Lisätty tuki Cygwinille, distrille, Homebrew Casksille, juuri asennus, KISS Linuxille, Kwortille, LuaRocksille, Npackdille, OS4Depotille, RPM Spherelle. Antergos-arkisto, joka on lopettanut kehityksen, on poistettu. GNU Guixin tuki poistettiin (Guix-verkkosivustolla tehtyjen muutosten vuoksi, jotka tekivät jäsentämisen mahdottomaksi) ja palautettiin myöhemmin (kiitos, että Guix toteutti tavallisia metatietovedoksia JSON-muodossa), ja samalla parannettiin.
  • Arkistoissa on paketin nimen ja version lisäksi vaatimus antaa URL-osoite (kotisivuille tai linkki jakeluun) - näiden tietojen avulla voit luotettavasti ratkaista lukuisia projektin kohtaamia nimeämisristiriitoja. Arkistot, tällä hetkellä ei tarjoa tällaiset tiedot on tarkoitus poistaa.
  • Projektin lähdekoodin päävarasto on jaettu kahteen osaan (arkistotietojen päivittämiseen tarkoitettu demoni ja sivuston toiminnan varmistava web-sovellus), tyyppimerkintöjen käyttöönotto koodissa on saatu päätökseen (kaikki projektikoodit pyörivät nyt mypy -tiukka) ja linjaus PEP8:n kanssa.
  • Lisätty tuki vanhoille versioille. Esimerkiksi nyt Repology voi ilmoittaa, että PostgreSQL 11.2 on vanhentunut (koska viimeisin versio 11. haarassa on 11.5), vaikka arkistossa olisi uudempi versio 12.0 (aiemmin kaikki arkiston viimeisintä alemmat versiot on merkitty vanhoiksi eikä sillä voinut olla vanhentunutta tilaa ). Tässä suhteessa suurin osa aiemmin suuriin versioihin jaetuista projekteista (esimerkiksi wxwidgets28/wxwidgets30) yhdistettiin.
  • Lisätty mahdollisuus käsitellä oikein projekteja rinnakkaisten yhteensopimattomien versiointimenetelmien kanssa. Esimerkiksi, FreeCAD jossa 0.18.4 ja 0.18.16146 vastaavat yhtä julkaisua.
  • Uudelleentyöstetty lista и yksittäisiä sivuja ylläpitäjät - nyt ylläpitäjien tilastot kerätään erikseen arkiston mukaan. Käytäntö on osoittanut, että edustavien aggregaattitilastojen laatiminen on mahdotonta, koska paketit säilyttävät ylläpitäjän metatiedoissa voivat siirtyä muihin arkistoihin hänen tietämättään ja riistävät häneltä itse asiassa tuen (vaikka tätä ei ole mahdollista seurata automaattisesti). . Myöhemmin ne voivat vanhentua, ja olisi väärin liittää tämä tosiasia alkuperäiseen ylläpitäjään - tämä tilanne aiheutti tyytymättömyys Gentoon ylläpitäjät Funtoo:n läsnäolon vuoksi - olennaisesti Gentoon haarukka, jota he eivät hallitse ja joka tallentaa tiedot ylläpitäjistä. Tilastojen linkittäminen arkistoon mahdollisti tämän ongelman ratkaisemisen, ja samalla ylläpitotiedot tarkentuivat ja jäsenneltyivät.
  • Lisätty kokeellinen tukea uudentyyppinen tunnus, joka on matriisi valittujen projektien versioista kaikissa arkistoissa. Tämä työkalu on hyödyllinen esimerkiksi saadaksesi yleiskuvan projektin riippuvuuksien tilasta (paketin saatavuudesta, versiosta, sen merkityksestä ja tietyn vähimmäismäärän noudattamisesta) (tai vain mielivaltaisesta projektiluettelosta). Tätä toimintoa on pyydetty (ja käytetty) PostGIS-projektin toimesta.
  • Parannettu tuki 404 projektisivulle - varsinkin jos pyydettyä projektia ei ole olemassa, mutta nimi on löydetty aiemmin (esimerkiksi paketin nimenä, joka on määritetty eri nimellä olevalle projektille), käyttäjä tarjosi vaihtoehtoja projekteille, joita hänellä saattaa olla mielessään "yksiselitteiset sivut» Wikipedia. Esimerkki.
  • Parannettu integrointi kanssa wikidata — Tietojen tuonnissa tehtyjen parannusten lisäksi toteutettu ja käynnistetty botti, joka päivittää ohjelmistotiedot Wikidatassa käyttämällä Repologyn tietoja. Muistakaamme, että Wikidatasta on vähitellen tulossa Wikipedian pääasiallinen strukturoidun tiedon lähde (uutisten kontekstissa - faktoja ohjelmistoista, kuten versiohistoria, lisenssi, verkkosivusto, tuettu käyttöjärjestelmä, tekijä, paketit eri jakeluissa jne.), jonka avulla voit säilyttää tietojen merkityksellisyyden yhdessä paikassa sen sijaan, että jokaisesta projektisivusta olisi kymmeniä lokalisoituja versioita. Esimerkiksi projektikortti nginx Wikipedia lähettää tietoja vain Wikidatasta.
  • Viimeisen kuuden kuukauden aikana on käsitelty yli 500 pyyntöä (raporttia) sääntöjen lisäämiseksi/muuttamiseksi yksittäisten projektien oikeamman käsittelyn varmistamiseksi.

Arkiston luokitus pakettien kokonaismäärän mukaan:

  • AUR (49462)
  • nix (48660)
  • Debian ja johdannaiset (32972) (Raspbian-johdot)
  • FreeBSD (26921)
  • Fedora (22337)

Tietovarastojen luokitus ei-yksilöllisten pakettien (eli pakettien, jotka ovat myös muissa jakeluissa) lukumäärän mukaan:

  • nix (41815)
  • Debian ja johdannaiset (24284) (Raspbian-johdot)
  • AUR (22176)
  • FreeBSD (21831)
  • Fedora (19215)

Arkiston luokitus tuoreiden pakkausten lukumäärän mukaan:

  • nix (23210)
  • Debian ja johdannaiset (16107) (Raspbian-johdot)
  • FreeBSD (16095)
  • Fedora (13109)
  • AUR (12417)

Arkiston luokitus tuoreiden pakettien prosenttiosuutena (vain arkistot, joissa on vähintään 1000 pakettia, lukuun ottamatta moduulien alkupään kokoelmia, kuten CPAN, Hackage, PyPi):

  • Ravenports (99.16 %)
  • Kaari ja johdannaiset (85.23 %)
  • Homebrew (84.57 %)
  • nix (84.55 %)
  • Scoop (84.02 %)

Yleiset tilastot:

  • 252 arkistoa
  • 180 tuhatta projektia
  • 2.3 miljoonaa yksittäistä pakettia
  • 36 tuhatta ylläpitäjää
  • 153 tuhatta julkaisua viimeisen kuuden kuukauden aikana (edellinen tarkistus sisälsi virheen; 150 tuhatta julkaisua edellisen kuuden kuukauden aikana)
  • 9.5 % tunnetuista projekteista on julkaissut vähintään yhden uuden version viimeisen kuuden kuukauden aikana

Lähde: opennet.ru

Lisää kommentti