I partecipanti alla comunità open source dell'Università ITMO hanno pubblicato i risultati di uno studio in cui hanno analizzato le caratteristiche e le tendenze nello sviluppo e nell'uso del software open source globale nel campo dell'apprendimento automatico e della gestione dei dati in Russia. Il rapporto contiene le opinioni di esperti di Yandex, Sber, T-Bank, VK, Wildberries, Rocket Control, CodeScoring e MIPT, ha analizzato i dati aperti di GitHub e servizi correlati, ha costruito valutazioni, grafici e tabelle.
Durante la ricerca è stato implementato un parser di dati dall'API GitHub e da servizi di terze parti (come pepy, star-history, ecc.), sulla base dei quali vengono raccolti dati sulla posizione degli utenti che utilizzano progetti aperti e partecipano al loro sviluppo è stato analizzato. Viene prestata attenzione anche alle comunità open source esistenti, ad altre ricerche su argomenti simili, alle prospettive di sviluppo dell'open source nell'era dell'intelligenza artificiale e molto altro ancora.
Le 5 principali soluzioni utilizzate nella Federazione Russa:
- ML e algoritmi:
- Cat Boost
- LightAutoML
- PyTorch
- Scikit-learn
- TensorFlow
- Matematica:
- NumPy
- Ottuna
- SciPy
- Theano
- Modelli statistici
- Infrastruttura:
- YTsauro
- Spark
- Hadoop
- Pandas
- Caffe
- Visualizzazione e BI:
- metabase
- superset
- DataLens
- matplotlib
- Plotly
- Archivio dati:
- MongoDB
- Tarantoolo
- PostgreSQL
- CliccaCasa
- YDB
- MLOps:
- LangChain
- Kubeflow
- MLflow
- Bacchetta B
- GigaChain


Fonte: opennet.ru
