56 проектів на Python з відкритим вихідним кодом

56 проектів на Python з відкритим вихідним кодом

1. Колба

Це мікро-фреймворк, написаний на Python. Він не має валідацій для форм і рівня абстракції бази даних, але дозволяє використовувати сторонні бібліотеки для загальних функцій. І саме тому це мікро-фреймворк. Flask призначений для простого та швидкого створення додатків, а також є масштабованим та легким. Він заснований на проектах Werkzeug та Jinja2. Ви можете дізнатися більше про нього в останній статті DataFlair про Python Flask.

2. Керас

Keras - нейромережева бібліотека з відкритим кодом, написана на Python. Вона зручна для користувача, модульна та розширювана, а також може працювати поверх TensorFlow, Theano, PlaidML або Microsoft Cognitive Toolkit (CNTK). У Keras є все: шаблони, цільові та передавальні функції, оптимізатори та багато іншого. Він також підтримує згорткові та рекурентні нейронні мережі.

Робота над останнім проектом з відкритим вихідним кодом на основі Keras Класифікація раку молочної залози.

56 проектів на Python з відкритим вихідним кодом

Статтю перекладено за підтримки компанії EDISON Software, яка розробляє систему діагностики сховища документів Vivaldi, а також інвестує у стартапи.

3. SpaCy

Це бібліотека ПЗ з відкритим вихідним кодом, що займається обробкою природної мови (NLP) і написана на Python та Cython. У той час як NLTK більше підходить для навчання та дослідницьких цілей, робота spaCy полягає у наданні програмного забезпечення для виробництва. Крім того, Thinc — бібліотека машинного навчання spaCy, де представлені моделі CNN для тегів частини мови, парсингу залежностей і розпізнавання іменованих об'єктів.

4. Sentry

Sentry пропонує хостинг моніторингу помилок з відкритим вихідним кодом, щоб ви могли виявляти та сортувати помилки в режимі реального часу. Просто встановіть SDK для вашої мови або фреймворку і почніть роботу. Він дозволяє фіксувати необроблені винятки, вивчати трасування стека, аналізувати вплив кожної проблеми, відстежувати помилки у різних проектах, призначати проблеми та багато іншого. Використання Sentry означає менше помилок і більше коду, що відправляється.

5. OpenCV

OpenCV – це бібліотека комп'ютерного зору та машинного навчання з відкритим вихідним кодом. Бібліотека має понад 2500 оптимізованих алгоритмів для завдань комп'ютерного зору, таких як виявлення та розпізнавання об'єктів, класифікація різних видів людської діяльності, відстеження рухів за допомогою камери, створення тривимірних моделей об'єктів, зшивання зображень для отримання зображень з високою роздільною здатністю та багато інших завдань. Бібліотека доступна для багатьох мов, таких як Python, C++, Java та ін.

Кількість зірок на Github: 39585

Ви вже працювали над проектом OpenCV? Ось один - Проект визначення статі та віку

6. Nilearn

Це модуль для швидкої та простої реалізації статистичного навчання на даних NeuroImaging. Він дозволяє використовувати scikit-learn для багатовимірної статистики для прогнозного моделювання, класифікації, декодування та аналізу зв'язності. Nilearn є частиною екосистеми NiPy, яка є спільнотою, присвяченою використанню Python для аналізу даних нейровізуалізації.

Кількість зірок на Github: 549

7. scikit-Learn

Scikit-learn - це ще один пітонський проект з відкритим вихідним кодом. Це дуже відома бібліотека машинного навчання для Python. Часто використовуваний з NumPy та SciPy, SciPy пропонує класифікацію, регресію та кластеризацію – він підтримує SVM (підтримка векторних машин), випадкові ліси, градієнтне прискорення, k-кошти та DBSCAN. Ця бібліотека написана мовами Python та Cython.

Кількість зірок на Github: 37,144

8. PyTorch

PyTorch — це ще одна відкрита бібліотека машинного навчання, написана на Python та Python. Вона заснована на бібліотеці Torch та відмінно підходить для таких областей, як комп'ютерний зір та обробка природної мови (NLP). Він також має C++ фронтенд.

Серед багатьох інших особливостей PyTorch пропонує дві високорівневі:

  • Тензорні обчислення із сильним прискоренням за допомогою GPU
  • Глибокі нейронні мережі

Кількість зірок на Github: 31 779

9. Librosa

Librosa - одна з найкращих python бібліотек для аналізу музики та аудіо. Він містить необхідні компоненти, які використовуються для отримання інформації з музики. Бібліотека добре документована та містить кілька посібників та прикладів, які полегшать виконання вашого завдання.

Кількість зірок на Github: 3107

Реалізація проекту Python з відкритим вихідним кодом та Librosa розпізнавання емоцій мови.

10. Генсім

Gensim – це бібліотека Python для моделювання тем, індексації документів та пошуку подібності з великими корпораціями. Він націлений на НЛП та інформаційно-пошукові спільноти. Gensim - скорочення від "генерувати подібне". Раніше він створював короткий список статей, схожих на цю статтю. Gensim зрозумілий, ефективний і масштабований. Gensim реалізує ефективну та просту реалізацію неконтрольованого семантичного моделювання із простого тексту.

Кількість зірок на Github: 9 870

11. Джанго

Django — фреймворк Python високого рівня, який заохочує швидкий розвиток і вірить у принцип DRY (не повторюйся). Це дуже потужний і найбільш широко використовуваний фреймворк для Python. Він заснований на патерні MTV (Model-Template-View).

Кількість зірок на Github: 44 214

12. Розпізнавання обличчя

Face recognition – це популярний проект на GitHub. Він легко розпізнає обличчя та маніпулює ними за допомогою Python/командного рядка та використовує для цього найпростішу у світі бібліотеку розпізнавання осіб. При цьому використовується dlib із глибоким навчанням для виявлення осіб з точністю 99,38% у тесті Wild benchmark.

Кількість зірок на Github: 28,267

13. Cookiecutter

Cookiecutter — це утиліта командного рядка, яку можна використовувати для створення проектів із шаблонів (cookiecutters). Одним із прикладів може бути створення пакетного проекту із шаблону пакетного проекту. Це крос-платформні шаблони і шаблони проектів можуть бути будь-якою мовою або в будь-якому форматі розмітки, наприклад Python, JavaScript, HTML, Ruby, CoffeeScript, RST і Markdown. Він також дозволяє використовувати кілька мов в тому самому шаблоні проекту.

Кількість зірок на Github: 10 291

14. Панди

Pandas – це бібліотека аналізу даних та маніпуляцій з ними для Python, що пропонує марковані структури даних та статистичні функції.

Кількість зірок на Github: 21,404

Python проект з відкритим вихідним кодом, щоб спробувати Pandas виявлення хвороби Паркінсона

15. Піпенв

Pipenv обіцяє бути production-ready інструментом, спрямованим на те, щоб принести найкраще з усіх пакувальних світів у світ Python. Його термінал має гарні кольори і поєднує Pipfile, pip і virtualenv в одну команду. Він автоматично створює та керує віртуальним середовищем для ваших проектів та надає користувачам простий спосіб налаштування робочого середовища.

Кількість зірок на Github: 18,322

16. SimpleCoin

Це реалізація Blockchain для криптовалюти, створена на Python, але вона проста, небезпечна та неповна. SimpleCoin не призначено для виробничого використання. Не для виробничого використання, SimpleCoin призначений для освітніх цілей і тільки для того, щоб зробити робочий ланцюг блокчейн доступним і спростити його. Вона дозволяє зберігати здобуті хеші та обмінювати їх на будь-яку валюту, що підтримується.
Кількість зірок на Github: 1343

17. Pyray

Це бібліотека 3D-рендерінгу, написана на ванільному Python. Він візуалізує 2D, 3D, об'єкти та сцени вищого розміру в Python та анімацію. Він знаходить нас у галузі створених відео, відеоігор, фізичних симуляцій і навіть гарних картинок. Вимоги для цього: PIL, numpy та scipy.

Кількість зірок на Github: 451

18. MicroPython

MicroPython – це Python для мікроконтролерів. Це ефективна реалізація Python3, яка постачається з багатьма пакетами зі стандартної бібліотеки Python та оптимізована для роботи на мікроконтролерах та в обмежених умовах. Pyboard це невелика електронна плата, на якій MicroPython працює на голому металі, тому вона може контролювати всі види електронних проектів.

Кількість зірок на Github: 9,197

19. Киви

Kivy - це бібліотека Python для розробки мобільних додатків та інших мультитач-додатків з природним інтерфейсом користувача (NUI). Вона має графічну бібліотеку, кілька варіантів віджетів, проміжну мову Kv для створення власних віджетів, підтримку миші, клавіатури, TUIO та мультисенсорного введення подій. Це бібліотека з відкритим вихідним кодом для швидкої розробки програм з інноваційними інтерфейсами користувача. Він крос-платформний, дружелюбний до бізнесу та має GPU-прискорення.

Кількість зірок на Github: 9 930

20. тир

Dash by Plotly – це фреймворк веб-додатків. Побудований поверх Flask, Plotly.js, React та React.js, він дозволяє нам використовувати Python для побудови приладових панелей. Він забезпечує роботу моделей Python та R у масштабі. Dash дозволяє створювати, тестувати, розгортати та складати звіти без використання DevOps, JavaScript, CSS або CronJobs. Dash продуктивний, налаштований, легковагий і легко керований. Також має відкритий вихідний код.

Кількість зірок на Github: 9,883

21. Пурпурний

Magenta - це дослідницький проект з відкритим вихідним кодом, який фокусується на машинному навчанні як інструмент у творчому процесі. Це дозволяє створювати музику та мистецтво за допомогою машинного навчання. Magenta — бібліотека Python на базі TensorFlow з утилітами для роботи з вихідними даними, використання її для навчання машинних моделей та створення нового контенту.

22. Маска R-CNN

Це реалізація маски R-CNNN на Python 3, TensorFlow та Keras. Модель бере кожен екземпляр об'єкта на растрі і створює йому обмежувальні рамки і маски сегментації. У ньому використовується мережа Feature Pyramid Network (FPN) та магістраль ResNet101. Код легко розширити. Цей проект також пропонує набір даних Matterport3D про реконструйовані 3D простори, захоплені замовниками.
Кількість зірок на Github: 14 055

23. Моделі TensorFlow

Це репозиторій з різними моделями, реалізованими у TensorFlow – офіційних та дослідницьких моделях. Він також має зразки та навчальні посібники. Офіційні моделі використовують високорівневі API TensorFlow. Дослідницькі моделі - це моделі, реалізовані в TensorFlow дослідниками для їх підтримки або підтримки з питань та отримання запитів.

Кількість зірок на Github: 57 745

24. Snallygaster

Snallygaster – це спосіб організації проблем із проектними дошками. Завдяки цьому ви можете налаштувати панель управління проектами на GitHub, оптимізувати та автоматизувати робочий процес. Він дозволяє сортувати завдання, планувати проекти, автоматизувати робочий процес, відстежувати прогрес, ділитися статусом і нарешті завершувати. Snallygaster може сканувати на наявність секретних файлів на серверах HTTP — він шукає файли, доступні на веб-серверах, які не повинні бути загальнодоступними і можуть становити загрозу безпеці.

Кількість зірок на Github: 1 477

25. Статистичні моделі

Це пакет Python, який доповнює scipy для статистичних обчислень, включаючи описову статистику, а також оцінки та висновки для статистичних моделей. Для цього у нього є класи та функції. Він також дозволяє нам проводити статистичні тести та дослідження статистичних даних.
Кількість зірок на Github: 4 246

26. WhatWaf

Це розширений інструмент виявлення брандмауера, який ми можемо використовувати, щоб зрозуміти, чи є брандмауер веб-програми. Він виявляє брандмауер у веб-застосунку і намагається виявити один або кілька обхідних шляхів для нього на вказаній меті.

Кількість зірок на Github: 1300

27. Чейнер

Chainer - це середовище глибокого навчанняорієнтована на гнучкість. Він базується на Python і пропонує диференційовані API, що базуються на підході define-by-run. Chainer також пропонує об'єктно-орієнтовані API високого рівня для побудови та навчання нейронних мереж. Це потужна, гнучка та інтуїтивно зрозуміла структура для нейромереж.
Кількість зірок на Github: 5,054

28. Відскок

Rebound – інструмент командного рядка. Коли ви отримуєте повідомлення про помилку компілятора, він негайно отримує результати переповненого стека. Щоб використовувати це, ви можете використовувати команду rebound для виконання файлу. Це один із 50 найпопулярніших проектів з відкритим вихідним кодом Python 2018 року. Крім того, він потребує Python 3.0 або вище. Типи файлів, що підтримуються: Python, Node.js, Ruby, Golang і Java.

Кількість зірок на Github: 2913

29. Detectron

Detectron виконує сучасне виявлення об'єктів (також реалізує маску R-CNN). Це програмне забезпечення Facebook AI Research (FAIR) написане на Python і працює на платформі Caffe2 Deep Learning. Мета Detectron – надати високоякісну та високопродуктивну кодову базу для дослідження виявлення об'єктів. Він є гнучким і реалізує такі алгоритми: маска R-CNN, RetinaNet, швидший R-CNN, RPN, швидкий R-CNN, R-FCN.

Кількість зірок на Github: 21 873

30. Python-fire

Це бібліотека для автоматичного створення CLI (інтерфейсів командного рядка) з (будь-якого) об'єкта Python. Він також дозволяє вам розробляти та налагоджувати код, а також дослідити існуючий код або перетворювати чужий код на CLI. Python Fire полегшує перехід між Bash та Python, а також полегшує використання REPL.
Кількість зірок на Github: 15 299

31. Pylearn2

Pylearn2 - це бібліотека машинного навчання, побудована в основному на базі Theano. Її мета – полегшити дослідження ML. Дозволяє писати нові алгоритми та моделі.
Кількість зірок на Github: 2681

32. Matplotlib

Матплотліб - Це бібліотека 2D-креслення для Python - вона генерує якісні публікації в різних форматах.

Кількість зірок на Github: 10,072

33. Теано

Theano - це бібліотека для маніпулювання математичними та матричними виразами. Це також оптимізуючий компілятор. Theano використовує numpy-подібний синтаксис для вираження обчислень та компілює їх для роботи на архітектурах CPU або GPU. Це бібліотека машинного навчання Python з відкритим вихідним кодом, написана на Python і CUDA і працює в Linux, MacOS і Windows.

Кількість зірок на Github: 8,922

34. Multidiff

Multidiff розроблено, щоб полегшити розуміння машинно-орієнтованих даних. Він допомагає переглядати різницю між великою кількістю об'єктів, виконуючи різницю між відповідними об'єктами, а потім відображаючи їх. Ця візуалізація дозволяє нам шукати патерни у власних протоколах чи незвичайних форматах файлів. Він також в основному використовується для зворотного проектування та аналізу двійкових даних.

Кількість зірок на Github: 262

35. Som-tsp

Цей проект присвячений використанню карток, що самоорганізуються, для вирішення проблеми комівояжера. Використовуючи SOM, ми знаходимо неоптимальні рішення для проблеми TSP та використовуємо для цього формат .tsp. TSP - це NP-повна проблема, і зі зростанням числа міст її стає все складніше вирішувати.

Кількість зірок на Github: 950

36. фотон

Photon – це виключно швидкий веб-сканер, розроблений для OSINT. Він може отримувати URL-адреси, URL-адреси з параметрами, відомості про Intel, файли, секретні ключі, файли JavaScript, збіги з регулярними виразами та субдомени. Потім отриману інформацію можна зберегти та експортувати у форматі json. Photon гнучкий та геніальний. Ви також можете додати деякі плагіни до нього.

Кількість зірок на Github: 5714

37. Social Mapper

Social Mapper – це інструмент для картування у соціальних мережах, який корелює профілі з використанням розпізнавання облич. Він робить це на різних веб-сайтах у великих масштабах. Social Mapper автоматизує пошук імен та фотографій у соціальних мережах, а потім намагається точно визначити та згрупувати присутність будь-кого. Потім створює звіт для перевірки людиною. Це корисно в галузі безпеки (наприклад, для фішингу). Він підтримує платформи LinkedIn, Facebook, Twitter, Google Plus, Instagram, ВКонтакті, Weibo та Douban.

Кількість зірок на Github: 2,396

38. Камелот

Camelot — це бібліотека Python, яка допомагає отримувати таблиці з PDF-файлів. Вона працює з текстовими PDF-файлами, але не з відсканованими документами. Тут кожна таблиця є Pandas DataFrame. Крім того, ви можете експортувати таблиці в .json, .xls, .html або .sqlite.

Кількість зірок на Github: 2415

39. Lector

Це Qt-рідер для читання електронних книг. Він підтримує формати файлів .pdf, .epub, .djvu, .fb2, .mobi, .azw/.azw3/.azw4, .cbr/.cbz та .md. У Lector є головне вікно, перегляд таблиці, перегляд книг, перегляд без відволікань, підтримка анотацій, перегляд коміксів та вікно налаштувань. Він також підтримує закладки, перегляд профілів, редактор метаданих та вбудований словник.

Кількість зірок на Github: 835

40. m00dbot

Це бот Telegram для самостійного тестування депресії та тривоги.

Кількість зірок на Github: 145

41. Manim

Це двигун анімації для пояснення математичних відеороликів, який можна використовувати для створення точної анімації програмним способом. Для цього він використовує Python.

Кількість зірок на Github: 13 491

42. Douyin-Bot

Бот написаний на Python для програми, схожої на Tinder. Розробники із Китаю.

Кількість зірок на Github: 5,959

43. XSStrike

Це пакет виявлення міжсайтових сценаріїв із чотирма синтаксичними аналізаторами, написаними від руки. Він також оснащений інтелектуальним генератором корисних даних, потужним механізмом фаззингу та неймовірно швидким пошуковим модулем. Замість того, щоб вводити корисні дані та перевіряти їхню роботу, як усі інші інструменти, XSStrike розпізнає відповідь за допомогою декількох аналізаторів і потім обробляє корисні дані, які гарантовано працюватимуть за допомогою контекстного аналізу, інтегрованого в механізм фаззингу.

Кількість зірок на Github: 7050

44. PythonRobotics

Даний проект є збіркою коду в алгоритмах Python-робототехніки, а також алгоритмів автономної навігації.

Кількість зірок на Github: 6,746

45. Завантажити зображення Google

Google Images Download — це програма Python для командного рядка, яка шукає ключові слова у зображеннях Google та отримує зображення для вас. Це невелика програма без залежностей, якщо вам потрібно лише завантажити до 100 зображень для кожного ключового слова.

Кількість зірок на Github: 5749

46. ​​Trape

Дозволяє відстежувати та виконувати інтелектуальні атаки соціальної інженерії в режимі реального часу. Це допомагає з'ясувати, як великі інтернет-компанії можуть отримувати конфіденційну інформацію та контролювати користувачів без їхнього відома. Trape також може допомогти відстежити кіберзлочинців.

Кількість зірок на Github: 4256

47. Xonsh

Xonsh - це крос-платформний Unix-gazing мову командного рядка та оболонки командного рядка на базі Python. Це суперсет Python 3.5+ з додатковими примітивами оболонки, такими як Bash і IPython. Xonsh працює на Linux, Max OS X, Windows та інших основних системах.

Кількість зірок на Github: 3426

48. GIF для CLI

Для цього потрібно GIF або коротке відео або запит, а за допомогою API-інтерфейсу Tenor GIF він перетворюється на анімовану графіку ASCII. Він використовує escape-послідовності ANSI для анімації та кольору.

Кількість зірок на Github: 2,547

49. Мультфільм

Draw This - камера полароїда, здатна малювати мультфільми. При цьому використовується нейронна мережа для розпізнавання об'єктів, набір даних Google Quickdraw, термопринтер та Raspberry Pi. Quick, Draw! - це гра Google, в якій гравцям пропонується намалювати зображення об'єкта/ідеї, а потім він намагається вгадати, що він представляє менш ніж за 20 секунд.

Кількість зірок на Github: 1760

50. Цуліп

Zulip — це програма для групового чату, що працює в режимі реального часу, а також продуктивна завдяки багатопоточним розмовам. Багато компаній зі списку Fortune 500 та проекти з відкритим вихідним кодом використовують його для чату в реальному часі, який може обробляти тисячі повідомлень на день.

Кількість зірок на Github: 10,432

51. YouTube-dl

Це програма командного рядка, яка може завантажувати відео з YouTube та деяких інших сайтів. Він не прив'язаний до конкретної платформи.

Кількість зірок на Github: 55 868

52. Анзибль

Це проста система автоматизації ІТ, яка може обробляти такі функції: управління конфігурацією, розгортання додатків, ініціалізація хмари, виконання спеціальних завдань, автоматизація мережі та багатовузлове оркестрування.

Кількість зірок на Github: 39,443

53. HTTPie

HTTPie - це HTTP-клієнт командного рядка. Це полегшує взаємодію CLI з веб-сервісами. Для команди http вона дозволяє нам посилати довільні HTTP запити з простим синтаксисом, і отримувати кольоровий висновок. Ми можемо використовувати його для тестування, налагодження та взаємодії з HTTP-серверами.

Кількість зірок на Github: 43 199

54. Tornado Web Server

Це веб-фреймворк, асинхронна мережева бібліотека для Python. Він використовує неблокуючі мережеві входи/виходи для масштабування до більш ніж тисяч відкритих з'єднань. Це робить його гарним вибором для довгих запитів та WebSockets.

Кількість зірок на Github: 18 306

55. Запити

Requests — це бібліотека, яка дозволяє легко надсилати запити HTTP/1.1. Вам не потрібно вручну додавати параметри до URL-адрес або кодувати дані PUT та POST.
Кількість зірок на Github: 40 294

56. Скрепі

Scrapy - це швидкий високорівневий фреймворк для перегляду веб-сторінок - ви можете використовувати його для перегляду веб-сайтів для вилучення структурованих даних. Ви також можете використовувати його для аналізу даних, моніторингу та автоматизованого тестування.

Кількість зірок на Github: 34,493

Джерело: habr.com

Додати коментар або відгук