14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Data Science для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ…

1. Sentiment Analysis (Анализ настроСний Ρ‡Π΅Ρ€Π΅Π· тСкст)

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ ΠΏΠΎΠ»Π½ΡƒΡŽ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science с использованиСм исходного ΠΊΠΎΠ΄Π° β€” Sentiment Analysis Project Π² R.

Sentiment Analysis β€” это Π°Π½Π°Π»ΠΈΠ· слов для опрСдСлСния настроСний ΠΈ ΠΌΠ½Π΅Π½ΠΈΠΉ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΈΠ»ΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ. Π­Ρ‚ΠΎ Ρ‚ΠΈΠΏ классификации, ΠΏΡ€ΠΈ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ классы ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π΄Π²ΠΎΠΈΡ‡Π½Ρ‹ΠΌΠΈ (ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ) ΠΈΠ»ΠΈ мноТСствСнными (счастливыми, Π·Π»Ρ‹ΠΌΠΈ, грустными, ΠΏΡ€ΠΎΡ‚ΠΈΠ²Π½Ρ‹ΠΌΠΈ …). ΠœΡ‹ Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΠ΅ΠΌ этот Data Science ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Π½Π° языкС R ΠΈ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Π² ΠΏΠ°ΠΊΠ΅Ρ‚Π΅ Β«janeaustenRΒ». ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ словари ΠΎΠ±Ρ‰Π΅Π³ΠΎ назначСния, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ AFINN, bing ΠΈ loughran, Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ Π²Π½ΡƒΡ‚Ρ€Π΅Π½Π½Π΅Π΅ соСдинСниС, ΠΈ Π² ΠΊΠΎΠ½Ρ†Π΅ ΠΌΡ‹ создадим ΠΎΠ±Π»Π°ΠΊΠΎ слов, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

Π―Π·Ρ‹ΠΊ: R
Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: janeaustenR

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π‘Ρ‚Π°Ρ‚ΡŒΡ ΠΏΠ΅Ρ€Π΅Π²Π΅Π΄Π΅Π½Π° ΠΏΡ€ΠΈ ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ΅ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ EDISON Software, которая Π΄Π΅Π»Π°Π΅Ρ‚ Π²ΠΈΡ€Ρ‚ΡƒΠ°Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΡ‡Π½Ρ‹Π΅ для ΠΌΡƒΠ»ΡŒΡ‚ΠΈΠ±Ρ€ΡΠ½Π΄ΠΎΠ²Ρ‹Ρ… ΠΌΠ°Π³Π°Π·ΠΈΠ½ΠΎΠ², Π° Ρ‚Π°ΠΊΠΆΠ΅ тСстируСт ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ½ΠΎΠ΅ обСспСчСниС.

2. Fake News Detection (ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ Ρ„Π΅ΠΉΠΊΠΎΠ²Ρ‹Ρ… новостСй)

ΠŸΠΎΠ΄Π½ΠΈΠΌΠΈΡ‚Π΅ свои Π½Π°Π²Ρ‹ΠΊΠΈ Π½Π° Π½ΠΎΠ²Ρ‹ΠΉ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ, работая Π½Π°Π΄ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠΌ Data Science для Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‰ΠΈΡ… β€” ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΏΠΎΠ΄Π΄Π΅Π»ΡŒΠ½Ρ‹Ρ… новостСй с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π€Π°Π»ΡŒΡˆΠΈΠ²Ρ‹Π΅ новости β€” это лоТная информация, распространяСмая Ρ‡Π΅Ρ€Π΅Π· ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½Ρ‹Π΅ сСти ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ сСтСвыС БМИ для достиТСния политичСских Ρ†Π΅Π»Π΅ΠΉ. Π’ этой ΠΈΠ΄Π΅Π΅ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° ΠΏΠΎ Data Science ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Python для построСния ΠΌΠΎΠ΄Π΅Π»ΠΈ, которая ΠΌΠΎΠΆΠ΅Ρ‚ Ρ‚ΠΎΡ‡Π½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ, являСтся Π»ΠΈ Π½ΠΎΠ²ΠΎΡΡ‚ΡŒ Ρ€Π΅Π°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ»ΠΈ Ρ„Π°Π»ΡŒΡˆΠΈΠ²ΠΎΠΉ. ΠœΡ‹ создадим TfidfVectorizer ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ PassiveAggressiveClassifier для классификации новостСй Π½Π° Β«Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹Π΅Β» ΠΈ Β«ΠΏΠΎΠ΄Π΄Π΅Π»ΡŒΠ½Ρ‹Π΅Β». ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Ρ„ΠΎΡ€ΠΌΡ‹ 7796 Γ— 4 ΠΈ Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ всС Π² Jupyter Lab.

Π―Π·Ρ‹ΠΊ: Python

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: news.csv

3. Detecting Parkinson’s Disease (ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ Π±ΠΎΠ»Π΅Π·Π½ΠΈ ΠŸΠ°Ρ€ΠΊΠΈΠ½ΡΠΎΠ½Π°)

ΠŸΡ€ΠΎΠ΄Π²ΠΈΠ³Π°ΠΉΡ‚Π΅ΡΡŒ Π²ΠΏΠ΅Ρ€Π΅Π΄, работая Π½Π°Π΄ ΠΈΠ΄Π΅Π΅ΠΉ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science Project Idea β€” выявлСниС Π±ΠΎΠ»Π΅Π·Π½ΠΈ ΠŸΠ°Ρ€ΠΊΠΈΠ½ΡΠΎΠ½Π° с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ XGBoost.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

ΠœΡ‹ Π½Π°Ρ‡Π°Π»ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Data Science для ΡƒΠ»ΡƒΡ‡ΡˆΠ΅Π½ΠΈΡ здравоохранСния ΠΈ услуг β€” Ссли ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚ΡŒ Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠ΅ Π½Π° Ρ€Π°Π½Π½Π΅ΠΉ стадии, Ρ‚ΠΎ Ρƒ нас Π±ΡƒΠ΄Π΅Ρ‚ ΠΌΠ½ΠΎΠ³ΠΎ прСимущСств. Π˜Ρ‚Π°ΠΊ, Π² этой ΠΈΠ΄Π΅Π΅ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° ΠΏΠΎ Data Science ΠΌΡ‹ научимся Π²Ρ‹ΡΠ²Π»ΡΡ‚ΡŒ болСзнь ΠŸΠ°Ρ€ΠΊΠΈΠ½ΡΠΎΠ½Π° с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python. Π­Ρ‚ΠΎ Π½Π΅ΠΉΡ€ΠΎΠ΄Π΅Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠ΅, ΠΏΡ€ΠΎΠ³Ρ€Π΅ΡΡΠΈΡ€ΡƒΡŽΡ‰Π΅Π΅ Π·Π°Π±ΠΎΠ»Π΅Π²Π°Π½ΠΈΠ΅ Ρ†Π΅Π½Ρ‚Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ Π½Π΅Ρ€Π²Π½ΠΎΠΉ систСмы, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ влияСт Π½Π° Π΄Π²ΠΈΠΆΠ΅Π½ΠΈΠ΅ ΠΈ Π²Ρ‹Π·Ρ‹Π²Π°Π΅Ρ‚ Π΄Ρ€ΠΎΠΆΡŒ ΠΈ ΡΠΊΠΎΠ²Π°Π½Π½ΠΎΡΡ‚ΡŒ. Π­Ρ‚ΠΎ влияСт Π½Π° ΠΏΡ€ΠΎΠ΄ΡƒΡ†ΠΈΡ€ΡƒΡŽΡ‰ΠΈΠ΅ Π΄ΠΎΡ„Π°ΠΌΠΈΠ½ Π½Π΅ΠΉΡ€ΠΎΠ½Ρ‹ Π² Π³ΠΎΠ»ΠΎΠ²Π½ΠΎΠΌ ΠΌΠΎΠ·Π³Π΅, ΠΈ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ Π³ΠΎΠ΄, это Π·Π°Ρ‚Ρ€Π°Π³ΠΈΠ²Π°Π΅Ρ‚ Π±ΠΎΠ»Π΅Π΅ 1 ΠΌΠΈΠ»Π»ΠΈΠΎΠ½Π° Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ Π² Индии.

Π―Π·Ρ‹ΠΊ: Python

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: UCI ML Parkinsons dataset

Data Science ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρ‹ срСднСй слоТности

4. Speech Emotion Recognition(РаспознаваниС эмоции ΠΈΠ· Ρ€Π΅Ρ‡ΠΈ)

ΠžΠ·Π½Π°ΠΊΠΎΠΌΡŒΡ‚Π΅ΡΡŒ с ΠΏΠΎΠ»Π½ΠΎΠΉ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science β€” распознаваниС Ρ€Π΅Ρ‡ΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Librosa.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π”Π°Π²Π°ΠΉΡ‚Π΅ Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ научимся ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π°Π·Π½Ρ‹Π΅ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ. Π­Ρ‚ΠΎΡ‚ Data Science ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ librosa для распознавания Ρ€Π΅Ρ‡ΠΈ. SER β€” это процСсс опрСдСлСния чСловСчСских эмоций ΠΈ Π°Ρ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹Ρ… состояний ΠΏΠΎ Ρ€Π΅Ρ‡ΠΈ. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΌΡ‹ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌ Ρ‚ΠΎΠ½ ΠΈ высоту Ρ‚ΠΎΠ½Π° для выраТСния эмоций голосом, SER Π°ΠΊΡ‚ΡƒΠ°Π»Π΅Π½. Но Ρ‚Π°ΠΊ ΠΊΠ°ΠΊ эмоции ΡΡƒΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½Ρ‹, Π°Π½Π½ΠΎΡ‚ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ Π·Π²ΡƒΠΊΠ° являСтся слоТной Π·Π°Π΄Π°Ρ‡Π΅ΠΉ. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ mfcc, chroma ΠΈ mel ΠΈ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… RAVDESS для распознавания эмоций. ΠœΡ‹ создадим MLPC-классификатор для этой ΠΌΠΎΠ΄Π΅Π»ΠΈ.

Π―Π·Ρ‹ΠΊ: Python

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: RAVDESS dataset

5. Gender and Age Detection (ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΏΠΎΠ»Π° ΠΈ возраста)

ΠŸΠΎΡ€Π°Π·ΠΈΡ‚Π΅ Ρ€Π°Π±ΠΎΡ‚ΠΎΠ΄Π°Ρ‚Π΅Π»Π΅ΠΉ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ новСйшСго ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science β€” ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΠΎΠ»Π° ΠΈ возраста с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ OpenCV.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π­Ρ‚ΠΎ интСрСсный Data Science с Python. Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½ΠΎ ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅, Π²Ρ‹ Π½Π°ΡƒΡ‡ΠΈΡ‚Π΅ΡΡŒ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Ρ‹Π²Π°Ρ‚ΡŒ ΠΏΠΎΠ» ΠΈ возраст Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊΠ°. Π’ этом ΠΌΡ‹ ΠΏΠΎΠ·Π½Π°ΠΊΠΎΠΌΠΈΠΌ вас с Computer Vision ΠΈ Π΅Π³ΠΎ ΠΏΡ€ΠΈΠ½Ρ†ΠΈΠΏΠ°ΠΌΠΈ. ΠœΡ‹ построим ΡΠ²Π΅Ρ€Ρ‚ΠΎΡ‡Π½ΡƒΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ ΠΈ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, ΠΎΠ±ΡƒΡ‡Π΅Π½Π½Ρ‹Π΅ Π’Π°Π»ΠΎΠΌ Π₯асснСром ΠΈ Π”ΠΆΠΈΠ»ΠΎΠΌ Π›Π΅Π²ΠΈ для Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ… Adience. По ΠΏΡƒΡ‚ΠΈ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Ρ„Π°ΠΉΠ»Ρ‹ .pb, .pbtxt, .prototxt ΠΈ .caffemodel.

Π―Π·Ρ‹ΠΊ: Python

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: Adience

6. Uber Data Analysis (Анализ Π΄Π°Π½Π½Ρ‹Ρ… Uber)

ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ ΠΏΠΎΠ»Π½ΡƒΡŽ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science с исходным ΠΊΠΎΠ΄ΠΎΠΌ β€” Uber Data Analysis Project Π² R.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π­Ρ‚ΠΎ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ Π΄Π°Π½Π½Ρ‹Ρ… с ggplot2, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ R ΠΈ Π΅Π³ΠΎ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ ΠΈ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€Ρ‹. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… Uber Pickups Π² Нью-Π™ΠΎΡ€ΠΊΠ΅ ΠΈ ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ для Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… Π²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ… Ρ€Π°ΠΌΠΎΠΊ Π³ΠΎΠ΄Π°. Π­Ρ‚ΠΎ Π³ΠΎΠ²ΠΎΡ€ΠΈΡ‚ Π½Π°ΠΌ ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ врСмя влияСт Π½Π° ΠΏΠΎΠ΅Π·Π΄ΠΊΠΈ ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ².

Π―Π·Ρ‹ΠΊ: R

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: Uber Pickups in New York City dataset

7. Driver Drowsiness detection (ΠžΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ сонливости водитСля)

ΠŸΡ€ΠΎΠΊΠ°Ρ‡Π°ΠΉΡ‚Π΅ свои Π½Π°Π²Ρ‹ΠΊΠΈ, работая Π½Π°Π΄ Top Data Science Project β€” систСмой обнаруТСния сонливости с OpenCV & Keras.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π‘ΠΎΠ½Π½ΠΎΠ΅ Π²ΠΎΠΆΠ΄Π΅Π½ΠΈΠ΅ Ρ‡Ρ€Π΅Π·Π²Ρ‹Ρ‡Π°ΠΉΠ½ΠΎ опасно, ΠΈ ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ Π³ΠΎΠ΄ происходит ΠΎΠΊΠΎΠ»ΠΎ тысячи Π°Π²Π°Ρ€ΠΈΠΉ ΠΈΠ·-Π·Π° Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΠΈ Π·Π°ΡΡ‹ΠΏΠ°ΡŽΡ‚ Π²ΠΎ врСмя воТдСния. Π’ этом ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π΅ Π½Π° Python ΠΌΡ‹ создадим систСму, которая смоТСт ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Ρ‚ΡŒ сонных Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»Π΅ΠΉ, Π° Ρ‚Π°ΠΊΠΆΠ΅ ΠΎΠΏΠΎΠ²Π΅Ρ‰Π°Ρ‚ΡŒ ΠΈΡ… Π·Π²ΡƒΠΊΠΎΠ²Ρ‹ΠΌ сигналом.

Π­Ρ‚ΠΎΡ‚ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ Ρ€Π΅Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½ с использованиСм Keras ΠΈ OpenCV. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ OpenCV для обнаруТСния Π»ΠΈΡ†Π° ΠΈ Π³Π»Π°Π·, Π° с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Keras ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ состояниС Π³Π»Π°Π·Π° (ΠžΡ‚ΠΊΡ€Ρ‹Ρ‚ΠΎΠ΅ ΠΈΠ»ΠΈ Π—Π°ΠΊΡ€Ρ‹Ρ‚ΠΎΠ΅) с использованиСм ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠ² Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти.

8. Chatbot

Π‘ΠΎΠ·Π΄Π°ΠΉΡ‚Π΅ Ρ‡Π°Ρ‚-Π±ΠΎΡ‚Π° с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python ΠΈ сдСлайтС шаг Π²ΠΏΠ΅Ρ€Π΅Π΄ Π² своСй ΠΊΠ°Ρ€ΡŒΠ΅Ρ€Π΅ β€” Chatbot с NLTK & Keras.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π§Π°Ρ‚-Π±ΠΎΡ‚Ρ‹ ΡΠ²Π»ΡΡŽΡ‚ΡΡ Π½Π΅ΠΎΡ‚ΡŠΠ΅ΠΌΠ»Π΅ΠΌΠΎΠΉ Ρ‡Π°ΡΡ‚ΡŒΡŽ бизнСса. Многим прСдприятиям приходится ΠΏΡ€Π΅Π΄Π»Π°Π³Π°Ρ‚ΡŒ услуги своим ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°ΠΌ, ΠΈ для ΠΈΡ… обслуТивания трСбуСтся ΠΌΠ½ΠΎΠ³ΠΎ Ρ€Π°Π±ΠΎΡ‡Π΅ΠΉ силы, Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ ΠΈ усилий. Π§Π°Ρ‚-Π±ΠΎΡ‚Ρ‹ ΠΌΠΎΠ³ΡƒΡ‚ Π°Π²Ρ‚ΠΎΠΌΠ°Ρ‚ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π±ΠΎΠ»ΡŒΡˆΡƒΡŽ Ρ‡Π°ΡΡ‚ΡŒ взаимодСйствия с ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°ΠΌΠΈ, отвСчая Π½Π° Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ частыС вопросы, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π·Π°Π΄Π°ΡŽΡ‚ ΠΊΠ»ΠΈΠ΅Π½Ρ‚Ρ‹. Π’ основном Π΅ΡΡ‚ΡŒ Π΄Π²Π° Ρ‚ΠΈΠΏΠ° Ρ‡Π°Ρ‚-Π±ΠΎΡ‚ΠΎΠ²: Domain-specific ΠΈ Open-domain. Domain-specific Ρ‡Π°Ρ‚-Π±ΠΎΡ‚ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π²Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π½Π°ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π΅Π³ΠΎ для эффСктивной Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π² вашСй сфСрС. Open-domain Ρ‡Π°Ρ‚-Π±ΠΎΡ‚Π°ΠΌ ΠΌΠΎΠΆΠ½ΠΎ Π·Π°Π΄Π°Π²Π°Ρ‚ΡŒ Π»ΡŽΠ±Ρ‹Π΅ вопросы, поэтому для ΠΈΡ… обучСния трСбуСтся ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠ΅ количСство Π΄Π°Π½Π½Ρ‹Ρ….

Набор Π΄Π°Π½Π½Ρ‹Ρ…: Intents json file

Π―Π·Ρ‹ΠΊ: Python

ΠŸΡ€ΠΎΠ΄Π²ΠΈΠ½ΡƒΡ‚Ρ‹Π΅ Data Science ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρ‹

9. Image Caption Generator(Π“Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€ описания изобраТСния)

ΠŸΡ€ΠΎΠ²Π΅Ρ€ΡŒΡ‚Π΅ ΠΏΠΎΠ»Π½ΡƒΡŽ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° с исходным ΠΊΠΎΠ΄ΠΎΠΌ β€” Image Caption Generator с CNN & LSTM.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

ОписаниС Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Π΅ΡΡ‚ΡŒ Π½Π° ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ, являСтся Π»Π΅Π³ΠΊΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ΠΉ для людСй, Π½ΠΎ для ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ΠΎΠ², ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ β€” это просто Π½Π°Π±ΠΎΡ€ Ρ†ΠΈΡ„Ρ€, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ собой Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Ρ†Π²Π΅Ρ‚Π° ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ пиксСля. Π­Ρ‚ΠΎ трудная Π·Π°Π΄Π°Ρ‡Π° для ΠΊΠΎΠΌΠΏΡŒΡŽΡ‚Π΅Ρ€ΠΎΠ². ΠŸΠΎΠ½ΡΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ находится Π² ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ, Π° Π·Π°Ρ‚Π΅ΠΌ ΡΠΎΠ·Π΄Π°Ρ‚ΡŒ описаниС Π½Π° СстСствСнном языкС(Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π½Π° английском), являСтся Π΄Ρ€ΡƒΠ³ΠΎΠΉ Ρ‚Ρ€ΡƒΠ΄Π½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ΠΉ. Π­Ρ‚ΠΎΡ‚ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ изучСния, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… ΠΌΡ‹ Ρ€Π΅Π°Π»ΠΈΠ·ΡƒΠ΅ΠΌ ΠšΠΎΠ½Π²ΠΎΠ»ΡŽΡ†ΠΈΠΎΠ½Π½ΡƒΡŽ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΡƒΡŽ ΡΠ΅Ρ‚ΡŒ (CNN) с Ρ€Π΅ΠΊΡƒΡ€Ρ€Π΅Π½Ρ‚Π½ΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ ΡΠ΅Ρ‚ΡŒΡŽ (LSTM) для создания Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΎΡ€Π° описания изобраТСния.

Набор Π΄Π°Π½Π½Ρ‹Ρ…: Flickr 8K

Π―Π·Ρ‹ΠΊ: Python

Π€Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ: Keras

10. Credit Card Fraud Detection(ΠžΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²Π° с ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌΠΈ ΠΊΠ°Ρ€Ρ‚Π°ΠΌΠΈ)

Π‘Π΄Π΅Π»Π°ΠΉΡ‚Π΅ всС Π²ΠΎΠ·ΠΌΠΎΠΆΠ½ΠΎΠ΅, работая Π½Π°Π΄ ΠΈΠ΄Π΅Π΅ΠΉ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science β€” ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΡ‚Π²Π° с ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌΠΈ ΠΊΠ°Ρ€Ρ‚Π°ΠΌΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ машинного обучСния.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

К настоящСму Π²Ρ€Π΅ΠΌΠ΅Π½ΠΈ Π²Ρ‹ Π½Π°Ρ‡Π°Π»ΠΈ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΈ ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΠΈ. Π”Π°Π²Π°ΠΉΡ‚Π΅ ΠΏΠ΅Ρ€Π΅ΠΉΠ΄Π΅ΠΌ ΠΊ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΌ ΠΏΡ€ΠΎΠ΄Π²ΠΈΠ½ΡƒΡ‚Ρ‹ΠΌ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π°ΠΌ Π² области Π½Π°ΡƒΠΊΠΈ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…. Π’ этом ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π΅ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ язык R с Ρ‚Π°ΠΊΠΈΠΌΠΈ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°ΠΌΠΈ, ΠΊΠ°ΠΊ Π΄Π΅Ρ€Π΅Π²ΡŒΡ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, логистичСская рСгрСссия, искусствСнныС Π½Π΅ΠΉΡ€ΠΎΠ½Π½Ρ‹Π΅ сСти ΠΈ классификатор Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½ΠΎΠ³ΠΎ бустинга. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΠΉ с ΠΊΠ°Ρ€Ρ‚Π°ΠΌΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Ρ€Π°Π½Π·Π°ΠΊΡ†ΠΈΠΈ ΠΏΠΎ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌ ΠΊΠ°Ρ€Ρ‚Π°ΠΌ ΠΊΠ°ΠΊ ΠΌΠΎΡˆΠ΅Π½Π½ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ ΠΈ ΠΏΠΎΠ΄Π»ΠΈΠ½Π½Ρ‹Π΅. ΠœΡ‹ ΠΏΠΎΠ΄Π±Π΅Ρ€Π΅ΠΌ для Π½ΠΈΡ… Ρ€Π°Π·Π½Ρ‹Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΈ построим ΠΊΡ€ΠΈΠ²Ρ‹Π΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ.

Π―Π·Ρ‹ΠΊ: R

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: Card Transactions dataset

11. Movie Recommendation System(CистСма Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ ΠΏΠΎ Ρ„ΠΈΠ»ΡŒΠΌΠ°ΠΌ)

Π˜Π·ΡƒΡ‡ΠΈΡ‚Π΅ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ Π»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ Data Science ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° с Π˜ΡΡ…ΠΎΠ΄Π½Ρ‹ΠΌ ΠΊΠΎΠ΄ΠΎΠΌ β€” Movie Recommendation System Π½Π° языкС R

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π’ этом Data Science ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π΅ ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ R, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²Ρ‹ΠΏΠΎΠ»Π½ΠΈΡ‚ΡŒ Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΈ Ρ„ΠΈΠ»ΡŒΠΌΠ° посрСдством машинного обучСния. БистСма Ρ€Π΅ΠΊΠΎΠΌΠ΅Π½Π΄Π°Ρ†ΠΈΠΉ рассылаСт прСдлоТСния ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌ Ρ‡Π΅Ρ€Π΅Π· процСсс Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΠΈ, основанный Π½Π° прСдпочтСниях Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ ΠΈ истории просмотров. Если A ΠΈ B нравится Home Alone, Π° B Π»ΡŽΠ±ΠΈΡ‚ Mean Girls, Ρ‚ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠΈΡ‚ΡŒ A β€” ΠΈΠΌ это Ρ‚ΠΎΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΠΎΠ½Ρ€Π°Π²ΠΈΡ‚ΡŒΡΡ. Π­Ρ‚ΠΎ позволяСт ΠΊΠ»ΠΈΠ΅Π½Ρ‚Π°ΠΌ Π²Π·Π°ΠΈΠΌΠΎΠ΄Π΅ΠΉΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ с ΠΏΠ»Π°Ρ‚Ρ„ΠΎΡ€ΠΌΠΎΠΉ.

Π―Π·Ρ‹ΠΊ: R

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: MovieLens dataset

12. Customer Segmentation(БСгмСнтация ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»Π΅ΠΉ)

ΠŸΡ€ΠΎΠΈΠ·Π²Π΅Π΄ΠΈΡ‚Π΅ Π²ΠΏΠ΅Ρ‡Π°Ρ‚Π»Π΅Π½ΠΈΠ΅ Π½Π° Ρ€Π°Π±ΠΎΡ‚ΠΎΠ΄Π°Ρ‚Π΅Π»Π΅ΠΉ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Data Science ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° (Π²ΠΊΠ»ΡŽΡ‡Π°Ρ исходный ΠΊΠΎΠ΄) β€” БСгмСнтация ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ машинного обучСния.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

БСгмСнтация ΠΏΠΎΠΊΡƒΠΏΠ°Ρ‚Π΅Π»Π΅ΠΉ являСтся популярным ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ΠΌ Π½Π΅ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΠΈΡ€ΡƒΠ΅ΠΌΠΎΠ³ΠΎ обучСния (unsupervised learning). Π˜ΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΊΠ»Π°ΡΡ‚Π΅Ρ€ΠΈΠ·Π°Ρ†ΠΈΡŽ, ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ сСгмСнты ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² для Ρ€Π°Π±ΠΎΡ‚Ρ‹ с ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠΉ Π±Π°Π·ΠΎΠΉ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»Π΅ΠΉ. Они дСлят ΠΊΠ»ΠΈΠ΅Π½Ρ‚ΠΎΠ² Π½Π° Π³Ρ€ΡƒΠΏΠΏΡ‹ Π² соотвСтствии с ΠΎΠ±Ρ‰ΠΈΠΌΠΈ характСристиками, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ ΠΏΠΎΠ», возраст, интСрСсы ΠΈ ΠΏΡ€ΠΈΠ²Ρ‹Ρ‡ΠΊΠΈ расходования срСдств, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΎΠ½ΠΈ ΠΌΠΎΠ³Π»ΠΈ эффСктивно ΠΏΡ€ΠΎΠ΄Π°Π²Π°Ρ‚ΡŒ свою ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ†ΠΈΡŽ ΠΊΠ°ΠΆΠ΄ΠΎΠΉ Π³Ρ€ΡƒΠΏΠΏΠ΅. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ K-means clustering, Π° Ρ‚Π°ΠΊΠΆΠ΅ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ распрСдСлСниС ΠΏΠΎ ΠΏΠΎΠ»Ρƒ ΠΈ возрасту. Π—Π°Ρ‚Π΅ΠΌ ΠΌΡ‹ ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌ ΠΈΡ… Π³ΠΎΠ΄ΠΎΠ²Ρ‹Π΅ Π΄ΠΎΡ…ΠΎΠ΄Ρ‹ ΠΈ ΡƒΡ€ΠΎΠ²Π΅Π½ΡŒ расходов.

Π―Π·Ρ‹ΠΊ: R

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: Mall_Customers dataset

13. Breast Cancer Classification (ΠšΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ Ρ€Π°ΠΊΠ° ΠΌΠΎΠ»ΠΎΡ‡Π½ΠΎΠΉ ΠΆΠ΅Π»Π΅Π·Ρ‹)

ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ ΠΏΠΎΠ»Π½ΡƒΡŽ Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science Π² Python β€” ΠšΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΡ Ρ€Π°ΠΊΠ° ΠΌΠΎΠ»ΠΎΡ‡Π½ΠΎΠΉ ΠΆΠ΅Π»Π΅Π·Ρ‹ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠ³ΠΎ обучСния.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π’ΠΎΠ·Π²Ρ€Π°Ρ‰Π°ΡΡΡŒ ΠΊ мСдицинскому Π²ΠΊΠ»Π°Π΄Ρƒ Π½Π°ΡƒΠΊΠΈ Π΄Π°Π½Π½Ρ‹Ρ…, Π΄Π°Π²Π°ΠΉΡ‚Π΅ научимся Π²Ρ‹ΡΠ²Π»ΡΡ‚ΡŒ Ρ€Π°ΠΊ ΠΌΠΎΠ»ΠΎΡ‡Π½ΠΎΠΉ ΠΆΠ΅Π»Π΅Π·Ρ‹ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python. ΠœΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ… IDC_regular для выявлСния ΠΈΠ½Π²Π°Π·ΠΈΠ²Π½ΠΎΠΉ ΠΊΠ°Ρ€Ρ†ΠΈΠ½ΠΎΠΌΡ‹ ΠΏΡ€ΠΎΡ‚ΠΎΠΊΠΈ, Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ распространСнной Ρ„ΠΎΡ€ΠΌΡ‹ Ρ€Π°ΠΊΠ° ΠΌΠΎΠ»ΠΎΡ‡Π½ΠΎΠΉ ΠΆΠ΅Π»Π΅Π·Ρ‹. Он развиваСтся Π² ΠΌΠΎΠ»ΠΎΡ‡Π½Ρ‹Ρ… ΠΏΡ€ΠΎΡ‚ΠΎΠΊΠ°Ρ…, ΠΏΡ€ΠΎΠ½ΠΈΠΊΠ°ΡŽΡ‰Π΅ΠΌ Π² Π²ΠΎΠ»ΠΎΠΊΠ½ΠΈΡΡ‚ΡƒΡŽ ΠΈΠ»ΠΈ ΠΆΠΈΡ€Π½ΡƒΡŽ Ρ‚ΠΊΠ°Π½ΡŒ ΠΌΠΎΠ»ΠΎΡ‡Π½ΠΎΠΉ ΠΆΠ΅Π»Π΅Π·Ρ‹ снаруТи ΠΏΡ€ΠΎΡ‚ΠΎΠΊΠ°. Π’ этой ΠΈΠ΄Π΅Π΅ Π½Π°ΡƒΡ‡Π½ΠΎΠ³ΠΎ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° ΠΏΠΎ сбору Π΄Π°Π½Π½Ρ‹Ρ… ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Deep Learning ΠΈ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ Keras для классификации.

Π―Π·Ρ‹ΠΊ: Python

Набор Π΄Π°Π½Π½Ρ‹Ρ…/ΠŸΠ°ΠΊΠ΅Ρ‚: IDC_regular

14. Traffic Signs Recognition (РаспознаваниС Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ²)

ДостиТСниС точности Π² Ρ‚Π΅Ρ…Π½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ воТдСния автомобиля с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° Data Science ΠΏΠΎ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Π²Π°Π½ΠΈΡŽ Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ² с использованиСм CNN с ΠΎΡ‚ΠΊΡ€Ρ‹Ρ‚Ρ‹ΠΌ исходным ΠΊΠΎΠ΄ΠΎΠΌ.

14 open-source ΠΏΡ€ΠΎΠ΅ΠΊΡ‚ΠΎΠ² для ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΊΠΈ Data Science мастСрства (easy, normal, hard)

Π”ΠΎΡ€ΠΎΠΆΠ½Ρ‹Π΅ Π·Π½Π°ΠΊΠΈ ΠΈ ΠΏΡ€Π°Π²ΠΈΠ»Π° Π΄ΠΎΡ€ΠΎΠΆΠ½ΠΎΠ³ΠΎ двиТСния ΠΎΡ‡Π΅Π½ΡŒ Π²Π°ΠΆΠ½Ρ‹ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ водитСля, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΈΠ·Π±Π΅ΠΆΠ°Ρ‚ΡŒ нСсчастных случаСв. Π§Ρ‚ΠΎΠ±Ρ‹ ΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€Π°Π²ΠΈΠ»Ρƒ, сначала Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΡΡ‚ΡŒ, ΠΊΠ°ΠΊ выглядит Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹ΠΉ Π·Π½Π°ΠΊ. Π§Π΅Π»ΠΎΠ²Π΅ΠΊ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π²Ρ‹ΡƒΡ‡ΠΈΡ‚ΡŒ всС Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Π΅ Π·Π½Π°ΠΊΠΈ, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ Π΅ΠΌΡƒ Π΄Π°Π΄ΡƒΡ‚ ΠΏΡ€Π°Π²Π° Π½Π° ΡƒΠΏΡ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π»ΡŽΠ±Ρ‹ΠΌ транспортным срСдством. Но сСйчас количСство Π°Π²Ρ‚ΠΎΠ½ΠΎΠΌΠ½Ρ‹Ρ… транспортных срСдств растСт, ΠΈ Π² блиТайшСм Π±ΡƒΠ΄ΡƒΡ‰Π΅ΠΌ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ ΡƒΠΆΠ΅ Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ машиной. Π’ ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π΅ «РаспознаваниС Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ²Β» Π²Ρ‹ ΡƒΠ·Π½Π°Π΅Ρ‚Π΅, ΠΊΠ°ΠΊ ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠΌΠ° ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°ΡΠΏΠΎΠ·Π½Π°Ρ‚ΡŒ Ρ‚ΠΈΠΏ Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ², принимая ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ Π² качСствС Π²Ρ…ΠΎΠ΄Π½ΠΎΠ³ΠΎ сигнала. Набор ΠΊΠΎΠ½Ρ‚Ρ€ΠΎΠ»ΡŒΠ½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ… распознавания Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹Ρ… Π·Π½Π°ΠΊΠΎΠ² Π“Π΅Ρ€ΠΌΠ°Π½ΠΈΠΈ (GTSRB) ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для построСния Π³Π»ΡƒΠ±ΠΎΠΊΠΎΠΉ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти для распознавания класса, ΠΊ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΌΡƒ относится Π΄ΠΎΡ€ΠΎΠΆΠ½Ρ‹ΠΉ Π·Π½Π°ΠΊ. ΠœΡ‹ Ρ‚Π°ΠΊΠΆΠ΅ создаСм простой графичСский интСрфСйс для взаимодСйствия с ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅ΠΌ.

Π―Π·Ρ‹ΠΊ: Python

Набор Π΄Π°Π½Π½Ρ‹Ρ…: GTSRB (German Traffic Sign Recognition Benchmark)

Π§ΠΈΡ‚Π°Ρ‚ΡŒ Π΅Ρ‰Ρ‘

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: habr.com