14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Data Science per i principianti

1. Analisi di Sentiment (Analisi di Sentiment through Text)

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Scuprite l'implementazione cumpleta di u prughjettu di Data Science utilizendu u codice fonte - Prughjettu di analisi di sentimenti in R.

L'analisi di sentimentu hè l'analisi di e parolle per determinà sentimenti è opinioni, chì ponu esse pusitivi o negativi. Questu hè un tipu di classificazione in quale e classi ponu esse binari (pusitivi è negativi) o plurali (felici, arrabbiati, tristi, brutti...). Implementaremu stu prughjettu di Data Science in R è aduprà u dataset in u pacchettu "janeaustenR". Adupremu dizziunarii di u scopu generale cum'è AFINN, bing è loughran, eseguisce una unione interna, è à a fine creeremu una nuvola di parolle per vede u risultatu.

Язык: R
Dataset/Package: janeausten R

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

L'articulu hè statu traduttu cù u sustegnu di EDISON Software, chì crea camerini virtuali per i magazzini multimarca, cum'è ancu teste di u software.

2. Detezzione di Fake News

Pigliate e vostre cumpetenze à u prossimu livellu travagliendu in un prughjettu di Data Science per i principianti - detectà nutizie false cù Python.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

A falsa nutizia hè una falsa informazione diffusa per mezu di e social media è altri media in linea per ottene scopi pulitichi. In questa idea di prughjettu di Data Science, useremu Python per custruisce un mudellu chì pò determinà accuratamente se una notizia hè vera o falsa. Creemu un TfidfVectorizer è aduprà un PassiveAggressiveClassifier per classificà a nutizia in "reale" è "falsa". Avemu aduprà un dataset di a forma 7796 × 4 è eseguisce tuttu in Jupyter Lab.

Язык: pitone

Dataset/Package: nutizie.csv

3. Detecting Parkinson's Disease

Avanzate cù a vostra idea di prughjettu di scienza di dati - detectà a malatia di Parkinson cù XGBoost.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Avemu cuminciatu à aduprà Data Science per migliurà l'assistenza sanitaria è i servizii - se pudemu predichendu una malatia in una fase iniziale, allora averemu assai vantaghji. Dunque, in questa idea di prughjettu di Data Science, ampararemu cumu detectà a malatia di Parkinson cù Python. Hè una malatia neurodegenerativa, progressiva di u sistema nervu cintrali chì affetta u muvimentu è provoca tremore è rigidità. Affetta i neuroni chì producenu dopamina in u cervellu, è ogni annu, affetta più di 1 milione di persone in India.

Язык: pitone

Dataset/Package: UCI ML Parkinsons dataset

Prughjetti di Data Science di media cumplessità

4. Ricunniscenza di l'emozioni di parlà

Scuprite l'implementazione cumpleta di u prughjettu di esempiu Data Science - ricunniscenza di parlà cù Librosa.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Andemu avà amparà à aduprà diverse biblioteche. Stu prughjettu di Data Science usa librosa per a ricunniscenza vocale. SER hè u prucessu di identificà l'emozioni umani è i stati affettivi da a parolla. Siccomu usemu u tonu è u tonu per sprimà l'emozioni cù e nostre voci, SER hè pertinente. Ma postu chì l'emozioni sò subjective, l'annotazione audio hè un compitu sfida. Useremu e funzioni mfcc, chroma è mel è aduprà u dataset RAVDESS per a ricunniscenza di l'emozioni. Creemu un classificatore MLPC per stu mudellu.

Язык: pitone

Dataset/Package: RAVDESS dataset

5. Detection di sessu è età

Impressate l'impiegatori cù l'ultimu prughjettu di Data Science - determinazione di sessu è età cù OpenCV.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Questu hè un interessante Data Science cù Python. Utilizendu una sola maghjina, amparate à predichendu u sessu è l'età di una persona. In questu vi presenteremu à Computer Vision è i so principii. Custruiremu rete neurale cunvoluzionale è aduprà mudelli furmati da Tal Hassner è Gil Levy nantu à u dataset Adience. À a strada avemu aduprà qualchi schedari .pb, .pbtxt, .prototxt è .caffemodel.

Язык: pitone

Dataset/Package: Adienza

6. Uber Analysis Dati

Scuprite l'implementazione cumpleta di u prughjettu di Data Science cù u codice fonte - Prughjettu di analisi di dati Uber in R.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Questu hè un prughjettu di visualizazione di dati cù ggplot2 in quale useremu R è e so librerie è analizà diversi parametri. Adupremu u set di dati Uber Pickups New York City è creeremu visualizazioni per diverse cornici di l'annu. Questu ci dice cumu u tempu impacta u viaghju di i clienti.

Язык: R

Dataset/Package: Uber Pickups in New York City Dataset

7. Driver Drowsiness deteczione

Migliurate e vostre cumpetenze travagliendu in u Top Data Science Project - sistema di rilevazione di sonnolenza cù OpenCV & Keras.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

A guida sonnole hè estremamente periculosa, è quasi mille accidenti si verificanu ogni annu per via di i cunduttori chì si addormentanu mentre guidanu. In questu prughjettu di Python, creeremu un sistema chì pò detectà i cunduttori di sonnu è ancu avvisà cù un signalu audio.

Stu prughjettu hè implementatu cù Keras è OpenCV. Useremu OpenCV per a rilevazione di a faccia è l'ochji è cù Keras classificà u statu di l'ochju (Apertu o Chiusu) utilizendu tecniche di rete neurale profonda.

8. Chatbot

Crea un Chatbot cù Python è fate un passu avanti in a vostra carriera - Chatbot cù NLTK è Keras.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

I chatbots sò una parte integrante di l'affari. Parechje imprese anu da offre servizii à i so clienti è ci vole assai forza, tempu è sforzu per serve. I Chatbots ponu automatizà assai di a vostra interazzione cù i clienti rispondendu à alcune dumande cumuni chì i clienti facenu. Ci sò basicamente dui tipi di chatbots: Domain-specific è Open-domain. Un chatbot specificu di u duminiu hè spessu usatu per risolve un prublema specificu. Dunque, avete bisognu di persunalizà per travaglià in modu efficace in u vostru campu. I chatbots di duminiu apertu ponu esse dumandati à qualsiasi quistione, cusì a furmazione richiede una quantità enorme di dati.

Set di dati: Intens file json

Язык: pitone

Prughjetti avanzati di Data Science

9. Image Caption Generator

Verificate l'implementazione cumpleta di u prugettu cù u codice fonte - Image Caption Generator cù CNN è LSTM.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

A descrizzione di ciò chì hè in una maghjina hè un compitu faciule per l'omu, ma per l'urdinatore, una maghjina hè solu una seria di numeri chì rapprisentanu u valore di culore di ogni pixel. Questu hè un compitu difficiule per l'urdinatori. Capisce ciò chì hè in una maghjina è poi creà una descrizzione in lingua naturale (cum'è l'inglese) hè un altru compitu difficiule. Stu prughjettu usa tecniche di apprendimentu prufonda in quale implementemu una Rete Neurale Convoluzionale (CNN) cù una Rete Neurale Recurrente (LSTM) per creà un generatore di descrizzione di l'imagine.

Set di dati: Flickr 8K

Язык: pitone

Quadru: Keras

10. Rilevazione di fraude di carta di creditu

Fate u vostru megliu mentre travagliate nantu à a vostra idea di prughjettu di Data Science − detectà a frode di a carta di creditu utilizendu l'apprendimentu automaticu.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Avà avete principiatu à capisce e tecniche è cuncetti. Passemu à qualchi prughjetti avanzati di scienza di dati. In questu prughjettu useremu a lingua R cù algoritmi cum'è arburi di decisione, regressione logistica, reti neurali artificiali è classificatore di spinta di gradiente. Adupremu un inseme di dati di transazzione di carte per classificà e transazzione di carte di creditu cum'è fraudulente o genuine. Selezziemu diversi mudelli per elli è custruiscenu curve di rendiment.

Язык: R

Dataset/Package: Inseme di dati di transazzione di carte

11. Film Recommendation System

Studià l'implementazione di u megliu prughjettu di Data Science cù u codice Source - Sistema di raccomandazione di film in lingua R

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

In questu prughjettu di Data Science, useremu R per implementà e raccomandazioni di u filmu attraversu l'apprendimentu di macchina. U sistema di ricunniscenza manda suggerimenti à l'utilizatori attraversu un prucessu di filtrazione basatu nantu à e preferenze di l'altri utilizatori è a storia di navigazione. Se A è B piace Home Alone, è B li piace Mean Girls, allora pudete suggerisce A - puderia piace ancu. Questu permette à i clienti di interagisce cù a piattaforma.

Язык: R

Dataset/Package: Set di dati MovieLens

12. Segmentazione di i Clienti

Impressate l'impiegatori cù un prughjettu di Data Science (cumpresu u codice fonte) - Segmentazione di i clienti usendu machine learning.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

A segmentazione di u cumpratore hè una applicazione populari apprendimentu senza supervisione. Utilizendu u clustering, l'imprese identificanu i segmenti di i clienti per indirizzà una basa d'utilizatori potenziali. Dividenu i clienti in gruppi secondu e caratteristiche cumuni cum'è u sessu, l'età, l'interessi è l'abitudini di spesa in modu chì ponu effittivamenti cummercializà i so prudutti à ogni gruppu. Avemu aduprà K-significa clustering, è ancu visualizà a distribuzione per sessu è età. Dopu analizzeremu i so livelli annuali di ingressu è spesa.

Язык: R

Dataset/Package: Mall_Customers dataset

13. Classificazione di u cancer di u senu

Scuprite l'implementazione cumpleta di un prughjettu di Data Science in Python - Classificazione di u cancer di u senu utilizendu l'apprendimentu prufondu.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

Riturnendu à a cuntribuzione medica di a scienza di i dati, imparemu à detectà u cancer di u senu cù Python. Useremu u dataset IDC_regular per identificà u carcinoma ductal invasive, a forma più cumuna di cancru di mama. Si sviluppa in i dutti di latti, scavando in u tessulu fibru o grassu fora di u duct. In questa idea di prughjettu di scienza di cullizzioni di dati avemu aduprà Deep Learning è a biblioteca Keras per a classificazione.

Язык: pitone

Dataset/Package: IDC_regular

14. Ricunniscenza di i segni di trafficu

Ottene precisione in a tecnulugia d'autoguida cù u prughjettu di Data Science ricunniscenza di i segni di trafficu cù CNN fonte aperta.

14 prughjetti open-source per migliurà e cumpetenze di Data Science (faciule, normale, duru)

I signali stradali è e regule di trafficu sò assai impurtanti per ogni cunduttore per evità accidenti. Per seguità a regula, avete prima bisognu di capisce ciò chì pare un segnu stradale. Una persona deve amparà tutti i segni stradali prima di dà a licenza per guidà ogni veiculu. Ma avà u numeru di veiculi autònumi hè in crescita, è in un futuru vicinu una persona ùn hà più guidà una vittura indipindente. In u prughjettu Road Sign Recognition, vi amparà cumu un prugrammu pò ricunnosce u tipu di signali stradale pigghiannu un imagine comu input. L'inseme di dati di u Benchmark di Ricunniscenza di Segnale di Traffico Tedesco (GTSRB) hè utilizatu per custruisce una rete neurale profonda per ricunnosce a classa à quale appartene un segnu di trafficu. Creemu ancu una GUI simplice per interagisce cù l'applicazione.

Язык: pitone

Set di dati: GTSRB (benchmark tedesca di ricunniscenza di i segni di trafficu)

Leghjite più

Source: www.habr.com

Add a comment