14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Data Science fir Ufänger

1. Sentiment Analyse (Sentiment Analyse duerch Text)

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Préift déi komplett Data Science Projet Implementatioun mat Quellcode − Sentiment Analysis Project am R.

Sentiment Analyse ass d'Analyse vu Wierder fir Gefiller a Meenungen ze bestëmmen, déi positiv oder negativ kënne sinn. Dëst ass eng Zort Klassifikatioun an där Klassen binär kënne sinn (positiv an negativ) oder Plural (glécklech, rosen, traureg, béis ...). Mir wäerten dësen Data Science-Projet am R implementéieren a wäerten d'Datesaz am "janeaustenR" Package benotzen. Mir wäerten allgemeng Zweck Dictionnairen wéi AFINN, Bing a Loughran benotzen, en bannenzege Bäitrag maachen, an um Enn kreéiere mir eng Wuertwollek fir d'Resultat ze weisen.

Sprooch: R
Datenset / Package: janeausten R

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Den Artikel gouf mat der Ënnerstëtzung vun der EDISON Software iwwersat, déi mécht virtuell Passerelle fir Multi-Mark Geschäfter, wéi och Tester Software.

2. Fake News Detektioun

Huelt Är Fäegkeeten op den nächsten Niveau andeems Dir un engem Data Science Projet fir Ufänger schafft - Fake News mat Python z'entdecken.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Fake News ass falsch Informatioun iwwer sozial Medien an aner Online Medien verbreet fir politesch Ziler z'erreechen. An dëser Data Science Projet Iddi wäerte mir Python benotzen fir e Modell ze bauen deen präzis ka bestëmmen ob eng Neiegkeet wierklech oder gefälscht ass. Mir erstellen en TfidfVectorizer a benotzen e PassiveAggressiveClassifier fir Neiegkeeten an "real" a "falsch" ze klassifizéieren. Mir wäerten en Dataset vun der Form 7796 × 4 benotzen an alles am Jupyter Lab lafen.

Sprooch: Python

Datenset / Package: news.csv

3. Detektéieren Parkinson d'Krankheet

Gitt weider mat Ärer Data Science Project Iddi - d'Parkinson Krankheet erkennen mat XGBoost.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Mir hunn ugefaang Data Science ze benotzen fir d'Gesondheetsversuergung a Servicer ze verbesseren - wa mir eng Krankheet an engem fréie Stadium viraussoen, da wäerte mir vill Virdeeler hunn. Also, an dëser Data Science Projet Iddi, léiere mir wéi d'Parkinson Krankheet mat Python z'entdecken. Et ass eng neurodegenerativ, progressiv Krankheet vum Zentralnervensystem, déi d'Bewegung beaflosst an Zidderen a Steifheit verursaacht. Et beaflosst Dopamin-produzéiert Neuronen am Gehir, an all Joer beaflosst et méi wéi 1 Millioun Leit an Indien.

Sprooch: Python

Datenset / Package: UCI ML Parkinsons Dataset

Data Science Projete vu mëttlerer Komplexitéit

4. Speech Emotion Unerkennung

Kuckt déi komplett Ëmsetzung vum Data Science Beispillprojet - Sproocherkennung mat Librosa.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Loosst eis elo léieren wéi Dir verschidde Bibliothéike benotzt. Dësen Data Science Projet benotzt Librosa fir Riederkennung. SER ass de Prozess fir mënschlech Emotiounen an affektive Staaten aus Ried z'identifizéieren. Well mir Toun a Pitch benotze fir Emotiounen mat eise Stëmmen auszedrécken, ass SER relevant. Awer well Emotiounen subjektiv sinn, ass Audioannotatioun eng Erausfuerderung. Mir benotze mfcc, chroma a mel Funktiounen a benotzen d'RAVDESS Dataset fir Emotiounserkennung. Mir erstellen en MLPC Klassifizéierer fir dëse Modell.

Sprooch: Python

Datenset / Package: RAVDESS Datebank

5. Geschlecht an Alter Detektioun

Beandrockt Patronen mam leschten Data Science Projet - Bestëmmung vu Geschlecht an Alter mat OpenCV.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Dëst ass eng interessant Data Science mat Python. Mat just engem Bild léiert Dir d'Geschlecht an den Alter vun enger Persoun viraussoen. An dësem wäerte mir Iech Computer Visioun a seng Prinzipien virstellen. Mir wäerte bauen convolutional neural Netzwierk a wäert Modeller benotzen, déi vum Tal Hassner a Gil Levy op der Adience Dataset trainéiert sinn. Laanscht de Wee wäerte mir e puer .pb benotzen, .pbtxt, .prototxt an .caffemodel Fichieren.

Sprooch: Python

Datenset / Package: Adience

6. Uber Data Analyse

Kuckt déi komplett Data Science Projet Implementatioun mat Quellcode - Uber Data Analysis Project zu R.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Dëst ass en Datevisualiséierungsprojet mat ggplot2 an deem mir R a seng Bibliothéike benotze a verschidde Parameteren analyséieren. Mir benotze den Uber Pickups New York City Dataset a kreéieren Visualiséierunge fir verschidden Zäitframe vum Joer. Dëst seet eis wéi d'Zäit d'Clientreesen beaflosst.

Sprooch: R

Datenset / Package: Uber Pickups zu New York City Dataset

7. Driver Schläifegkeet Detektioun

Verbessert Är Fäegkeeten andeems Dir um Top Data Science Project schafft - Schläiferkennungssystem mat OpenCV & Keras.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Drowsy Fuere ass extrem geféierlech, a bal dausend Accidenter geschéien all Joer wéinst Chauffeuren ageschlof während Fuere. An dësem Python-Projet wäerte mir e System erstellen deen schlëmmen Treiber erkennen kann an och mat engem Audiosignal alarméieren.

Dëse Projet gëtt mat Keras an OpenCV ëmgesat. Mir benotze OpenCV fir Gesiichts- an Aenerkennung a mat Keras wäerte mir den Aenzoustand (Open oder Closed) klassifizéieren mat deep neuralen Netzwierkstechniken.

8. Chatbot

Erstellt e Chatbot mam Python a maacht e Schrëtt no vir an Ärer Karriär - Chatbot mat NLTK & Keras.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Chatbots sinn en integralen Deel vum Geschäft. Vill Geschäfter mussen hir Clienten Servicer ubidden an et brauch vill Aarbecht, Zäit an Effort fir se ze déngen. Chatbots kënne vill vun Ärer Clientsinteraktioun automatiséieren andeems se e puer allgemeng Froen beäntweren déi Cliente stellen. Et gi grondsätzlech zwou Aarte vu Chatbots: Domain-spezifesch an Open-Domain. En Domain-spezifesche Chatbot gëtt dacks benotzt fir e spezifesche Problem ze léisen. Also, Dir musst et personaliséieren fir effektiv an Ärem Feld ze schaffen. Open-Domain Chatbots kënnen all Froen gestallt ginn, sou datt d'Ausbildung vun hinnen eng enorm Quantitéit un Daten erfuerdert.

Datenset: Intents json Datei

Sprooch: Python

Fortgeschratt Data Science Projeten

9. Bild Caption Generator

Kuckt déi komplett Ëmsetzung vum Projet mat Quellcode - Image Caption Generator mat CNN & LSTM.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Beschreiwen wat an engem Bild ass ass eng einfach Aufgab fir Mënschen, awer fir Computeren ass e Bild einfach eng Serie vun Zuelen déi de Faarfwäert vun all Pixel representéieren. Dëst ass eng schwéier Aufgab fir Computeren. Verstoen wat an engem Bild ass an dann eng Beschreiwung an natierlech Sprooch (wéi Englesch) schafen ass eng aner schwéier Aufgab. Dëse Projet benotzt déif Léiertechniken an deenen mir e Convolutional Neural Network (CNN) mat engem Recurrent Neural Network (LSTM) implementéieren fir e Bildbeschreiwungsgenerator ze kreéieren.

Datenset: Flickr 8K

Sprooch: Python

Kader: Keras

10. Kreditkaart Bedruch Detektioun

Maacht Äert Bescht wärend Dir un Ärer Data Science Projet Iddi schafft - detektéieren Kreditkaart Bedruch benotzt Maschinn Léieren.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Elo hutt Dir ugefaang d'Techniken a Konzepter ze verstoen. Loosst eis op e puer fortgeschratt Datewëssenschaftsprojete weidergoen. An dësem Projet benotze mir R Sprooch mat Algorithmen wéi Decisioun Beem, Logistesch Regressioun, kënschtlech neural Netzwierker a Gradient Boost Classifier. Mir benotze en Dataset vu Kaarttransaktiounen fir Kredittkaarttransaktiounen als betrügeresch oder echt ze klassifizéieren. Mir wäerte verschidde Modeller fir si wielen a Leeschtungskurven bauen.

Sprooch: R

Datenset / Package: Kaart Transaktiounen Dataset

11. Film Recommandatioun System

Studéiert d'Ëmsetzung vum beschten Data Science Projet mat Source Code - Film Recommandatioun System an R Sprooch

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

An dësem Data Science Projet benotze mir R fir d'Empfehlungen vum Film duerch Maschinnléieren ëmzesetzen. De Empfehlungssystem schéckt Suggestiounen un d'Benotzer duerch e Filterprozess baséiert op anere Benotzer hir Virléiften a Browsergeschicht. Wann A an B gär Home Alone, a B gär Mean Girls, da kënnt Dir A proposéieren - si kënnen et och gär hunn. Dëst erlaabt Clienten mat der Plattform ze interagéieren.

Sprooch: R

Datenset / Package: MovieLens Dataset

12. Client Segmentatioun

Impresséiert Patronen mat engem Data Science Projet (inklusiv Quellcode) - Client Segmentatioun mat Maschinn Léieren.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Keefer Segmentatioun ass eng populär Applikatioun onkontrolléiert Léieren. Mat Clustering identifizéieren Firmen Clientssegmenter fir eng potenziell Benotzerbasis ze zielen. Si trennen Clienten a Gruppen no gemeinsame Charakteristiken wéi Geschlecht, Alter, Interessen an Ausgabegewunnechten, sou datt se hir Produkter effektiv un all Grupp vermaart kënnen. Mir wäerten benotzen K-heescht Clustering, wéi och d'Verdeelung no Geschlecht an Alter visualiséieren. Mir analyséieren dann hir jährlech Akommes- an Ausgabenniveauen.

Sprooch: R

Datenset / Package: Mall_Customers Datesaz

13. Broscht Kriibs Klassifikatioun

Kuckt déi komplett Ëmsetzung vun engem Data Science Projet am Python - Brustkrebs Klassifikatioun mat Deep Learning.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Zréck op de medizinesche Bäitrag vun der Datewëssenschaft, loosst eis léieren wéi Broschtkriibs mat Python z'entdecken. Mir wäerten d'IDC_regular Dataset benotzen fir invasiv ductal Karzinom z'identifizéieren, déi allgemeng Form vu Brustkrebs. Et entwéckelt sech an de Mëllechkanälen, an de fibrous oder fettegen Brustgewebe ausserhalb vum Kanal gräift. An dëser Datensammlung Wëssenschaftsprojet Iddi wäerte mir benotzen Deep Learning an der Keras Bibliothéik fir Klassifikatioun.

Sprooch: Python

Datenset / Package: IDC_regulär

14. Verkéier Schëlder Unerkennung

Erreechen Präzisioun an Self-fueren Technologie mat Data Science Projet Traffic Zeechen Unerkennung mat CNN oppe Quell.

14 Open-Source Projete fir Data Science Fäegkeeten ze verbesseren (einfach, normal, schwéier)

Stroosseschëlder a Verkéiersregele si ganz wichteg fir all Chauffeur fir Accidenter ze vermeiden. Fir d'Regel ze verfollegen, musst Dir als éischt verstoen wéi e Stroosseschëld ausgesäit. Eng Persoun muss all Stroosseschëlder léieren ier hien d'Lizenz kritt fir all Gefier ze fueren. Awer elo wiisst d'Zuel vun autonomen Gefierer, an an nächster Zukunft wäert eng Persoun net méi onofhängeg en Auto fueren. Am Road Sign Recognition Projet léiert Dir wéi e Programm d'Aart vu Stroosseschëlder erkennt andeems Dir e Bild als Input hëlt. Den däitschen Traffic Sign Recognition Benchmark (GTSRB) Dataset gëtt benotzt fir en déif neuralt Netzwierk ze bauen fir d'Klass ze erkennen, zu där e Verkéiersschëld gehéiert. Mir kreéieren och eng einfach GUI fir mat der Applikatioun ze interagéieren.

Sprooch: Python

Datenset: GTSRB (German Traffic Sign Recognition Benchmark)

Liest méi

Source: will.com

Setzt e Commentaire