L'analisi di sentimentu hè l'analisi di e parolle per determinà sentimenti è opinioni, chì ponu esse pusitivi o negativi. Questu hè un tipu di classificazione in quale e classi ponu esse binari (pusitivi è negativi) o plurali (felici, arrabbiati, tristi, brutti...). Implementaremu stu prughjettu di Data Science in R è aduprà u dataset in u pacchettu "janeaustenR". Adupremu dizziunarii di u scopu generale cum'è AFINN, bing è loughran, eseguisce una unione interna, è à a fine creeremu una nuvola di parolle per vede u risultatu.
Pigliate e vostre cumpetenze à u prossimu livellu travagliendu in un prughjettu di Data Science per i principianti - detectà nutizie false cù Python.
A falsa nutizia hè una falsa informazione diffusa per mezu di e social media è altri media in linea per ottene scopi pulitichi. In questa idea di prughjettu di Data Science, useremu Python per custruisce un mudellu chì pò determinà accuratamente se una notizia hè vera o falsa. Creemu un TfidfVectorizer è aduprà un PassiveAggressiveClassifier per classificà a nutizia in "reale" è "falsa". Avemu aduprà un dataset di a forma 7796 × 4 è eseguisce tuttu in Jupyter Lab.
Avemu cuminciatu à aduprà Data Science per migliurà l'assistenza sanitaria è i servizii - se pudemu predichendu una malatia in una fase iniziale, allora averemu assai vantaghji. Dunque, in questa idea di prughjettu di Data Science, ampararemu cumu detectà a malatia di Parkinson cù Python. Hè una malatia neurodegenerativa, progressiva di u sistema nervu cintrali chì affetta u muvimentu è provoca tremore è rigidità. Affetta i neuroni chì producenu dopamina in u cervellu, è ogni annu, affetta più di 1 milione di persone in India.
Andemu avà amparà à aduprà diverse biblioteche. Stu prughjettu di Data Science usa librosa per a ricunniscenza vocale. SER hè u prucessu di identificà l'emozioni umani è i stati affettivi da a parolla. Siccomu usemu u tonu è u tonu per sprimà l'emozioni cù e nostre voci, SER hè pertinente. Ma postu chì l'emozioni sò subjective, l'annotazione audio hè un compitu sfida. Useremu e funzioni mfcc, chroma è mel è aduprà u dataset RAVDESS per a ricunniscenza di l'emozioni. Creemu un classificatore MLPC per stu mudellu.
Questu hè un interessante Data Science cù Python. Utilizendu una sola maghjina, amparate à predichendu u sessu è l'età di una persona. In questu vi presenteremu à Computer Vision è i so principii. Custruiremu rete neurale cunvoluzionale è aduprà mudelli furmati da Tal Hassner è Gil Levy nantu à u dataset Adience. À a strada avemu aduprà qualchi schedari .pb, .pbtxt, .prototxt è .caffemodel.
Questu hè un prughjettu di visualizazione di dati cù ggplot2 in quale useremu R è e so librerie è analizà diversi parametri. Adupremu u set di dati Uber Pickups New York City è creeremu visualizazioni per diverse cornici di l'annu. Questu ci dice cumu u tempu impacta u viaghju di i clienti.
Язык: R
Dataset/Package: Uber Pickups in New York City Dataset
A guida sonnole hè estremamente periculosa, è quasi mille accidenti si verificanu ogni annu per via di i cunduttori chì si addormentanu mentre guidanu. In questu prughjettu di Python, creeremu un sistema chì pò detectà i cunduttori di sonnu è ancu avvisà cù un signalu audio.
Stu prughjettu hè implementatu cù Keras è OpenCV. Useremu OpenCV per a rilevazione di a faccia è l'ochji è cù Keras classificà u statu di l'ochju (Apertu o Chiusu) utilizendu tecniche di rete neurale profonda.
8. Chatbot
Crea un Chatbot cù Python è fate un passu avanti in a vostra carriera - Chatbot cù NLTK è Keras.
I chatbots sò una parte integrante di l'affari. Parechje imprese anu da offre servizii à i so clienti è ci vole assai forza, tempu è sforzu per serve. I Chatbots ponu automatizà assai di a vostra interazzione cù i clienti rispondendu à alcune dumande cumuni chì i clienti facenu. Ci sò basicamente dui tipi di chatbots: Domain-specific è Open-domain. Un chatbot specificu di u duminiu hè spessu usatu per risolve un prublema specificu. Dunque, avete bisognu di persunalizà per travaglià in modu efficace in u vostru campu. I chatbots di duminiu apertu ponu esse dumandati à qualsiasi quistione, cusì a furmazione richiede una quantità enorme di dati.
A descrizzione di ciò chì hè in una maghjina hè un compitu faciule per l'omu, ma per l'urdinatore, una maghjina hè solu una seria di numeri chì rapprisentanu u valore di culore di ogni pixel. Questu hè un compitu difficiule per l'urdinatori. Capisce ciò chì hè in una maghjina è poi creà una descrizzione in lingua naturale (cum'è l'inglese) hè un altru compitu difficiule. Stu prughjettu usa tecniche di apprendimentu prufonda in quale implementemu una Rete Neurale Convoluzionale (CNN) cù una Rete Neurale Recurrente (LSTM) per creà un generatore di descrizzione di l'imagine.
Avà avete principiatu à capisce e tecniche è cuncetti. Passemu à qualchi prughjetti avanzati di scienza di dati. In questu prughjettu useremu a lingua R cù algoritmi cum'è arburi di decisione, regressione logistica, reti neurali artificiali è classificatore di spinta di gradiente. Adupremu un inseme di dati di transazzione di carte per classificà e transazzione di carte di creditu cum'è fraudulente o genuine. Selezziemu diversi mudelli per elli è custruiscenu curve di rendiment.
Язык: R
Dataset/Package: Inseme di dati di transazzione di carte
In questu prughjettu di Data Science, useremu R per implementà e raccomandazioni di u filmu attraversu l'apprendimentu di macchina. U sistema di ricunniscenza manda suggerimenti à l'utilizatori attraversu un prucessu di filtrazione basatu nantu à e preferenze di l'altri utilizatori è a storia di navigazione. Se A è B piace Home Alone, è B li piace Mean Girls, allora pudete suggerisce A - puderia piace ancu. Questu permette à i clienti di interagisce cù a piattaforma.
A segmentazione di u cumpratore hè una applicazione populari apprendimentu senza supervisione. Utilizendu u clustering, l'imprese identificanu i segmenti di i clienti per indirizzà una basa d'utilizatori potenziali. Dividenu i clienti in gruppi secondu e caratteristiche cumuni cum'è u sessu, l'età, l'interessi è l'abitudini di spesa in modu chì ponu effittivamenti cummercializà i so prudutti à ogni gruppu. Avemu aduprà K-significa clustering, è ancu visualizà a distribuzione per sessu è età. Dopu analizzeremu i so livelli annuali di ingressu è spesa.
Riturnendu à a cuntribuzione medica di a scienza di i dati, imparemu à detectà u cancer di u senu cù Python. Useremu u dataset IDC_regular per identificà u carcinoma ductal invasive, a forma più cumuna di cancru di mama. Si sviluppa in i dutti di latti, scavando in u tessulu fibru o grassu fora di u duct. In questa idea di prughjettu di scienza di cullizzioni di dati avemu aduprà Deep Learning è a biblioteca Keras per a classificazione.
I signali stradali è e regule di trafficu sò assai impurtanti per ogni cunduttore per evità accidenti. Per seguità a regula, avete prima bisognu di capisce ciò chì pare un segnu stradale. Una persona deve amparà tutti i segni stradali prima di dà a licenza per guidà ogni veiculu. Ma avà u numeru di veiculi autònumi hè in crescita, è in un futuru vicinu una persona ùn hà più guidà una vittura indipindente. In u prughjettu Road Sign Recognition, vi amparà cumu un prugrammu pò ricunnosce u tipu di signali stradale pigghiannu un imagine comu input. L'inseme di dati di u Benchmark di Ricunniscenza di Segnale di Traffico Tedesco (GTSRB) hè utilizatu per custruisce una rete neurale profonda per ricunnosce a classa à quale appartene un segnu di trafficu. Creemu ancu una GUI simplice per interagisce cù l'applicazione.
Язык: pitone
Set di dati: GTSRB (benchmark tedesca di ricunniscenza di i segni di trafficu)