Analizo de Sentoj estas la analizo de vortoj por determini sentojn kaj opiniojn, kiuj povas esti pozitivaj aŭ negativaj. Tio estas speco de klasifiko en kiu klasoj povas esti binaraj (pozitivaj kaj negativaj) aŭ pluralaj (feliĉa, kolera, malĝoja, aĉa...). Ni efektivigos ĉi tiun datuman projekton en R kaj uzos la datumaron en la pako "janeaustenR". Ni uzos ĝeneraluzeblajn vortarojn kiel AFINN, bing kaj loughran, faros internan kunigon, kaj fine ni kreos vortnubon por montri la rezulton.
Falsaj novaĵoj estas falsaj informoj disvastigitaj per sociaj amaskomunikiloj kaj aliaj interretaj amaskomunikiloj por atingi politikajn celojn. En ĉi tiu ideo pri Data Science, ni uzos Python por konstrui modelon, kiu povas precize determini ĉu novaĵo estas reala aŭ falsa. Ni kreos TfidfVectorizer kaj uzos PassiveAggressiveClassifier por klasifiki novaĵojn en "reala" kaj "falsa". Ni uzos datumaron de la formo 7796×4 kaj funkcios ĉion en Jupyter Lab.
Ni komencis uzi Data Science por plibonigi sanservon kaj servojn - se ni povas antaŭdiri malsanon en frua etapo, tiam ni havos multajn avantaĝojn. Do, en ĉi tiu ideo pri Data Science, ni lernos kiel detekti Parkinson-malsanon uzante Python. Ĝi estas neŭrodegenera, progresema malsano de la centra nervosistemo, kiu influas movadon kaj kaŭzas tremojn kaj rigidecon. Ĝi influas dopamin-produktantajn neŭronojn en la cerbo, kaj ĉiujare ĝi influas pli ol 1 milionon da homoj en Barato.
Ni nun lernu kiel uzi malsamajn bibliotekojn. Ĉi tiu Data Science-projekto uzas libron por parolrekono. SER estas la procezo de identigado de homaj emocioj kaj afekciaj statoj de parolado. Ĉar ni uzas tonon kaj tonalton por esprimi emocion per niaj voĉoj, SER gravas. Sed ĉar emocioj estas subjektivaj, aŭda komentario estas malfacila tasko. Ni uzos funkciojn mfcc, chroma kaj mel kaj uzos la RAVDESS-datumaron por emocia rekono. Ni kreos MLPC-klasigilon por ĉi tiu modelo.
Ĉi tio estas interesa Datuma Scienco kun Python. Uzante nur unu bildon, vi lernos antaŭdiri la sekson kaj aĝon de homo. En ĉi tio ni prezentos vin al Komputila Vizio kaj ĝiaj principoj. Ni konstruos konvolucia neŭrala reto kaj uzos modelojn trejnitajn de Tal Hassner kaj Gil Levy sur la datumaro Adience. Survoje ni uzos kelkajn dosierojn .pb, .pbtxt, .prototxt kaj .caffemodel.
Ĉi tio estas projekto pri datuma bildigo kun ggplot2, en kiu ni uzos R kaj ĝiajn bibliotekojn kaj analizos diversajn parametrojn. Ni uzos la Uber Pickups Novjorkan datumaron kaj kreos bildigojn por malsamaj tempokadroj de la jaro. Ĉi tio rakontas al ni kiel tempo influas klientvojaĝadon.
Dormema veturado estas ekstreme danĝera, kaj preskaŭ mil akcidentoj okazas ĉiujare pro ŝoforoj endormiĝantaj dum veturado. En ĉi tiu Python-projekto, ni kreos sistemon, kiu povas detekti dormemajn ŝoforojn kaj ankaŭ atentigi ilin per sonsignalo.
Ĉi tiu projekto estas efektivigita uzante Keras kaj OpenCV. Ni uzos OpenCV por vizaĝo kaj okulo-detekto kaj kun Keras ni klasifikos la okulstaton (Malfermita aŭ Fermita) uzante profundajn neŭralajn retajn teknikojn.
Chatbots estas integra parto de komerco. Multaj entreprenoj devas oferti servojn al siaj klientoj kaj necesas multe da laborforto, tempo kaj peno por servi ilin. Chatbots povas aŭtomatigi grandan parton de via klienta interago respondante iujn oftajn demandojn, kiujn la klientoj demandas. Estas esence du specoj de babilrotoj: Domajn-specifa kaj Malferma-domajno. Domajn-specifa babilejo ofte estas uzata por solvi specifan problemon. Do, vi devas personecigi ĝin por labori efike en via kampo. Malfermaj domajnaj babilrotoj povas esti demanditaj, do trejni ilin postulas grandegan kvanton da datumoj.
Priskribi kio estas en bildo estas facila tasko por homoj, sed por komputiloj, bildo estas simple serio de nombroj kiuj reprezentas la kolorvaloron de ĉiu pikselo. Ĉi tio estas malfacila tasko por komputiloj. Kompreni kio estas en bildo kaj poste krei priskribon en natura lingvo (kiel la angla) estas alia malfacila tasko. Ĉi tiu projekto uzas profundajn lernajn teknikojn, en kiuj ni efektivigas Konvolucian Neŭralan Reton (CNN) kun Ripetiĝanta Neŭrala Reto (LSTM) por krei bildan priskribgeneratoron.
Nun vi komencis kompreni la teknikojn kaj konceptojn. Ni pluiru al iuj altnivelaj datumsciencoprojektoj. En ĉi tiu projekto ni uzos R-lingvon kun algoritmoj kiel decidaj arboj, loĝistika regreso, artefaritaj neŭralaj retoj kaj gradienta akcela klasigilo. Ni uzos datumaron de karttransakcioj por klasifiki kreditkartajn transakciojn kiel fraŭdajn aŭ aŭtentajn. Ni elektos malsamajn modelojn por ili kaj konstruos rendimentajn kurbojn.
En ĉi tiu Data Science-projekto, ni uzos R por efektivigi la rekomendojn de la filmo per maŝina lernado. La rekomendsistemo sendas sugestojn al uzantoj per filtra procezo bazita sur la preferoj kaj foliumhistorio de aliaj uzantoj. Se A kaj B ŝatas Hejme Sole, kaj B ŝatas Malbonajn Knabinojn, tiam vi povas sugesti A - eble ankaŭ al ili ŝatos. Ĉi tio permesas al klientoj interagi kun la platformo.
Aĉetantsegmentado estas populara aplikaĵo nekontrolita lernado. Uzante clustering, firmaoj identigas klientsegmentojn por celi eblan uzantbazon. Ili dividas klientojn en grupojn laŭ komunaj trajtoj kiel sekso, aĝo, interesoj kaj elspezkutimoj por ke ili efike povu surmerkatigi siajn produktojn al ĉiu grupo. Ni uzos K-signifas amasiĝo, kaj ankaŭ bildigi la distribuon laŭ sekso kaj aĝo. Ni tiam analizos iliajn jarajn enspezojn kaj elspezajn nivelojn.
Revenante al la medicina kontribuo de datumscienco, ni lernu kiel detekti maman kanceron per Python. Ni uzos la IDC_regular-datumaron por identigi enpenetran duktan karcinomon, la plej oftan formon de mama kancero. Ĝi disvolvas en la laktoduktoj, truante en la fibron aŭ grasan brustan histon ekster la dukto. En ĉi tiu ideo pri scienca projekto ni uzos Profunda Lernado kaj la Keras-biblioteko por klasifiko.
Vojsignoj kaj trafikreguloj estas tre gravaj por ĉiu ŝoforo por eviti akcidentojn. Por sekvi la regulon, vi unue devas kompreni kiel aspektas vojsigno. Homo devas lerni ĉiujn vojsignojn antaŭ ol li ricevas la permesilon por stiri ajnan veturilon. Sed nun la nombro da aŭtonomaj veturiloj kreskas, kaj en proksima estonteco homo ne plu veturos aŭtomobilon sendepende. En la projekto Rekono de Vojaj Signoj, vi lernos kiel programo povas rekoni la specon de vojsignoj prenante bildon kiel enigaĵon. La germana Traffic Sign Recognition Benchmark (GTSRB) datumaro estas uzata por konstrui profundan neŭralan reton por rekoni la klason al kiu apartenas trafiksigno. Ni ankaŭ kreas simplan GUI por interagi kun la aplikaĵo.
Язык: python
Datenaro: GTSRB (Germana Rekono de Rekono de TrafikSigno)