14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Datuma Scienco por Komencantoj

1. Analizo de Sentoj (Analizo de Sentoj per Teksto)

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Rigardu la kompletan realigon de la projekto de Data Science uzante fontkodon − Projekto de Analizo de Sentoj en R.

Analizo de Sentoj estas la analizo de vortoj por determini sentojn kaj opiniojn, kiuj povas esti pozitivaj aŭ negativaj. Tio estas speco de klasifiko en kiu klasoj povas esti binaraj (pozitivaj kaj negativaj) aŭ pluralaj (feliĉa, kolera, malĝoja, aĉa...). Ni efektivigos ĉi tiun datuman projekton en R kaj uzos la datumaron en la pako "janeaustenR". Ni uzos ĝeneraluzeblajn vortarojn kiel AFINN, bing kaj loughran, faros internan kunigon, kaj fine ni kreos vortnubon por montri la rezulton.

Язык: R
Datumaro/Pako: janeaustenR

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

La artikolo estis tradukita kun la subteno de EDISON Software, kiu faras virtualajn vestoĉambrojn por plurmarkaj vendejojKaj testas programaron.

2. Detekto de Falsaj Novaĵoj

Prenu viajn kapablojn al la sekva nivelo laborante pri Data Science projekto por komencantoj - detektante falsajn novaĵojn per Python.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Falsaj novaĵoj estas falsaj informoj disvastigitaj per sociaj amaskomunikiloj kaj aliaj interretaj amaskomunikiloj por atingi politikajn celojn. En ĉi tiu ideo pri Data Science, ni uzos Python por konstrui modelon, kiu povas precize determini ĉu novaĵo estas reala aŭ falsa. Ni kreos TfidfVectorizer kaj uzos PassiveAggressiveClassifier por klasifiki novaĵojn en "reala" kaj "falsa". Ni uzos datumaron de la formo 7796×4 kaj funkcios ĉion en Jupyter Lab.

Язык: python

Datumaro/Pako: novaĵoj.csv

3. Detektante Parkinson-malsanon

Antaŭeniru vian Ideon pri Datuma Scienca Projekto - detektante Parkinson-malsanon uzante XGBoost.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Ni komencis uzi Data Science por plibonigi sanservon kaj servojn - se ni povas antaŭdiri malsanon en frua etapo, tiam ni havos multajn avantaĝojn. Do, en ĉi tiu ideo pri Data Science, ni lernos kiel detekti Parkinson-malsanon uzante Python. Ĝi estas neŭrodegenera, progresema malsano de la centra nervosistemo, kiu influas movadon kaj kaŭzas tremojn kaj rigidecon. Ĝi influas dopamin-produktantajn neŭronojn en la cerbo, kaj ĉiujare ĝi influas pli ol 1 milionon da homoj en Barato.

Язык: python

Datumaro/Pako: UCI ML Parkinson-datumserio

Datenscienco-projektoj de meza komplekseco

4. Parola Emocia Rekono

Rigardu la kompletan efektivigon de la ekzempla projekto de Data Science − parolrekono uzante Librosa.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Ni nun lernu kiel uzi malsamajn bibliotekojn. Ĉi tiu Data Science-projekto uzas libron por parolrekono. SER estas la procezo de identigado de homaj emocioj kaj afekciaj statoj de parolado. Ĉar ni uzas tonon kaj tonalton por esprimi emocion per niaj voĉoj, SER gravas. Sed ĉar emocioj estas subjektivaj, aŭda komentario estas malfacila tasko. Ni uzos funkciojn mfcc, chroma kaj mel kaj uzos la RAVDESS-datumaron por emocia rekono. Ni kreos MLPC-klasigilon por ĉi tiu modelo.

Язык: python

Datumaro/Pako: RAVDESS-datumaro

5. Sekso kaj Aĝo-Detektado

Impresu dungantojn per la plej nova Data Science-projekto - determini sekson kaj aĝon uzante OpenCV.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Ĉi tio estas interesa Datuma Scienco kun Python. Uzante nur unu bildon, vi lernos antaŭdiri la sekson kaj aĝon de homo. En ĉi tio ni prezentos vin al Komputila Vizio kaj ĝiaj principoj. Ni konstruos konvolucia neŭrala reto kaj uzos modelojn trejnitajn de Tal Hassner kaj Gil Levy sur la datumaro Adience. Survoje ni uzos kelkajn dosierojn .pb, .pbtxt, .prototxt kaj .caffemodel.

Язык: python

Datumaro/Pako: Adienco

6. Analizo de datumoj de Uber

Rigardu la kompletan realigon de la projekto pri Data Science kun fontkodo − Projekto de Analizo de Datumoj de Uber en R.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Ĉi tio estas projekto pri datuma bildigo kun ggplot2, en kiu ni uzos R kaj ĝiajn bibliotekojn kaj analizos diversajn parametrojn. Ni uzos la Uber Pickups Novjorkan datumaron kaj kreos bildigojn por malsamaj tempokadroj de la jaro. Ĉi tio rakontas al ni kiel tempo influas klientvojaĝadon.

Язык: R

Datumaro/Pako: Uber Pickups en Novjorka datumaro

7. Ŝoforo Dormemo detekto

Plibonigu viajn kapablojn laborante en la Supra Datuma Scienca Projekto - sistemo de detektado de dormemo kun OpenCV & Keras.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Dormema veturado estas ekstreme danĝera, kaj preskaŭ mil akcidentoj okazas ĉiujare pro ŝoforoj endormiĝantaj dum veturado. En ĉi tiu Python-projekto, ni kreos sistemon, kiu povas detekti dormemajn ŝoforojn kaj ankaŭ atentigi ilin per sonsignalo.

Ĉi tiu projekto estas efektivigita uzante Keras kaj OpenCV. Ni uzos OpenCV por vizaĝo kaj okulo-detekto kaj kun Keras ni klasifikos la okulstaton (Malfermita aŭ Fermita) uzante profundajn neŭralajn retajn teknikojn.

8. Babilejo

Kreu Chatbot kun Python kaj faru paŝon antaŭen en via kariero - Chatbot kun NLTK & Keras.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Chatbots estas integra parto de komerco. Multaj entreprenoj devas oferti servojn al siaj klientoj kaj necesas multe da laborforto, tempo kaj peno por servi ilin. Chatbots povas aŭtomatigi grandan parton de via klienta interago respondante iujn oftajn demandojn, kiujn la klientoj demandas. Estas esence du specoj de babilrotoj: Domajn-specifa kaj Malferma-domajno. Domajn-specifa babilejo ofte estas uzata por solvi specifan problemon. Do, vi devas personecigi ĝin por labori efike en via kampo. Malfermaj domajnaj babilrotoj povas esti demanditaj, do trejni ilin postulas grandegan kvanton da datumoj.

Datenaro: Intents json dosiero

Язык: python

Projektoj de Altnivelaj Sciencaj Datumoj

9. Bilda Titolo Generatoro

Rigardu la kompletan efektivigon de la projekto per fontkodo − Bilda Caption Generator kun CNN & LSTM.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Priskribi kio estas en bildo estas facila tasko por homoj, sed por komputiloj, bildo estas simple serio de nombroj kiuj reprezentas la kolorvaloron de ĉiu pikselo. Ĉi tio estas malfacila tasko por komputiloj. Kompreni kio estas en bildo kaj poste krei priskribon en natura lingvo (kiel la angla) estas alia malfacila tasko. Ĉi tiu projekto uzas profundajn lernajn teknikojn, en kiuj ni efektivigas Konvolucian Neŭralan Reton (CNN) kun Ripetiĝanta Neŭrala Reto (LSTM) por krei bildan priskribgeneratoron.

Datenaro: Flickr 8K

Язык: python

Kadro: Keras

10. Kreditkarta Fraŭdo-Detekto

Faru vian plej bonan dum vi laboras pri via Data Science projektideo − detekti kreditkartfraŭdon uzante maŝinlernadon.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Nun vi komencis kompreni la teknikojn kaj konceptojn. Ni pluiru al iuj altnivelaj datumsciencoprojektoj. En ĉi tiu projekto ni uzos R-lingvon kun algoritmoj kiel decidaj arboj, loĝistika regreso, artefaritaj neŭralaj retoj kaj gradienta akcela klasigilo. Ni uzos datumaron de karttransakcioj por klasifiki kreditkartajn transakciojn kiel fraŭdajn aŭ aŭtentajn. Ni elektos malsamajn modelojn por ili kaj konstruos rendimentajn kurbojn.

Язык: R

Datumaro/Pako: Datenaro pri Kartaj Transakcioj

11. Filma Rekomenda Sistemo

Studu la efektivigon de la plej bona Data Science-projekto kun Fontkodo - Filma Rekomenda Sistemo en R-lingvo

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

En ĉi tiu Data Science-projekto, ni uzos R por efektivigi la rekomendojn de la filmo per maŝina lernado. La rekomendsistemo sendas sugestojn al uzantoj per filtra procezo bazita sur la preferoj kaj foliumhistorio de aliaj uzantoj. Se A kaj B ŝatas Hejme Sole, kaj B ŝatas Malbonajn Knabinojn, tiam vi povas sugesti A - eble ankaŭ al ili ŝatos. Ĉi tio permesas al klientoj interagi kun la platformo.

Язык: R

Datumaro/Pako: Datenserio de MovieLens

12. Klienta Segmentado

Impresu dungantojn per Data Science-projekto (inkluzive de fontkodo) - Segmentado de klientoj uzante maŝinlernadon.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Aĉetantsegmentado estas populara aplikaĵo nekontrolita lernado. Uzante clustering, firmaoj identigas klientsegmentojn por celi eblan uzantbazon. Ili dividas klientojn en grupojn laŭ komunaj trajtoj kiel sekso, aĝo, interesoj kaj elspezkutimoj por ke ili efike povu surmerkatigi siajn produktojn al ĉiu grupo. Ni uzos K-signifas amasiĝo, kaj ankaŭ bildigi la distribuon laŭ sekso kaj aĝo. Ni tiam analizos iliajn jarajn enspezojn kaj elspezajn nivelojn.

Язык: R

Datumaro/Pako: Mall_Customers datumaro

13. Klasifiko de Mama Kancero

Rigardu la kompletan efektivigon de Data Science-projekto en Python − Klasifiko de mamkancero uzante profundan lernadon.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Revenante al la medicina kontribuo de datumscienco, ni lernu kiel detekti maman kanceron per Python. Ni uzos la IDC_regular-datumaron por identigi enpenetran duktan karcinomon, la plej oftan formon de mama kancero. Ĝi disvolvas en la laktoduktoj, truante en la fibron aŭ grasan brustan histon ekster la dukto. En ĉi tiu ideo pri scienca projekto ni uzos Profunda Lernado kaj la Keras-biblioteko por klasifiko.

Язык: python

Datumaro/Pako: IDC_regula

14. Rekono de Trafiksignoj

Atingante precizecon en memvetura teknologio kun Data Science projekto trafiksignaj rekono uzante CNN malferma fonto.

14 malfermfontaj projektoj por plibonigi datumojn pri kapabloj (facilaj, normalaj, malfacilaj)

Vojsignoj kaj trafikreguloj estas tre gravaj por ĉiu ŝoforo por eviti akcidentojn. Por sekvi la regulon, vi unue devas kompreni kiel aspektas vojsigno. Homo devas lerni ĉiujn vojsignojn antaŭ ol li ricevas la permesilon por stiri ajnan veturilon. Sed nun la nombro da aŭtonomaj veturiloj kreskas, kaj en proksima estonteco homo ne plu veturos aŭtomobilon sendepende. En la projekto Rekono de Vojaj Signoj, vi lernos kiel programo povas rekoni la specon de vojsignoj prenante bildon kiel enigaĵon. La germana Traffic Sign Recognition Benchmark (GTSRB) datumaro estas uzata por konstrui profundan neŭralan reton por rekoni la klason al kiu apartenas trafiksigno. Ni ankaŭ kreas simplan GUI por interagi kun la aplikaĵo.

Язык: python

Datenaro: GTSRB (Germana Rekono de Rekono de TrafikSigno)

Legu pli

fonto: www.habr.com

Aldoni komenton