14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Gwyddor Data i Ddechreuwyr

1. Dadansoddi Sentiment (Dadansoddiad Sentiment trwy Destun)

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Gwiriwch weithrediad cyflawn y prosiect Gwyddor Data gan ddefnyddio cod ffynhonnell − Prosiect Dadansoddi Teimladau yn R.

Dadansoddi Sentiment yw'r dadansoddiad o eiriau i bennu teimladau a barn, a all fod yn gadarnhaol neu'n negyddol. Mae hwn yn fath o ddosbarthiad lle gall dosbarthiadau fod yn ddeuaidd (cadarnhaol a negyddol) neu luosog (hapus, blin, trist, cas...). Byddwn yn gweithredu'r prosiect Gwyddor Data hwn yn R a byddwn yn defnyddio'r set ddata yn y pecyn "janeaustenR". Byddwn yn defnyddio geiriaduron pwrpas cyffredinol megis AFINN, bing a loughran, yn perfformio uniad mewnol, ac ar y diwedd byddwn yn creu cwmwl geiriau i arddangos y canlyniad.

Iaith: R
Set ddata/pecyn: janeaustenR

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Cyfieithwyd yr erthygl gyda chefnogaeth Meddalwedd EDISON, sydd yn gwneud ystafelloedd gosod rhithwir ar gyfer siopau aml-frandAc profi meddalwedd.

2. Canfod Newyddion Ffug

Ewch â'ch sgiliau i'r lefel nesaf trwy weithio ar brosiect Gwyddor Data i ddechreuwyr - canfod newyddion ffug gyda Python.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae newyddion ffug yn wybodaeth ffug sy'n cael ei lledaenu trwy gyfryngau cymdeithasol a chyfryngau ar-lein eraill i gyflawni nodau gwleidyddol. Yn y syniad prosiect Gwyddor Data hwn, byddwn yn defnyddio Python i adeiladu model a all benderfynu'n gywir a yw stori newyddion yn real neu'n ffug. Byddwn yn creu TfidfVectorizer ac yn defnyddio Dosbarthydd Goddefol Ymosodol i ddosbarthu newyddion yn “go iawn” a “ffug”. Byddwn yn defnyddio set ddata o'r siâp 7796 × 4 ac yn rhedeg popeth yn Jupyter Lab.

Iaith: Python

Set ddata/pecyn: newyddion.csv

3. Canfod Clefyd Parkinson

Symud ymlaen gyda'ch Syniad Prosiect Gwyddor Data - canfod clefyd Parkinson gan ddefnyddio XGBoost.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Rydym wedi dechrau defnyddio Gwyddor Data i wella gofal iechyd a gwasanaethau - os gallwn ragweld clefyd yn gynnar, yna bydd gennym lawer o fanteision. Felly, yn y syniad prosiect Gwyddor Data hwn, byddwn yn dysgu sut i ganfod clefyd Parkinson gan ddefnyddio Python. Mae'n glefyd niwroddirywiol, cynyddol o'r system nerfol ganolog sy'n effeithio ar symudiad ac yn achosi cryndodau ac anystwythder. Mae'n effeithio ar niwronau sy'n cynhyrchu dopamin yn yr ymennydd, a bob blwyddyn, mae'n effeithio ar fwy nag 1 miliwn o bobl yn India.

Iaith: Python

Set ddata/pecyn: Set ddata UCI ML Parkinsons

Prosiectau Gwyddor Data o gymhlethdod canolig

4. Cydnabod Emosiwn Lleferydd

Gwirio gweithrediad cyflawn y prosiect enghreifftiol Gwyddor Data − adnabod lleferydd gan ddefnyddio Librosa.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Gadewch i ni nawr ddysgu sut i ddefnyddio gwahanol lyfrgelloedd. Mae'r prosiect Gwyddor Data hwn yn defnyddio librosa ar gyfer adnabod lleferydd. SER yw'r broses o adnabod emosiynau dynol a chyflyrau affeithiol o leferydd. Gan ein bod yn defnyddio tôn a thraw i fynegi emosiwn gyda'n lleisiau, mae SER yn berthnasol. Ond gan fod emosiynau'n oddrychol, mae anodi sain yn dasg heriol. Byddwn yn defnyddio ffwythiannau mfcc, chroma a mel ac yn defnyddio set ddata RAVDESS ar gyfer adnabod emosiwn. Byddwn yn creu dosbarthwr MLPC ar gyfer y model hwn.

Iaith: Python

Set ddata/pecyn: Set ddata RAVDESS

5. Canfod Rhyw ac Oedran

Gwneud argraff ar gyflogwyr gyda'r prosiect Gwyddor Data diweddaraf - pennu rhyw ac oedran gan ddefnyddio OpenCV.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae hwn yn Wyddor Data diddorol gyda Python. Gan ddefnyddio un ddelwedd yn unig, byddwch yn dysgu rhagweld rhyw ac oedran person. Yn hwn byddwn yn eich cyflwyno i Computer Vision a'i egwyddorion. Byddwn yn adeiladu rhwydwaith niwral convolutional a bydd yn defnyddio modelau a hyfforddwyd gan Tal Hassner a Gil Levy ar set ddata Adience. Ar hyd y ffordd byddwn yn defnyddio rhai ffeiliau .pb, .pbtxt, .prototxt a .caffemodel.

Iaith: Python

Set ddata/pecyn: Cynnulleidfa

6. Dadansoddi Data Uber

Edrychwch ar weithrediad cyflawn y prosiect Gwyddor Data gyda chod ffynhonnell − Prosiect Dadansoddi Data Uber yn R.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae hwn yn brosiect delweddu data gyda ggplot2 lle byddwn yn defnyddio R a'i lyfrgelloedd ac yn dadansoddi paramedrau amrywiol. Byddwn yn defnyddio set ddata Uber Pickups Dinas Efrog Newydd ac yn creu delweddiadau ar gyfer gwahanol fframiau amser o'r flwyddyn. Mae hyn yn dweud wrthym sut mae amser yn effeithio ar deithiau cwsmeriaid.

Iaith: R

Set ddata/pecyn: Uber Pickups yn set ddata Dinas Efrog Newydd

7. Canfod Cysgadrwydd Gyrwyr

Gwella'ch sgiliau trwy weithio ar y Prosiect Gwyddor Data Gorau - system synhwyro syrthni gydag OpenCV a Keras.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae gyrru'n gysglyd yn hynod beryglus, ac mae bron i fil o ddamweiniau'n digwydd bob blwyddyn oherwydd bod gyrwyr yn cwympo i gysgu wrth yrru. Yn y prosiect Python hwn, byddwn yn creu system sy'n gallu canfod gyrwyr sy'n gysglyd a hefyd yn eu rhybuddio â signal sain.

Gweithredir y prosiect hwn gan ddefnyddio Keras ac OpenCV. Byddwn yn defnyddio OpenCV ar gyfer canfod wynebau a llygaid a gyda Keras byddwn yn dosbarthu cyflwr y llygaid (Agored neu Gaeedig) gan ddefnyddio technegau rhwydwaith niwral dwfn.

8. Chatbot

Creu Chatbot gyda Python a chymryd cam ymlaen yn eich gyrfa - Chatbot gyda NLTK a Keras.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae Chatbots yn rhan annatod o fusnes. Mae'n rhaid i lawer o fusnesau gynnig gwasanaethau i'w cwsmeriaid ac mae'n cymryd llawer o weithlu, amser ac ymdrech i'w gwasanaethu. Gall Chatbots awtomeiddio llawer o'ch rhyngweithio â chwsmeriaid trwy ateb rhai cwestiynau cyffredin y mae cwsmeriaid yn eu gofyn. Yn y bôn mae dau fath o chatbots: Parth-benodol a Parth Agored. Defnyddir chatbot parth-benodol yn aml i ddatrys problem benodol. Felly, mae angen i chi ei addasu i weithio'n effeithiol yn eich maes. Gellir gofyn unrhyw gwestiynau i chatbots parth agored, felly mae angen llawer iawn o ddata i'w hyfforddi.

Set ddata: Ffeil json bwriadau

Iaith: Python

Prosiectau Gwyddor Data Uwch

9. Cynhyrchydd Capsiwn Delwedd

Gwiriwch weithrediad cyflawn y prosiect gyda chod ffynhonnell − Cynhyrchydd Capsiwn Delwedd gyda CNN & LSTM.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae disgrifio beth sydd mewn delwedd yn dasg hawdd i fodau dynol, ond ar gyfer cyfrifiaduron, cyfres o rifau yn unig yw delwedd sy'n cynrychioli gwerth lliw pob picsel. Mae hon yn dasg anodd i gyfrifiaduron. Mae deall beth sydd mewn delwedd ac yna creu disgrifiad mewn iaith naturiol (fel Saesneg) yn dasg anodd arall. Mae'r prosiect hwn yn defnyddio technegau dysgu dwfn lle rydym yn gweithredu Rhwydwaith Niwral Convolutional (CNN) gyda Rhwydwaith Niwral Rheolaidd (LSTM) i greu generadur disgrifiad delwedd.

Set ddata: Flickr 8K

Iaith: Python

Fframwaith: Keras

10. Canfod Twyll Cerdyn Credyd

Gwnewch eich gorau wrth weithio ar eich syniad am brosiect Gwyddor Data − canfod twyll cardiau credyd gan ddefnyddio dysgu peirianyddol.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Erbyn hyn rydych chi wedi dechrau deall y technegau a'r cysyniadau. Gadewch i ni symud ymlaen at rai prosiectau gwyddor data uwch. Yn y prosiect hwn byddwn yn defnyddio iaith R gydag algorithmau fel coed penderfyniad, atchweliad logistaidd, rhwydweithiau niwral artiffisial a dosbarthwr hwb graddiant. Byddwn yn defnyddio set ddata o drafodion cardiau i ddosbarthu trafodion cardiau credyd fel rhai twyllodrus neu ddilys. Byddwn yn dewis gwahanol fodelau ar eu cyfer ac yn adeiladu cromliniau perfformiad.

Iaith: R

Set ddata/pecyn: Set ddata Trafodion Cerdyn

11. System Argymhelliad Ffilm

Astudiwch weithrediad y prosiect Gwyddor Data gorau gyda chod Ffynhonnell - System Argymhelliad Ffilm yn iaith R

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Yn y prosiect Gwyddor Data hwn, byddwn yn defnyddio R i weithredu argymhellion y ffilm trwy ddysgu peiriannau. Mae'r system argymhellion yn anfon awgrymiadau at ddefnyddwyr trwy broses hidlo yn seiliedig ar ddewisiadau defnyddwyr eraill a hanes pori. Os yw A a B yn hoffi Home Alone, a B yn hoffi Mean Girls, yna gallwch chi awgrymu A - efallai y byddan nhw'n ei hoffi hefyd. Mae hyn yn galluogi cwsmeriaid i ryngweithio â'r platfform.

Iaith: R

Set ddata/pecyn: Set ddata MovieLens

12. Segmentu Cwsmeriaid

Gwneud argraff ar gyflogwyr gyda phrosiect Gwyddor Data (gan gynnwys cod ffynhonnell) - Segmentu cwsmeriaid gan ddefnyddio dysgu peiriant.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae segmentu prynwyr yn gymhwysiad poblogaidd dysgu heb oruchwyliaeth. Gan ddefnyddio clystyru, mae cwmnïau'n nodi segmentau cwsmeriaid i dargedu sylfaen defnyddwyr posibl. Maent yn rhannu cwsmeriaid yn grwpiau yn ôl nodweddion cyffredin megis rhyw, oedran, diddordebau ac arferion gwario fel y gallant farchnata eu cynnyrch yn effeithiol i bob grŵp. Byddwn yn defnyddio Clystyru K-golygu, yn ogystal â delweddu'r dosbarthiad yn ôl rhyw ac oedran. Yna byddwn yn dadansoddi eu hincwm blynyddol a lefelau gwariant.

Iaith: R

Set ddata/pecyn: Set ddata Mall_Cwsmeriaid

13. Dosbarthiad Canser y Fron

Edrychwch ar weithrediad cyflawn prosiect Gwyddor Data yn Python − Dosbarthiad canser y fron gan ddefnyddio dysgu dwfn.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Gan ddod yn ôl at gyfraniad meddygol gwyddor data, gadewch i ni ddysgu sut i ganfod canser y fron gan ddefnyddio Python. Byddwn yn defnyddio set ddata IDC_regular i nodi carsinoma dwythellol ymledol, y math mwyaf cyffredin o ganser y fron. Mae'n datblygu yn y dwythellau llaeth, gan dyrchu i feinwe ffibrog neu frasterog y fron y tu allan i'r ddwythell. Yn y syniad hwn am brosiect gwyddoniaeth casglu data byddwn yn ei ddefnyddio Dysgu Dwfn a llyfrgell Keras ar gyfer dosbarthu.

Iaith: Python

Set ddata/pecyn: IDC_rheolaidd

14. Adnabod Arwyddion Traffig

Cyflawni cywirdeb mewn technoleg hunan-yrru gyda phrosiect Gwyddor Data adnabod arwyddion traffig gan ddefnyddio CNN ffynhonnell agor.

14 prosiect ffynhonnell agored i wella sgiliau Gwyddor Data (hawdd, normal, caled)

Mae arwyddion ffyrdd a rheolau traffig yn bwysig iawn i bob gyrrwr er mwyn osgoi damweiniau. I ddilyn y rheol, yn gyntaf mae angen i chi ddeall sut olwg sydd ar arwydd ffordd. Rhaid i berson ddysgu'r holl arwyddion ffordd cyn iddo gael trwydded i yrru unrhyw gerbyd. Ond nawr mae nifer y cerbydau ymreolaethol yn tyfu, ac yn y dyfodol agos ni fydd person bellach yn gyrru car yn annibynnol. Yn y prosiect Adnabod Arwyddion Ffordd, byddwch yn dysgu sut y gall rhaglen adnabod y math o arwyddion ffordd trwy gymryd delwedd fel mewnbwn. Defnyddir set ddata Meincnod Cydnabod Arwyddion Traffig yr Almaen (GTSRB) i adeiladu rhwydwaith niwral dwfn i adnabod y dosbarth y mae arwydd traffig yn perthyn iddo. Rydym hefyd yn creu GUI syml i ryngweithio â'r cais.

Iaith: Python

Set ddata: GTSRB (Meincnod Cydnabod Arwyddion Traffig yr Almaen)

Darllen mwy

Ffynhonnell: hab.com

Ychwanegu sylw