Dadansoddi Sentiment yw'r dadansoddiad o eiriau i bennu teimladau a barn, a all fod yn gadarnhaol neu'n negyddol. Mae hwn yn fath o ddosbarthiad lle gall dosbarthiadau fod yn ddeuaidd (cadarnhaol a negyddol) neu luosog (hapus, blin, trist, cas...). Byddwn yn gweithredu'r prosiect Gwyddor Data hwn yn R a byddwn yn defnyddio'r set ddata yn y pecyn "janeaustenR". Byddwn yn defnyddio geiriaduron pwrpas cyffredinol megis AFINN, bing a loughran, yn perfformio uniad mewnol, ac ar y diwedd byddwn yn creu cwmwl geiriau i arddangos y canlyniad.
Mae newyddion ffug yn wybodaeth ffug sy'n cael ei lledaenu trwy gyfryngau cymdeithasol a chyfryngau ar-lein eraill i gyflawni nodau gwleidyddol. Yn y syniad prosiect Gwyddor Data hwn, byddwn yn defnyddio Python i adeiladu model a all benderfynu'n gywir a yw stori newyddion yn real neu'n ffug. Byddwn yn creu TfidfVectorizer ac yn defnyddio Dosbarthydd Goddefol Ymosodol i ddosbarthu newyddion yn “go iawn” a “ffug”. Byddwn yn defnyddio set ddata o'r siâp 7796 × 4 ac yn rhedeg popeth yn Jupyter Lab.
Rydym wedi dechrau defnyddio Gwyddor Data i wella gofal iechyd a gwasanaethau - os gallwn ragweld clefyd yn gynnar, yna bydd gennym lawer o fanteision. Felly, yn y syniad prosiect Gwyddor Data hwn, byddwn yn dysgu sut i ganfod clefyd Parkinson gan ddefnyddio Python. Mae'n glefyd niwroddirywiol, cynyddol o'r system nerfol ganolog sy'n effeithio ar symudiad ac yn achosi cryndodau ac anystwythder. Mae'n effeithio ar niwronau sy'n cynhyrchu dopamin yn yr ymennydd, a bob blwyddyn, mae'n effeithio ar fwy nag 1 miliwn o bobl yn India.
Gadewch i ni nawr ddysgu sut i ddefnyddio gwahanol lyfrgelloedd. Mae'r prosiect Gwyddor Data hwn yn defnyddio librosa ar gyfer adnabod lleferydd. SER yw'r broses o adnabod emosiynau dynol a chyflyrau affeithiol o leferydd. Gan ein bod yn defnyddio tôn a thraw i fynegi emosiwn gyda'n lleisiau, mae SER yn berthnasol. Ond gan fod emosiynau'n oddrychol, mae anodi sain yn dasg heriol. Byddwn yn defnyddio ffwythiannau mfcc, chroma a mel ac yn defnyddio set ddata RAVDESS ar gyfer adnabod emosiwn. Byddwn yn creu dosbarthwr MLPC ar gyfer y model hwn.
Mae hwn yn Wyddor Data diddorol gyda Python. Gan ddefnyddio un ddelwedd yn unig, byddwch yn dysgu rhagweld rhyw ac oedran person. Yn hwn byddwn yn eich cyflwyno i Computer Vision a'i egwyddorion. Byddwn yn adeiladu rhwydwaith niwral convolutional a bydd yn defnyddio modelau a hyfforddwyd gan Tal Hassner a Gil Levy ar set ddata Adience. Ar hyd y ffordd byddwn yn defnyddio rhai ffeiliau .pb, .pbtxt, .prototxt a .caffemodel.
Mae hwn yn brosiect delweddu data gyda ggplot2 lle byddwn yn defnyddio R a'i lyfrgelloedd ac yn dadansoddi paramedrau amrywiol. Byddwn yn defnyddio set ddata Uber Pickups Dinas Efrog Newydd ac yn creu delweddiadau ar gyfer gwahanol fframiau amser o'r flwyddyn. Mae hyn yn dweud wrthym sut mae amser yn effeithio ar deithiau cwsmeriaid.
Iaith: R
Set ddata/pecyn: Uber Pickups yn set ddata Dinas Efrog Newydd
Mae gyrru'n gysglyd yn hynod beryglus, ac mae bron i fil o ddamweiniau'n digwydd bob blwyddyn oherwydd bod gyrwyr yn cwympo i gysgu wrth yrru. Yn y prosiect Python hwn, byddwn yn creu system sy'n gallu canfod gyrwyr sy'n gysglyd a hefyd yn eu rhybuddio â signal sain.
Gweithredir y prosiect hwn gan ddefnyddio Keras ac OpenCV. Byddwn yn defnyddio OpenCV ar gyfer canfod wynebau a llygaid a gyda Keras byddwn yn dosbarthu cyflwr y llygaid (Agored neu Gaeedig) gan ddefnyddio technegau rhwydwaith niwral dwfn.
Mae Chatbots yn rhan annatod o fusnes. Mae'n rhaid i lawer o fusnesau gynnig gwasanaethau i'w cwsmeriaid ac mae'n cymryd llawer o weithlu, amser ac ymdrech i'w gwasanaethu. Gall Chatbots awtomeiddio llawer o'ch rhyngweithio â chwsmeriaid trwy ateb rhai cwestiynau cyffredin y mae cwsmeriaid yn eu gofyn. Yn y bôn mae dau fath o chatbots: Parth-benodol a Parth Agored. Defnyddir chatbot parth-benodol yn aml i ddatrys problem benodol. Felly, mae angen i chi ei addasu i weithio'n effeithiol yn eich maes. Gellir gofyn unrhyw gwestiynau i chatbots parth agored, felly mae angen llawer iawn o ddata i'w hyfforddi.
Mae disgrifio beth sydd mewn delwedd yn dasg hawdd i fodau dynol, ond ar gyfer cyfrifiaduron, cyfres o rifau yn unig yw delwedd sy'n cynrychioli gwerth lliw pob picsel. Mae hon yn dasg anodd i gyfrifiaduron. Mae deall beth sydd mewn delwedd ac yna creu disgrifiad mewn iaith naturiol (fel Saesneg) yn dasg anodd arall. Mae'r prosiect hwn yn defnyddio technegau dysgu dwfn lle rydym yn gweithredu Rhwydwaith Niwral Convolutional (CNN) gyda Rhwydwaith Niwral Rheolaidd (LSTM) i greu generadur disgrifiad delwedd.
Erbyn hyn rydych chi wedi dechrau deall y technegau a'r cysyniadau. Gadewch i ni symud ymlaen at rai prosiectau gwyddor data uwch. Yn y prosiect hwn byddwn yn defnyddio iaith R gydag algorithmau fel coed penderfyniad, atchweliad logistaidd, rhwydweithiau niwral artiffisial a dosbarthwr hwb graddiant. Byddwn yn defnyddio set ddata o drafodion cardiau i ddosbarthu trafodion cardiau credyd fel rhai twyllodrus neu ddilys. Byddwn yn dewis gwahanol fodelau ar eu cyfer ac yn adeiladu cromliniau perfformiad.
Yn y prosiect Gwyddor Data hwn, byddwn yn defnyddio R i weithredu argymhellion y ffilm trwy ddysgu peiriannau. Mae'r system argymhellion yn anfon awgrymiadau at ddefnyddwyr trwy broses hidlo yn seiliedig ar ddewisiadau defnyddwyr eraill a hanes pori. Os yw A a B yn hoffi Home Alone, a B yn hoffi Mean Girls, yna gallwch chi awgrymu A - efallai y byddan nhw'n ei hoffi hefyd. Mae hyn yn galluogi cwsmeriaid i ryngweithio â'r platfform.
Mae segmentu prynwyr yn gymhwysiad poblogaidd dysgu heb oruchwyliaeth. Gan ddefnyddio clystyru, mae cwmnïau'n nodi segmentau cwsmeriaid i dargedu sylfaen defnyddwyr posibl. Maent yn rhannu cwsmeriaid yn grwpiau yn ôl nodweddion cyffredin megis rhyw, oedran, diddordebau ac arferion gwario fel y gallant farchnata eu cynnyrch yn effeithiol i bob grŵp. Byddwn yn defnyddio Clystyru K-golygu, yn ogystal â delweddu'r dosbarthiad yn ôl rhyw ac oedran. Yna byddwn yn dadansoddi eu hincwm blynyddol a lefelau gwariant.
Gan ddod yn ôl at gyfraniad meddygol gwyddor data, gadewch i ni ddysgu sut i ganfod canser y fron gan ddefnyddio Python. Byddwn yn defnyddio set ddata IDC_regular i nodi carsinoma dwythellol ymledol, y math mwyaf cyffredin o ganser y fron. Mae'n datblygu yn y dwythellau llaeth, gan dyrchu i feinwe ffibrog neu frasterog y fron y tu allan i'r ddwythell. Yn y syniad hwn am brosiect gwyddoniaeth casglu data byddwn yn ei ddefnyddio Dysgu Dwfn a llyfrgell Keras ar gyfer dosbarthu.
Mae arwyddion ffyrdd a rheolau traffig yn bwysig iawn i bob gyrrwr er mwyn osgoi damweiniau. I ddilyn y rheol, yn gyntaf mae angen i chi ddeall sut olwg sydd ar arwydd ffordd. Rhaid i berson ddysgu'r holl arwyddion ffordd cyn iddo gael trwydded i yrru unrhyw gerbyd. Ond nawr mae nifer y cerbydau ymreolaethol yn tyfu, ac yn y dyfodol agos ni fydd person bellach yn gyrru car yn annibynnol. Yn y prosiect Adnabod Arwyddion Ffordd, byddwch yn dysgu sut y gall rhaglen adnabod y math o arwyddion ffordd trwy gymryd delwedd fel mewnbwn. Defnyddir set ddata Meincnod Cydnabod Arwyddion Traffig yr Almaen (GTSRB) i adeiladu rhwydwaith niwral dwfn i adnabod y dosbarth y mae arwydd traffig yn perthyn iddo. Rydym hefyd yn creu GUI syml i ryngweithio â'r cais.
Iaith: Python
Set ddata: GTSRB (Meincnod Cydnabod Arwyddion Traffig yr Almaen)