14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Saidheans dàta airson luchd-tòiseachaidh a

1. Mion-sgrùdadh sentiment (Mion-sgrùdadh sentiment tro theacsa)

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Thoir sùil air buileachadh iomlan a’ phròiseict Saidheans Dàta a’ cleachdadh còd stòr − Pròiseact mion-sgrùdadh faireachdainn ann an R.

Is e Mion-sgrùdadh Mothachaidh mion-sgrùdadh fhaclan gus faireachdainnean agus beachdan a dhearbhadh, a dh’ fhaodadh a bhith deimhinneach no àicheil. Is e seo seòrsa de sheòrsachadh anns am faod clasaichean a bhith dà-chànanach (deimhinneach agus àicheil) no iomarra (toilichte, feargach, brònach, olc ...). Cuiridh sinn am pròiseact Saidheans Dàta seo an gnìomh ann an R agus cleachdaidh sinn an dàta sa phasgan “janeaustenR”. Cleachdaidh sinn faclairean adhbhar coitcheann leithid AFINN, bing agus lochran, nì sinn ceangal a-staigh, agus aig an deireadh cruthaichidh sinn sgòth fhaclan gus an toradh a thaisbeanadh.

Cànan: R
Pasgan dàta/dàta: SìneaustenR

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Chaidh an artaigil eadar-theangachadh le taic bho EDISON Software, a tha a’ dèanamh rumannan uidheamachadh brìgheil airson stòran ioma-bhrand, a bharrachd air bathar-bog deuchainnean.

2. Dearbhadh Naidheachdan Fake

Thoir do sgilean chun ath ìre le bhith ag obair air pròiseact Saidheans Dàta airson luchd-tòiseachaidh - lorg naidheachdan meallta le Python.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Is e fiosrachadh meallta a th’ ann an naidheachdan meallta a thèid a sgaoileadh tro na meadhanan sòisealta agus meadhanan air-loidhne eile gus amasan poilitigeach a choileanadh. Anns a’ bheachd pròiseict Saidheans Dàta seo, cleachdaidh sinn Python gus modal a thogail as urrainn dearbhadh gu ceart a bheil sgeulachd naidheachd fìor no meallta. Cruthaichidh sinn TfidfVectorizer agus cleachdaidh sinn Clasifier PassiveAggressive gus naidheachdan a sheòrsachadh gu “fìor” agus “meallta”. Cleachdaidh sinn stòr-dàta den chumadh 7796 × 4 agus ruithidh sinn a h-uile càil ann an Jupyter Lab.

Cànan: Python

Pasgan dàta/dàta: naidheachdan.csv

3. A' lorg Galar Pharkinson

Gluais air adhart le do bheachd pròiseact saidheans dàta - lorg galar Pharkinson a’ cleachdadh XGBoost.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Tha sinn air tòiseachadh a’ cleachdadh Saidheans Dàta gus cùram-slàinte agus seirbheisean a leasachadh - mas urrainn dhuinn galar ro-innse aig ìre thràth, bidh mòran bhuannachdan againn. Mar sin, anns a’ bheachd pròiseact Saidheans Dàta seo, ionnsaichidh sinn mar a lorgas sinn galar Pharkinson a’ cleachdadh Python. Is e galar neurodegenerative, adhartach den phrìomh shiostam nèamhach a th’ ann a bheir buaidh air gluasad agus ag adhbhrachadh crith agus stiffness. Bidh e a’ toirt buaidh air neurons a bhios a’ dèanamh dopamine san eanchainn, agus gach bliadhna, bidh e a’ toirt buaidh air còrr air 1 millean neach anns na h-Innseachan.

Cànan: Python

Pasgan dàta/dàta: Stòr-dàta UCI ML Parkinsons

Pròiseactan Saidheans Dàta de iom-fhillteachd meadhanach

4. Aithneachadh Mothachadh Òraid

Thoir sùil air buileachadh iomlan a’ phròiseict eisimpleir Saidheans Dàta − aithneachadh cainnt a’ cleachdadh Librosa.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

A-nis ionnsaichidh sinn mar a chleachdas sinn diofar leabharlannan. Bidh am pròiseact Saidheans Dàta seo a’ cleachdadh librosa airson aithneachadh cainnte. Is e SER am pròiseas airson faireachdainnean daonna agus stàitean buadhach a chomharrachadh bho chainnt. Leis gu bheil sinn a’ cleachdadh tòna agus pitch gus faireachdainn a chuir an cèill le ar guthan, tha SER buntainneach. Ach leis gu bheil faireachdainnean pearsanta, tha mothachadh claisneachd na obair dhùbhlanach. Cleachdaidh sinn gnìomhan mfcc, chroma agus mel agus cleachdaidh sinn an stòr-dàta RAVDESS airson aithneachadh faireachdainn. Cruthaichidh sinn seòrsaiche MLPC airson a’ mhodail seo.

Cànan: Python

Pasgan dàta/dàta: Stòr-dàta RAVDESS

5. Dearbhadh Gnè agus Aois

Thoir buaidh air fastaichean leis a’ phròiseact Saidheans Dàta as ùire - a’ dearbhadh gnè agus aois a’ cleachdadh OpenCV.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Is e Saidheans Dàta inntinneach a tha seo le Python. A’ cleachdadh dìreach aon ìomhaigh, ionnsaichidh tu ro-innse gnè agus aois neach. Ann an seo bheir sinn eòlas dhut air Computer Vision agus na prionnsapalan aige. Togaidh sinn lìonra neural convolutional agus cleachdaidh iad modalan air an trèanadh le Tal Hassner agus Gil Levy air an t-seata dàta Adience. Air an t-slighe cleachdaidh sinn cuid de fhaidhlichean .pb, .pbtxt, .prototxt agus .caffemodel.

Cànan: Python

Pasgan dàta/dàta: Aidmheil

6. Mion-sgrùdadh Dàta Uber

Thoir sùil air buileachadh iomlan a’ phròiseict Saidheans Dàta le còd stòr - Pròiseact Mion-sgrùdadh Dàta Uber ann an R.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Is e pròiseact fradharc dàta a tha seo le ggplot2 anns am bi sinn a’ cleachdadh R agus na leabharlannan aige agus a’ sgrùdadh diofar pharaimearan. Cleachdaidh sinn stòr-dàta Uber Pickups New York City agus cruthaichidh sinn ìomhaighean airson diofar amannan den bhliadhna. Tha seo ag innse dhuinn mar a bheir ùine buaidh air siubhal teachdaiche.

Cànan: R

Pasgan dàta/dàta: Uber Pickups ann an stòr-dàta Cathair New York

7. Dearbhadh Drowsiness dràibhear

Leasaich do sgilean le bhith ag obair air a’ Phròiseact Saidheans Dàta as Fheàrr - siostam lorg codal le OpenCV & Keras.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Tha draibheadh ​​leisg air leth cunnartach, agus bidh faisg air mìle tubaist a’ tachairt gach bliadhna ri linn draibhearan a’ tuiteam nan cadal fhad ‘s a tha iad a’ dràibheadh. Anns a’ phròiseact Python seo, cruthaichidh sinn siostam a lorgas draibhearan dòrainneach agus a bheir rabhadh dhaibh le comharra claisneachd.

Tha am pròiseact seo air a bhuileachadh a’ cleachdadh Keras agus OpenCV. Cleachdaidh sinn OpenCV airson lorg aghaidh is sùla agus le Keras seòrsaichidh sinn staid na sùla (Fosgailte no Dùinte) a’ cleachdadh dòighean lìonra neural domhainn.

8. Chatbot

Cruthaich Chatbot le Python agus gabh ceum air adhart nad chùrsa-beatha - Chatbot le NLTK & Keras.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Tha Chatbots nam pàirt riatanach de ghnìomhachas. Feumaidh mòran ghnìomhachasan seirbheisean a thabhann don luchd-ceannach aca agus bheir e tòrr sgiobachd, ùine agus oidhirp gus an seirbheiseachadh. Faodaidh Chatbots mòran den eadar-obrachadh teachdaiche agad a dhèanamh fèin-ghluasadach le bhith a’ freagairt cuid de cheistean cumanta a bhios luchd-ceannach a’ faighneachd. Gu bunaiteach tha dà sheòrsa chatbots ann: raon sònraichte agus raon fosgailte. Bithear a’ cleachdadh chatbot a tha sònraichte don àrainn gu tric gus fuasgladh fhaighinn air duilgheadas sònraichte. Mar sin, feumaidh tu a ghnàthachadh gus obrachadh gu h-èifeachdach san raon agad. Faodar ceistean sam bith a chur air chatbots àrainn fhosgailte, agus mar sin feumaidh an trèanadh tòrr dàta.

Seata dàta: Intents json file

Cànan: Python

Pròiseactan Saidheans Dàta adhartach

9. Image Caption Generator

Thoir sùil air buileachadh iomlan a’ phròiseict le còd stòr − Gineadair caption ìomhaigh le CNN & LSTM.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Is e obair fhurasta do dhaoine a th’ ann a bhith a’ toirt cunntas air na tha ann an ìomhaigh, ach airson coimpiutairean, chan eil ann an ìomhaigh ach sreath de dh’ àireamhan a tha a’ riochdachadh luach dath gach piogsail. Is e obair dhoirbh a tha seo dha coimpiutairean. Is e obair dhoirbh eile a th’ ann a bhith a’ tuigsinn na tha ann an ìomhaigh agus an uairsin a’ cruthachadh tuairisgeul ann an cànan nàdurrach (leithid Beurla). Bidh am pròiseact seo a’ cleachdadh dòighean ionnsachaidh domhainn anns am bi sinn a’ cur an sàs Lìonra Neural Convolutional (CNN) le Lìonra Neural Recurrent (LSTM) gus gineadair tuairisgeul ìomhaigh a chruthachadh.

Seata dàta: Flickr 8K

Cànan: Python

Frèam: Keras

10. Dearbhadh Foill Cairt Creideis

Dèan do dhìcheall fhad ‘s a tha thu ag obair air do bheachd pròiseact Saidheans Dàta - lorg foill cairt creideis a’ cleachdadh ionnsachadh inneal.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Roimhe seo tha thu air tòiseachadh a 'tuigsinn nan dòighean agus na bun-bheachdan. Gluaisidh sinn air adhart gu cuid de phròiseactan adhartach saidheans dàta. Anns a’ phròiseact seo cleachdaidh sinn cànan R le algoirmean mar craobhan co-dhùnaidh, ais-tharraing loidsigeach, lìonraidhean neural fuadain agus seòrsachadh àrdachadh caisead. Cleachdaidh sinn stòr-dàta de ghnothaichean cairt gus gnothaichean cairt-creideis a sheòrsachadh mar rud meallta no fìrinneach. Taghaidh sinn diofar mhodalan dhaibh agus togaidh sinn lùban coileanaidh.

Cànan: R

Pasgan dàta/dàta: Stòr-dàta Cairt Gnìomhan

11. Movie Moladh System

Dèan sgrùdadh air buileachadh a’ phròiseict Saidheans Dàta as fheàrr le còd Stòr - Siostam Moladh Film ann an cànan R

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Anns a’ phròiseact Saidheans Dàta seo, cleachdaidh sinn R gus molaidhean an fhilm a bhuileachadh tro ionnsachadh innealan. Bidh an siostam molaidh a’ cur mholaidhean gu luchd-cleachdaidh tro phròiseas sìolaidh stèidhichte air roghainnean luchd-cleachdaidh eile agus eachdraidh brabhsaidh. Ma tha A agus B a’ còrdadh ri Home Alone, agus is toil le B Mean Girls, faodaidh tu A a mholadh - is dòcha gum bu toil leotha e cuideachd. Leigidh seo le luchd-ceannach eadar-obrachadh leis an àrd-ùrlar.

Cànan: R

Pasgan dàta/dàta: Stòr-dàta MovieLens

12. Sgaradh luchd-cleachdaidh

Thoir buaidh air fastaichean le pròiseact Saidheans Dàta (a’ toirt a-steach còd stòr) - Sgaradh luchd-ceannach a’ cleachdadh ionnsachadh inneal.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Tha sgaradh ceannaiche na thagradh mòr-chòrdte ionnsachadh gun stiùireadh. Le bhith a’ cleachdadh cnuasachadh, bidh companaidhean a’ comharrachadh roinnean teachdaiche gus cuimseachadh air bunait luchd-cleachdaidh a dh’fhaodadh a bhith ann. Bidh iad a’ roinn luchd-ceannach ann am buidhnean a rèir feartan cumanta leithid gnè, aois, ùidhean agus cleachdaidhean caitheamh gus an urrainn dhaibh am bathar a mhargaidheachd gu h-èifeachdach do gach buidheann. Cleachdaidh sinn Tha K-a ’ciallachadh cruinneachadh, a bharrachd air an cuairteachadh fhaicinn a rèir gnè agus aois. Nì sinn sgrùdadh an uairsin air na h-ìrean teachd-a-steach agus cosgais bliadhnail aca.

Cànan: R

Pasgan dàta/dàta: Stòr-dàta Mall_Customers

13. Seòrsachadh aillse broilleach

Thoir sùil air buileachadh iomlan pròiseact Saidheans Dàta ann am Python - Seòrsachadh aillse broilleach a’ cleachdadh ionnsachadh domhainn.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

A’ tighinn air ais gu tabhartas meidigeach saidheans dàta, ionnsaichidh sinn mar a lorgas sinn aillse broilleach a’ cleachdadh Python. Cleachdaidh sinn an dàta IDC_regular gus carcinoma ductal ionnsaigheach a chomharrachadh, an seòrsa aillse broilleach as cumanta. Bidh e a’ leasachadh anns na ductan bainne, a’ cladhach a-steach don inneal broilleach snàithleach no geir taobh a-muigh an duct. Anns a 'bheachd pròiseact saidheans cruinneachadh dàta seo cleachdaidh sinn Ionnsachadh domhainn agus leabharlann Keras airson seòrsachadh.

Cànan: Python

Pasgan dàta/dàta: IDC_cunbhalach

14. Aithneachadh Soidhnichean Trafaic

A’ coileanadh mionaideachd ann an teicneòlas fèin-dràibhidh le pròiseact Saidheans Dàta aithneachadh soidhne trafaic a’ cleachdadh CNN stòr fosgailte.

14 pròiseactan stòr fosgailte gus sgilean Saidheans Dàta a leasachadh (furasta, àbhaisteach, cruaidh)

Tha soidhnichean rathaid agus riaghailtean trafaic glè chudromach airson a h-uile draibhear gus tubaistean a sheachnadh. Gus an riaghailt a leantainn, feumaidh tu an toiseach tuigsinn cò ris a tha soidhne rathaid coltach. Feumaidh neach na soidhnichean rathaid gu lèir ionnsachadh mus faigh e cead airson carbad sam bith a dhràibheadh. Ach a-nis tha an àireamh de charbadan fèin-riaghailteach a 'fàs, agus a dh' aithghearr cha bhith duine a 'draibheadh ​​​​càr gu neo-eisimeileach tuilleadh. Anns a’ phròiseact Aithneachadh Soidhnichean Rathaid, ionnsaichidh tu mar as urrainn do phrògram an seòrsa shoidhnichean rathaid aithneachadh le bhith a’ togail ìomhaigh mar chur-a-steach. Bithear a’ cleachdadh an t-sreath Slat-tomhais Aithneachaidh Soidhnichean Trafaic Gearmailteach (GTSRB) gus lìonra neural domhainn a thogail gus an clas dham buin soidhne trafaic aithneachadh. Bidh sinn cuideachd a’ cruthachadh GUI sìmplidh gus eadar-obrachadh leis an tagradh.

Cànan: Python

Seata dàta: GTSRB (Slat-tomhais Aithneachaidh Soidhnichean Trafaic Gearmailteach)

Leugh tuilleadh

Source: www.habr.com

Cuir beachd ann