14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Eolaíocht sonraí do thosaitheoirí

1. Anailís sentiment (Setiment Analysis through Text)

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Amharc ar chur i bhfeidhm iomlán an tionscadail Eolaíocht Sonraí ag baint úsáide as cód foinse − Tionscadal Anailís Mothúchán i R.

Is éard is Anailís Mothúchán ann ná anailís ar fhocail chun mothúcháin agus tuairimí a chinneadh, ar féidir leo a bheith dearfach nó diúltach. Is cineál aicmithe é seo inar féidir le haicmí a bheith dénártha (dearfach agus diúltach) nó iolra (sona, feargach, brónach, olc...). Cuirfimid an tionscadal Eolaíocht Sonraí seo i bhfeidhm in R agus úsáidfimid an tacar sonraí sa phacáiste "janeaustenR". Bainfimid úsáid as foclóirí ginearálta ar nós AFINN, bing agus lochran, déanaimid comhcheangal inmheánach, agus ag an deireadh cruthóimid scamall focal chun an toradh a thaispeáint.

Teanga: R
Tacar Sonraí/Pacáiste: janeaustenR

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Aistríodh an t-alt le tacaíocht ó EDISON Software, a déanann sé seomraí feisteas fíorúla le haghaidh siopaí ilbhrandaAgus bogearraí tástálacha.

2. Brath Nuachta Bréige

Tóg do scileanna go dtí an chéad leibhéal eile trí oibriú ar thionscadal Eolaíocht Sonraí do thosaitheoirí - nuacht falsa a bhrath le Python.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Is faisnéis bhréagach é nuacht falsa a scaiptear trí na meáin shóisialta agus meáin eile ar líne chun spriocanna polaitiúla a bhaint amach. Sa smaoineamh tionscadail Eolaíochta Sonraí seo, úsáidfimid Python chun samhail a thógáil a fhéadfaidh a chinneadh go cruinn an bhfuil scéal nuachta fíor nó falsa. Cruthóimid TfidfVectorizer agus úsáidfimid Aicmeálaí Éighníomhacha Ionsaitheach chun nuacht a rangú i “fíor” agus “bréige”. Úsáidfimid tacar sonraí den chruth 7796×4 agus reáchtálfaimid gach rud i Jupyter Lab.

Teanga: Python

Tacar Sonraí/Pacáiste: nuacht.csv

3. Galar Parkinson a bhrath

Bog ar aghaidh le do Smaoineamh Tionscadal Eolaíochta Sonraí - a bhrath galar Parkinson ag baint úsáide as XGBoost.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Táimid tar éis tosú ag baint úsáide as Eolaíocht Sonraí chun cúram sláinte agus seirbhísí a fheabhsú - más féidir linn galar a thuar go luath, beidh go leor buntáistí againn. Mar sin, sa smaoineamh tionscadail Eolaíochta Sonraí seo, foghlaimfimid conas galar Parkinson a bhrath ag baint úsáide as Python. Is galar neurodegenerative, forásach é den lárchóras néaróg a chuireann isteach ar ghluaiseacht agus is cúis le crith agus stiffness. Bíonn tionchar aige ar néaróin a tháirgeann dopamine san inchinn, agus gach bliain, bíonn tionchar aige ar níos mó ná 1 milliún duine san India.

Teanga: Python

Tacar Sonraí/Pacáiste: Tacar sonraí UCI ML Parkinsons

Tionscadail Eolaíochta Sonraí de mheán-chastacht

4. Aitheantas Mothúcháin Urlabhra

Seiceáil cur i bhfeidhm iomlán an tionscadail shamplach Eolaíocht Sonraí − aithint cainte ag baint úsáide as Librosa.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Foghlaimímid anois conas leabharlanna éagsúla a úsáid. Úsáideann an tionscadal Eolaíocht Sonraí seo librosa chun cainte a aithint. Is éard atá i SER ná an próiseas ina n-aithnítear mothúcháin dhaonna agus stáit mhothacha ó chaint. Ós rud é go n-úsáidimid ton agus tuinairde chun mothúcháin a chur in iúl lenár nguthanna, tá SER ábhartha. Ach ós rud é go bhfuil mothúcháin suibiachtúla, is tasc dúshlánach é anótáil fuaime. Úsáidfimid feidhmeanna mfcc, chroma agus mel agus úsáidfimid tacar sonraí RAVDESS chun mothúcháin a aithint. Cruthóimid aicmitheoir MLPC don mhúnla seo.

Teanga: Python

Tacar Sonraí/Pacáiste: Tacar sonraí RAVDESS

5. Inscne agus Aois Brath

Cuir an tionscadal Eolaíochta Sonraí is déanaí i bhfeidhm ar fhostóirí - inscne agus aois a chinneadh ag baint úsáide as OpenCV.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Is Eolaíocht Sonraí suimiúil é seo le Python. Ag baint úsáide as íomhá amháin, beidh tú ag foghlaim a thuar inscne agus aois duine. Leis seo cuirfimid Computer Vision agus a prionsabail in aithne duit. Tógfaimid líonra néarúil convolutional agus úsáidfidh siad samhlacha atá oilte ag Tal Hassner agus Gil Levy ar thacar sonraí Adience. Ar an mbealach seo úsáidfimid roinnt comhaid .pb, .pbtxt, .prototxt agus .caffemodel.

Teanga: Python

Tacar Sonraí/Pacáiste: Comhaontas

6. Anailís Sonraí Uber

Seiceáil cur i bhfeidhm iomlán an tionscadail Eolaíocht Sonraí le cód foinse − Tionscadal Anailíse Sonraí Uber i R.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Is tionscadal léirshamhlaithe sonraí é seo le ggplot2 ina úsáidfimid R agus a leabharlanna agus déanfaimid anailís ar pharaiméadair éagsúla. Úsáidfimid tacar sonraí Chathair Nua-Eabhrac Uber Pickups agus cruthóimid léirshamhlú le haghaidh frámaí ama éagsúla den bhliain. Insíonn sé seo dúinn conas a théann am i bhfeidhm ar thaisteal custaiméirí.

Teanga: R

Tacar Sonraí/Pacáiste: Uber Pickups i tacar sonraí Chathair Nua-Eabhrac

7. Brath codlatacht Tiománaithe

Feabhsaigh do scileanna trí oibriú ar an Tionscadal Eolaíochta Barr Sonraí - córas braite codlatachta le OpenCV & Keras.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Tá tiomáint codlatach thar a bheith contúirteach, agus tarlaíonn beagnach míle timpiste gach bliain de bharr tiománaithe a bheith ina gcodladh agus iad ag tiomáint. Sa tionscadal Python seo, cruthóimid córas a bheidh in ann tiománaithe codlatacha a bhrath agus freisin foláireamh a thabhairt dóibh le comhartha fuaime.

Cuirtear an tionscadal seo i bhfeidhm ag baint úsáide as Keras agus OpenCV. Úsáidfimid OpenCV chun aghaidh agus súl a bhrath agus in éineacht le Keras déanfaimid staid na súl (Oscailte nó Dúnta) a rangú ag baint úsáide as teicnící líonra néaracha domhain.

8.Chatbot

Cruthaigh Chatbot le Python agus tóg céim ar aghaidh i do ghairm bheatha - Chatbot le NLTK & Keras.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Is cuid lárnach de ghnó iad Chatbots. Bíonn ar go leor gnólachtaí seirbhísí a thairiscint dá gcustaiméirí agus tógann sé go leor daonchumhachta, am agus iarracht chun iad a fhreastal. Is féidir le Chatbots cuid mhór de d’idirghníomhaíocht le custaiméirí a uathoibriú trí roinnt ceisteanna coitianta a chuireann custaiméirí a fhreagairt. Go bunúsach tá dhá chineál chatbots: Fearann-shonrach agus Fearann ​​​​Oscailte. Is minic a úsáidtear chatbot a bhaineann go sonrach le fearann ​​chun fadhb shonrach a réiteach. Mar sin, ní mór duit é a shaincheapadh chun oibriú go héifeachtach i do réimse. Is féidir aon cheist a chur ar chatbots fearainn oscailte, mar sin teastaíonn go leor sonraí chun iad a oiliúint.

Tacar sonraí: Comhad json intinn

Teanga: Python

Ardtionscadail Eolaíochta Sonraí

9. Íomhá Fotheideal Gineadóir

Seiceáil cur i bhfeidhm iomlán an tionscadail leis an gcód foinse − Gineadóir Fotheideal Íomhá le CNN & LSTM.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Is tasc éasca do dhaoine é cur síos a dhéanamh ar a bhfuil in íomhá, ach i gcás ríomhairí, níl in íomhá ach sraith uimhreacha a léiríonn luach datha gach picteilín. Is tasc deacair é seo do ríomhairí. Tasc deacair eile é cad atá in íomhá a thuiscint agus ansin cur síos a chruthú i dteanga nádúrtha (ar nós Béarla). Úsáideann an tionscadal seo teicníochtaí domhainfhoghlama ina gcuirimid Líonra Néarthach Comhtháite (CNN) le Líonra Néarach Athfhillteach (LSTM) i bhfeidhm chun gineadóir cur síos ar íomhá a chruthú.

Tacar sonraí: Flickr 8K

Teanga: Python

Creat: Keras

10. Brath Calaoise Cárta Creidmheasa

Déan do dhícheall agus tú ag obair ar do smaoineamh ar thionscadal Eolaíocht Sonraí − calaois cárta creidmheasa a bhrath ag baint úsáide as meaisínfhoghlama.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Faoin am seo tá tú tosaithe ar na teicnící agus na coincheapa a thuiscint. A ligean ar bogadh ar aghaidh go dtí roinnt ardthionscadal eolaíocht sonraí. Sa tionscadal seo úsáidfimid teanga R le halgartaim mar crainn chinnidh, aischéimniú lóistíochta, líonraí neural saorga agus aicmitheoir treisithe grádáin. Úsáidfimid tacar sonraí d’idirbhearta cártaí chun idirbhearta cártaí creidmheasa a rangú mar chalaoiseacha nó fíor. Roghnóimid samhlacha éagsúla dóibh agus tógfaimid cuair feidhmíochta.

Teanga: R

Tacar Sonraí/Pacáiste: Tacar sonraí Idirbhearta Cárta

11. Córas Molta Scannáin

Déan staidéar ar chur i bhfeidhm an tionscadail Eolaíochta Sonraí is fearr le cód Foinse - Córas Molta Scannán i dteanga R

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Sa tionscadal Eolaíochta Sonraí seo, úsáidfimid R chun moltaí an scannáin a chur i bhfeidhm trí mheaisín-fhoghlaim. Seolann an córas moltaí moltaí chuig úsáideoirí trí phróiseas scagtha bunaithe ar shainroghanna úsáideoirí eile agus ar stair brabhsála. Más maith le A agus B le Home Alone, agus más maith le B Meanchailíní, is féidir leat A a mholadh - seans go dtaitníonn sé leo freisin. Ligeann sé seo do chustaiméirí idirghníomhú leis an ardán.

Teanga: R

Tacar Sonraí/Pacáiste: Bunachar sonraí MovieLens

12. Deighilt an Chustaiméara

Cuir tionscadal Eolaíochta Sonraí i bhfeidhm ar fhostóirí (cód foinse san áireamh) - Deighilt custaiméirí ag baint úsáide as meaisínfhoghlaim.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Is feidhmchlár coitianta é deighilt ceannaitheora foghlaim gan mhaoirseacht. Trí úsáid a bhaint as braisliú, sainaithníonn cuideachtaí deighleoga custaiméirí chun díriú ar bhonn úsáideoirí féideartha. Roinneann siad custaiméirí i ngrúpaí de réir tréithe coitianta amhail inscne, aois, leasanna agus nósanna caiteachais ionas gur féidir leo a gcuid táirgí a mhargú go héifeachtach do gach grúpa. Úsáidfimid Braisliú K-ciallaíonn, chomh maith leis an dáileadh a shamhlú de réir inscne agus aoise. Déanfaimid anailís ansin ar a leibhéil ioncaim agus caiteachais bhliantúla.

Teanga: R

Tacar Sonraí/Pacáiste: Bunachar sonraí Mall_Custaiméirí

13. Aicmiú Ailse Cíche

Amharc ar chur i bhfeidhm iomlán tionscadal Eolaíochta Sonraí i Python - Aicmiú ailse chíche ag baint úsáide as foghlaim dhomhain.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Ag teacht ar ais chuig ranníocaíocht leighis na heolaíochta sonraí, foghlaimímid conas ailse chíche a bhrath ag baint úsáide as Python. Bainfimid úsáid as tacar sonraí IDC_regular chun carcanóma ductal ionrach a aithint, an cineál ailse chíche is coitianta. Forbraíonn sé sna duchtanna bainne, ag adhlacadh isteach sa fíochán cíche snáithíneach nó sailleacha lasmuigh den ducht. Sa tionscadal eolaíochta bailithe sonraí seo úsáidfimid Deep Learning agus leabharlann Keras le haghaidh rangú.

Teanga: Python

Tacar Sonraí/Pacáiste: IDC_rialta

14. Comharthaí Tráchta a Aithint

Beachtas a bhaint amach i dteicneolaíocht féin-tiomána le tionscadal Eolaíochta Sonraí aithint comharthaí tráchta ag baint úsáide as CNN Foinse oscailte.

14 thionscadal foinse oscailte chun scileanna Eolaíochta Sonraí a fheabhsú (éasca, gnáth, crua)

Tá comharthaí bóthair agus rialacha tráchta an-tábhachtach do gach tiománaí chun timpistí a sheachaint. Chun an riail a leanúint, ní mór duit a thuiscint ar dtús cén chuma atá ar chomhartha bóthair. Ní mór do dhuine na comharthaí bóthair ar fad a fhoghlaim sula dtabharfar ceadúnas dó chun aon fheithicil a thiomáint. Ach anois tá líon na bhfeithiclí uathrialacha ag fás, agus go luath amach anseo ní bheidh duine ag tiomáint carr go neamhspleách a thuilleadh. Sa tionscadal Aithint Comharthaí Bóthair, foghlaimeoidh tú conas is féidir le clár an cineál comharthaí bóthair a aithint trí íomhá a ghlacadh mar ionchur. Úsáidtear tacar sonraí Tagarmharcanna Aitheantais Chomhartha Tráchta na Gearmáine (GTSRB) chun gréasán néarach domhain a thógáil chun an aicme lena mbaineann comhartha tráchta a aithint. Cruthaímid GUI simplí freisin chun idirghníomhú leis an bhfeidhmchlár.

Teanga: Python

Tacar sonraí: GTSRB (Tagarmharc Aitheantais Chomhartha Tráchta na Gearmáine)

Leigh Nios mo

Foinse: will.com

Add a comment