Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Sayensị data maka ndị mbido

1. Nyocha mmetụta (Sentiment Analysis site na ederede)

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Lelee mmejuputa ọrụ sayensị data zuru oke site na iji koodu isi mmalite - Ihe nyocha nke Sentiment na R.

Sentiment Analysis bụ nyocha nke okwu iji chọpụta mmetụta na echiche, nke nwere ike ịdị mma ma ọ bụ nke na-adịghị mma. Nke a bụ ụdị nhazi ọkwa nke klas nwere ike ịbụ ọnụọgụ abụọ (nke dị mma na nke na-adịghị mma) ma ọ bụ ọtụtụ (obi ụtọ, iwe, mwute, mkparị ...). Anyị ga-emejuputa atumatu Sayensị Data a na R ma ga-eji dataset na ngwugwu "janeaustenR". Anyị ga-eji akwụkwọ ọkọwa okwu izugbe dịka AFINN, bing na loughran, mee njikọ dị n'ime, na njedebe anyị ga-emepụta ígwé ojii okwu iji gosipụta nsonaazụ ya.

Ire: R
Nchịkọta/Ngwugwu: janeaustenR

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Atụgharịrị akụkọ a site na nkwado nke EDISON Software, nke na-eme ka ime ụlọ dabara adaba maka ụlọ ahịa nwere ọtụtụ ụdịNa anwale software.

2. Achọpụta akụkọ adịgboroja

Were nkà gị gaa n'ọkwa ọzọ site n'ịrụ ọrụ na ọrụ sayensị data maka ndị mbido - iji Python chọpụta akụkọ adịgboroja.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Akụkọ adịgboroja bụ ozi ụgha na-agbasa site na mgbasa ozi ọha na eze na mgbasa ozi ịntanetị ndị ọzọ iji nweta ebumnuche ndọrọ ndọrọ ọchịchị. N'ime echiche ọrụ sayensị data a, anyị ga-eji Python wuo ihe nlere nke nwere ike ikpebi nke ọma ma akụkọ akụkọ ọ bụ eziokwu ka ọ bụ adịgboroja. Anyị ga-emepụta TfidfVectorizer wee jiri PassiveAggressiveClassifier kewaa ozi ka ọ bụrụ "ezigbo" na "adịgboroja". Anyị ga-eji dataset nke ụdị 7796 × 4 wee mee ihe niile na Jupyter Lab.

Ire: Python

Nchịkọta/Ngwugwu: ozi.csv

3. Ịchọpụta Ọrịa Parkinson

Gaa n'ihu n'Idea Science Project gị - iji XGBoost chọpụta ọrịa Parkinson.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Anyị amalitela iji Science Data iji kwalite ahụike na ọrụ - ọ bụrụ na anyị nwere ike ịkọ ọrịa na mmalite, mgbe ahụ anyị ga-enwe ọtụtụ uru. Yabụ, na echiche ọrụ sayensị data a, anyị ga-amụta ka esi achọpụta ọrịa Parkinson site na iji Python. Ọ bụ neurodegenerative, ọrịa na-aga n'ihu nke usoro nhụjuanya nke etiti na-emetụta mmegharị ahụ ma na-akpata ịma jijiji na isi ike. Ọ na-emetụta neurons na-emepụta dopamine na ụbụrụ, na kwa afọ, ọ na-emetụta ihe karịrị nde mmadụ 1 na India.

Ire: Python

Nchịkọta/Ngwugwu: UCI ML Parkinsons ihe ndekọ akụkọ ego

Data Science oru ngo nke ọkara mgbagwoju anya

4. Nghọta mmetụta uche okwu

Lelee mmejuputa iwu zuru oke nke ọrụ ihe atụ Sayensị Data - njirimara okwu site na iji Librosa.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Ka anyị mụta ugbu a ka esi eji ọba akwụkwọ dị iche iche. Ọrụ Sayensị Data a na-eji librosa maka njirimara okwu. SER bụ usoro nke ịchọpụta mmetụta uche mmadụ na ọnọdụ mmetụta sitere na okwu. Ebe anyị na-eji ụda na ụda egosipụta mmetụta n'olu anyị, SER dị mkpa. Mana ebe ọ bụ na mmetụta uche bụ nke onwe, nkọwa ọdịyo bụ ọrụ siri ike. Anyị ga-eji mfcc, chroma na mel ọrụ ma jiri RAVDESS dataset maka njirimara mmetụta. Anyị ga-emepụta classifier MLPC maka ihe nlereanya a.

Ire: Python

Nchịkọta/Ngwugwu: Ihe ndekọ data RAVDESS

5. Nchọpụta okike na afọ

Mee ka ndị ọrụ were were ọrụ sayensị data kachasị ọhụrụ - na-ekpebi okike na afọ site na iji OpenCV.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Nke a bụ sayensị data na-atọ ụtọ na Python. N'iji naanị otu foto mee ihe, ị ga-amụta ịkọ nwoke na nwanyị na afọ ndụ ya. Na nke a anyị ga-ewebata gị na Kọmputa Vision na ụkpụrụ ya. Anyị ga-ewu convolutional neural netwọk ma ga-eji ụdị ndị Tal Hassner na Gil Levy zụrụ na dataset Adience. N'ụzọ anyị ga-eji ụfọdụ .pb, .pbtxt, .prototxt na .caffemodel faịlụ.

Ire: Python

Nchịkọta/Ngwugwu: Adience

6. Uber Data Analysis

Lelee mmejuputa oru ngo Science Science zuru oke na koodu isi mmalite - Uber Data Analysis Project na R.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Nke a bụ ọrụ nhụta data nwere ggplot2 nke anyị ga-eji R na ọba akwụkwọ ya wee nyochaa paramita dị iche iche. Anyị ga-eji dataset Uber Pickups New York City wee mepụta ihe ngosi maka oge dị iche iche nke afọ. Nke a na-agwa anyị ka oge si emetụta njem ndị ahịa.

Ire: R

Nchịkọta/Ngwugwu: Uber Pickups na New York City dataset

7. Nchọpụta ụra nke ọkwọ ụgbọala

Melite nkà gị site na ịrụ ọrụ na Top Data Science Project - Sistemụ nchọpụta iro ụra nwere OpenCV & Keras.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Ịnya ụra nke ukwuu dị nnọọ ize ndụ, ihe fọrọ nke nta ka ọ bụrụ otu puku ihe mberede na-eme kwa afọ n'ihi ndị ọkwọ ụgbọala na-ehi ụra mgbe ha na-anya ụgbọ ala. N'ime ọrụ Python a, anyị ga-emepụta usoro nke nwere ike ịchọpụta ndị ọkwọ ụgbọ ala na-ehi ụra ma jiri mgbama ọdịyo mara ha.

A na-eji Keras na OpenCV arụ ọrụ a. Anyị ga-eji OpenCV maka nchọpụta ihu na anya na Keras anyị ga-ekewa ọnọdụ anya (Mepee ma ọ bụ mechie) site na iji usoro netwọkụ akwara miri emi.

8. Nkata

Mepụta Chatbot na Python wee gaa n'ihu n'ọrụ gị - Chatbot na NLTK & Keras.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Chatbots bụ akụkụ dị mkpa nke azụmahịa. Ọtụtụ ụlọ ọrụ ga-enye ndị ahịa ha ọrụ yana ọ na-ewe nnukwu ọrụ, oge na mbọ iji jeere ha ozi. Chatbots nwere ike megharịa ọtụtụ mmekọrịta ndị ahịa gị site na ịza ajụjụ ụfọdụ ndị ahịa na-ajụ. Enwere ụdị nkata nkata abụọ: ngalaba-kpọmkwem na Open-domain. A na-ejikarị nkata nkata akọwapụtara na ngalaba iji dozie otu nsogbu. Yabụ, ịkwesịrị ịhazi ya ka ọ rụọ ọrụ nke ọma na ngalaba gị. Enwere ike ịjụ chatbots ngalaba mepere emepe ajụjụ ọ bụla, yabụ ọzụzụ ha chọrọ nnukwu data.

Ntọala data: Intents json faịlụ

Ire: Python

Ọrụ sayensị data dị elu

9. Ihe onyonyo onyonyo

Lelee mmejuputa iwu zuru oke nke oru ngo na koodu isi iyi - Igwe ihe onyonyo onyonyo nwere CNN & LSTM.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Ịkọwa ihe dị na onyonyo bụ ọrụ dị mfe maka mmadụ, mana maka kọmpụta, onyonyo bụ naanị ọnụọgụ ọnụọgụ na-anọchi anya uru agba nke pikselụ ọ bụla. Nke a bụ ọrụ siri ike maka kọmputa. Ịghọta ihe dị na onyonyo wee mepụta nkọwa n'asụsụ eke (dịka Bekee) bụ ọrụ ọzọ siri ike. Ihe oru ngo a na-eji usoro mmụta miri emi nke anyị na-emejuputa a Convolutional Neural Network (CNN) nke nwere Recurrent Neural Network (LSTM) iji mepụta generator nkọwa ihe oyiyi.

Ntọala data: Flicker 8K

Ire: Python

Framework: Keras

10. Nchọpụta aghụghọ kaadị kredit

Mee ike gị niile ka ị na-arụ ọrụ na echiche ọrụ sayensị data gị - chọpụta aghụghọ kaadị kredit site na iji mmụta igwe.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Ka ọ dị ugbu a, ị malitela ịghọta usoro na echiche. Ka anyị gaa n'ihu na ụfọdụ ọrụ sayensị data dị elu. N'ime oru ngo a, anyị ga-eji asụsụ R na algọridim dị ka mkpebi osisi, mgbagha mgbagha, netwọk akwara arụrụ arụ na gradient boosting classifier. Anyị ga-eji dataset nke azụmahịa kaadị ekewa azụmahịa azụmahịa kaadị kredit dị ka aghụghọ ma ọ bụ ezigbo. Anyị ga-ahọrọ ụdị dị iche iche maka ha ma wuo akụkụ arụmọrụ.

Ire: R

Nchịkọta/Ngwugwu: Dataset azụmahịa kaadị

11. Sistemụ Nkwanye ihe nkiri

Mụta mmejuputa atumatu Science Science kacha mma na koodu isi mmalite - Sistemụ Nkwanye ihe nkiri n'asụsụ R

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

N'ime ọrụ sayensị data a, anyị ga-eji R mejuputa ntụnye ihe nkiri ahụ site na mmụta igwe. Usoro nkwanye na-eziga aro ndị ọrụ site na usoro nzacha dabere na mmasị ndị ọrụ ndị ọzọ na akụkọ nchọgharị. Ọ bụrụ na A na B dị ka Ụlọ naanị ya, na B nwere mmasị na ụmụ agbọghọ pụtara, mgbe ahụ ị nwere ike ịtụ aro A - ha nwekwara ike ịmasị ya. Nke a na-enye ndị ahịa ohere ịmekọrịta na ikpo okwu.

Ire: R

Nchịkọta/Ngwugwu: Ihe ndekọ MovieLens

12. Ndị ahịa Nkeji

Mee ka ndị na-ewe mmadụ n'ọrụ nwee ọrụ sayensị data (gụnyere koodu isi mmalite) - Nkewa ndị ahịa na-eji mmụta igwe.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Nkeji onye na-azụ ahịa bụ ngwa ewu ewu mmụta na-enweghị nlekọta. N'iji ụyọkọ, ụlọ ọrụ na-achọpụta akụkụ ndị ahịa iji lekwasịrị anya na ntọala onye ọrụ nwere ike. Ha na-ekewa ndị ahịa n'ìgwè dị iche iche dabere na njirimara ndị a na-ahụkarị dị ka okike, afọ, mmasị na usoro mmefu ego ka ha wee nwee ike ịzụ ahịa ha nke ọma n'otu ọ bụla. Anyị ga-eji K-pụtara nchịkọta, yana were anya nkesa nkesa site na okike na afọ. Anyị ga-enyocha ego ha na-enweta kwa afọ na ọkwa akwụ ụgwọ ha.

Ire: R

Nchịkọta/Ngwugwu: Ụlọ ahịa ahịa_Customers dataset

13. Nhazi ọrịa ara ara

Lelee mmejuputa atumatu Science Science na Python - Nkewa ọrịa kansa ara site na iji mmụta miri emi.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Na-alaghachi na ntinye aka ahụike nke sayensị data, ka anyị mụta otu esi achọpụta ọrịa ara ara site na iji Python. Anyị ga-eji dataset IDC_regular iji chọpụta carcinoma ductal invasive, ụdị ọrịa kansa ara na-adịkarị. Ọ na-etolite n'ime ọwa mmiri ara ehi, na-abanye n'ime anụ ahụ fibrous ma ọ bụ abụba abụba n'èzí duct. N'ime echiche ọrụ sayensị nnakọta data anyị ga-eji Ịmụta nke ọma na ọba akwụkwọ Keras maka nhazi ọkwa.

Ire: Python

Nchịkọta/Ngwugwu: IDC_mgbe niile

14. Ihe ịrịba ama okporo ụzọ mara

Nweta nkenke na teknụzụ ịnya ụgbọ ala na ọrụ sayensị data njirimara akara okporo ụzọ site na iji CNN isi mmalite.

Ọrụ 14 mepere emepe iji kwalite nka sayensị data gị (dị mfe, nkịtị, siri ike)

Akara ngosi okporo ụzọ na iwu okporo ụzọ dị ezigbo mkpa maka onye ọkwọ ụgbọ ala ọ bụla iji zere ihe mberede. Iji soro iwu a, ị ga-ebu ụzọ ghọta ihe akara okporo ụzọ dị. Mmadụ ga-amụtarịrị akara okporo ụzọ niile tupu enye ya ikike ịnya ụgbọ ala ọ bụla. Mana ugbu a ọnụ ọgụgụ ụgbọ ala kwụụrụ onwe ya na-abawanye, na n'ọdịnihu dị nso, mmadụ agaghị akwọ ụgbọ ala n'onwe ya. N'ime ọrụ nnabata akara okporo ụzọ, ị ga-amụta ka mmemme ga-esi amata ụdị akara okporo ụzọ site na ịse onyonyo dịka ntinye. A na-eji dataset nke German Traffic Sign Recognition Benchmark (GTSRB) iji wuo netwọk akwara miri emi iji mata klas nke akara okporo ụzọ nwere. Anyị na-emepụtakwa GUI dị mfe iji soro ngwa ahụ na-emekọrịta ihe.

Ire: Python

Ntọala data: GTSRB (Akara akara okporo ụzọ German)

GỤKWUO

isi: www.habr.com

Tinye a comment