Sentiment Analysis bụ nyocha nke okwu iji chọpụta mmetụta na echiche, nke nwere ike ịdị mma ma ọ bụ nke na-adịghị mma. Nke a bụ ụdị nhazi ọkwa nke klas nwere ike ịbụ ọnụọgụ abụọ (nke dị mma na nke na-adịghị mma) ma ọ bụ ọtụtụ (obi ụtọ, iwe, mwute, mkparị ...). Anyị ga-emejuputa atumatu Sayensị Data a na R ma ga-eji dataset na ngwugwu "janeaustenR". Anyị ga-eji akwụkwọ ọkọwa okwu izugbe dịka AFINN, bing na loughran, mee njikọ dị n'ime, na njedebe anyị ga-emepụta ígwé ojii okwu iji gosipụta nsonaazụ ya.
Akụkọ adịgboroja bụ ozi ụgha na-agbasa site na mgbasa ozi ọha na eze na mgbasa ozi ịntanetị ndị ọzọ iji nweta ebumnuche ndọrọ ndọrọ ọchịchị. N'ime echiche ọrụ sayensị data a, anyị ga-eji Python wuo ihe nlere nke nwere ike ikpebi nke ọma ma akụkọ akụkọ ọ bụ eziokwu ka ọ bụ adịgboroja. Anyị ga-emepụta TfidfVectorizer wee jiri PassiveAggressiveClassifier kewaa ozi ka ọ bụrụ "ezigbo" na "adịgboroja". Anyị ga-eji dataset nke ụdị 7796 × 4 wee mee ihe niile na Jupyter Lab.
Anyị amalitela iji Science Data iji kwalite ahụike na ọrụ - ọ bụrụ na anyị nwere ike ịkọ ọrịa na mmalite, mgbe ahụ anyị ga-enwe ọtụtụ uru. Yabụ, na echiche ọrụ sayensị data a, anyị ga-amụta ka esi achọpụta ọrịa Parkinson site na iji Python. Ọ bụ neurodegenerative, ọrịa na-aga n'ihu nke usoro nhụjuanya nke etiti na-emetụta mmegharị ahụ ma na-akpata ịma jijiji na isi ike. Ọ na-emetụta neurons na-emepụta dopamine na ụbụrụ, na kwa afọ, ọ na-emetụta ihe karịrị nde mmadụ 1 na India.
Ire: Python
Nchịkọta/Ngwugwu: UCI ML Parkinsons ihe ndekọ akụkọ ego
Ka anyị mụta ugbu a ka esi eji ọba akwụkwọ dị iche iche. Ọrụ Sayensị Data a na-eji librosa maka njirimara okwu. SER bụ usoro nke ịchọpụta mmetụta uche mmadụ na ọnọdụ mmetụta sitere na okwu. Ebe anyị na-eji ụda na ụda egosipụta mmetụta n'olu anyị, SER dị mkpa. Mana ebe ọ bụ na mmetụta uche bụ nke onwe, nkọwa ọdịyo bụ ọrụ siri ike. Anyị ga-eji mfcc, chroma na mel ọrụ ma jiri RAVDESS dataset maka njirimara mmetụta. Anyị ga-emepụta classifier MLPC maka ihe nlereanya a.
Nke a bụ sayensị data na-atọ ụtọ na Python. N'iji naanị otu foto mee ihe, ị ga-amụta ịkọ nwoke na nwanyị na afọ ndụ ya. Na nke a anyị ga-ewebata gị na Kọmputa Vision na ụkpụrụ ya. Anyị ga-ewu convolutional neural netwọk ma ga-eji ụdị ndị Tal Hassner na Gil Levy zụrụ na dataset Adience. N'ụzọ anyị ga-eji ụfọdụ .pb, .pbtxt, .prototxt na .caffemodel faịlụ.
Nke a bụ ọrụ nhụta data nwere ggplot2 nke anyị ga-eji R na ọba akwụkwọ ya wee nyochaa paramita dị iche iche. Anyị ga-eji dataset Uber Pickups New York City wee mepụta ihe ngosi maka oge dị iche iche nke afọ. Nke a na-agwa anyị ka oge si emetụta njem ndị ahịa.
Ire: R
Nchịkọta/Ngwugwu: Uber Pickups na New York City dataset
Ịnya ụra nke ukwuu dị nnọọ ize ndụ, ihe fọrọ nke nta ka ọ bụrụ otu puku ihe mberede na-eme kwa afọ n'ihi ndị ọkwọ ụgbọala na-ehi ụra mgbe ha na-anya ụgbọ ala. N'ime ọrụ Python a, anyị ga-emepụta usoro nke nwere ike ịchọpụta ndị ọkwọ ụgbọ ala na-ehi ụra ma jiri mgbama ọdịyo mara ha.
A na-eji Keras na OpenCV arụ ọrụ a. Anyị ga-eji OpenCV maka nchọpụta ihu na anya na Keras anyị ga-ekewa ọnọdụ anya (Mepee ma ọ bụ mechie) site na iji usoro netwọkụ akwara miri emi.
Chatbots bụ akụkụ dị mkpa nke azụmahịa. Ọtụtụ ụlọ ọrụ ga-enye ndị ahịa ha ọrụ yana ọ na-ewe nnukwu ọrụ, oge na mbọ iji jeere ha ozi. Chatbots nwere ike megharịa ọtụtụ mmekọrịta ndị ahịa gị site na ịza ajụjụ ụfọdụ ndị ahịa na-ajụ. Enwere ụdị nkata nkata abụọ: ngalaba-kpọmkwem na Open-domain. A na-ejikarị nkata nkata akọwapụtara na ngalaba iji dozie otu nsogbu. Yabụ, ịkwesịrị ịhazi ya ka ọ rụọ ọrụ nke ọma na ngalaba gị. Enwere ike ịjụ chatbots ngalaba mepere emepe ajụjụ ọ bụla, yabụ ọzụzụ ha chọrọ nnukwu data.
Ịkọwa ihe dị na onyonyo bụ ọrụ dị mfe maka mmadụ, mana maka kọmpụta, onyonyo bụ naanị ọnụọgụ ọnụọgụ na-anọchi anya uru agba nke pikselụ ọ bụla. Nke a bụ ọrụ siri ike maka kọmputa. Ịghọta ihe dị na onyonyo wee mepụta nkọwa n'asụsụ eke (dịka Bekee) bụ ọrụ ọzọ siri ike. Ihe oru ngo a na-eji usoro mmụta miri emi nke anyị na-emejuputa a Convolutional Neural Network (CNN) nke nwere Recurrent Neural Network (LSTM) iji mepụta generator nkọwa ihe oyiyi.
Ka ọ dị ugbu a, ị malitela ịghọta usoro na echiche. Ka anyị gaa n'ihu na ụfọdụ ọrụ sayensị data dị elu. N'ime oru ngo a, anyị ga-eji asụsụ R na algọridim dị ka mkpebi osisi, mgbagha mgbagha, netwọk akwara arụrụ arụ na gradient boosting classifier. Anyị ga-eji dataset nke azụmahịa kaadị ekewa azụmahịa azụmahịa kaadị kredit dị ka aghụghọ ma ọ bụ ezigbo. Anyị ga-ahọrọ ụdị dị iche iche maka ha ma wuo akụkụ arụmọrụ.
N'ime ọrụ sayensị data a, anyị ga-eji R mejuputa ntụnye ihe nkiri ahụ site na mmụta igwe. Usoro nkwanye na-eziga aro ndị ọrụ site na usoro nzacha dabere na mmasị ndị ọrụ ndị ọzọ na akụkọ nchọgharị. Ọ bụrụ na A na B dị ka Ụlọ naanị ya, na B nwere mmasị na ụmụ agbọghọ pụtara, mgbe ahụ ị nwere ike ịtụ aro A - ha nwekwara ike ịmasị ya. Nke a na-enye ndị ahịa ohere ịmekọrịta na ikpo okwu.
Nkeji onye na-azụ ahịa bụ ngwa ewu ewu mmụta na-enweghị nlekọta. N'iji ụyọkọ, ụlọ ọrụ na-achọpụta akụkụ ndị ahịa iji lekwasịrị anya na ntọala onye ọrụ nwere ike. Ha na-ekewa ndị ahịa n'ìgwè dị iche iche dabere na njirimara ndị a na-ahụkarị dị ka okike, afọ, mmasị na usoro mmefu ego ka ha wee nwee ike ịzụ ahịa ha nke ọma n'otu ọ bụla. Anyị ga-eji K-pụtara nchịkọta, yana were anya nkesa nkesa site na okike na afọ. Anyị ga-enyocha ego ha na-enweta kwa afọ na ọkwa akwụ ụgwọ ha.
Na-alaghachi na ntinye aka ahụike nke sayensị data, ka anyị mụta otu esi achọpụta ọrịa ara ara site na iji Python. Anyị ga-eji dataset IDC_regular iji chọpụta carcinoma ductal invasive, ụdị ọrịa kansa ara na-adịkarị. Ọ na-etolite n'ime ọwa mmiri ara ehi, na-abanye n'ime anụ ahụ fibrous ma ọ bụ abụba abụba n'èzí duct. N'ime echiche ọrụ sayensị nnakọta data anyị ga-eji Ịmụta nke ọma na ọba akwụkwọ Keras maka nhazi ọkwa.
Akara ngosi okporo ụzọ na iwu okporo ụzọ dị ezigbo mkpa maka onye ọkwọ ụgbọ ala ọ bụla iji zere ihe mberede. Iji soro iwu a, ị ga-ebu ụzọ ghọta ihe akara okporo ụzọ dị. Mmadụ ga-amụtarịrị akara okporo ụzọ niile tupu enye ya ikike ịnya ụgbọ ala ọ bụla. Mana ugbu a ọnụ ọgụgụ ụgbọ ala kwụụrụ onwe ya na-abawanye, na n'ọdịnihu dị nso, mmadụ agaghị akwọ ụgbọ ala n'onwe ya. N'ime ọrụ nnabata akara okporo ụzọ, ị ga-amụta ka mmemme ga-esi amata ụdị akara okporo ụzọ site na ịse onyonyo dịka ntinye. A na-eji dataset nke German Traffic Sign Recognition Benchmark (GTSRB) iji wuo netwọk akwara miri emi iji mata klas nke akara okporo ụzọ nwere. Anyị na-emepụtakwa GUI dị mfe iji soro ngwa ahụ na-emekọrịta ihe.