Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Data Imọ fun olubere

1. Onínọmbà Ìrònú (Onínọmbà Ìrònú nipasẹ Ọrọ)

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Ṣayẹwo jade ni pipe Data Imọ ise agbese imuse lilo koodu orisun - Ise agbese Analysis Sentiment in R.

Itupalẹ Ifarabalẹ jẹ itupalẹ awọn ọrọ lati pinnu awọn imọlara ati awọn ero, eyiti o le jẹ rere tabi odi. Eyi jẹ iru ipinya ninu eyiti awọn kilasi le jẹ alakomeji (rere ati odi) tabi pupọ (ayọ, ibinu, ibanujẹ, ẹgbin…). A yoo ṣe iṣẹ akanṣe Imọ-jinlẹ Data yii ni R ati pe a yoo lo dataset ninu package “janeaustenR”. A yoo lo awọn iwe-itumọ idi gbogbogbo gẹgẹbi AFINN, Bing ati loughran, ṣe idapọ inu, ati ni ipari a yoo ṣẹda awọsanma ọrọ kan lati ṣafihan abajade.

Ni ibamu si: R
Ipilẹ data/Papọ: janeaustenR

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

A tumọ nkan naa pẹlu atilẹyin EDISON Software, eyiti ṣe awọn yara ibamu foju fun awọn ile itaja iyasọtọ pupọAti software igbeyewo.

2. Iro News erin

Mu awọn ọgbọn rẹ lọ si ipele atẹle nipa ṣiṣẹ lori iṣẹ akanṣe Imọ-jinlẹ Data fun awọn olubere - wiwa awọn iroyin iro pẹlu Python.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Awọn iroyin iro jẹ alaye eke ti o tan kaakiri nipasẹ media awujọ ati awọn media ori ayelujara miiran lati ṣaṣeyọri awọn ibi-afẹde iṣelu. Ninu ero iṣẹ akanṣe Imọ-jinlẹ Data yii, a yoo lo Python lati kọ awoṣe kan ti o le pinnu ni deede boya itan iroyin jẹ gidi tabi iro. A yoo ṣẹda TfidfVectorizer kan ao lo PassiveAggressiveClassifier lati pin awọn iroyin si “gidi” ati “iro”. A yoo lo dataset ti apẹrẹ 7796×4 ati ṣiṣe ohun gbogbo ni Jupyter Lab.

Ni ibamu si: Python

Ipilẹ data/Papọ: iroyin.csv

3. Wiwa Arun Pakinsini

Lọ siwaju pẹlu imọran Ise agbese Imọ-ẹrọ Data rẹ - wiwa arun Parkinson nipa lilo XGBoost.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

A ti bẹrẹ lilo Imọ-ẹrọ Data lati ṣe ilọsiwaju ilera ati awọn iṣẹ - ti a ba le ṣe asọtẹlẹ arun kan ni ipele ibẹrẹ, lẹhinna a yoo ni ọpọlọpọ awọn anfani. Nitorinaa, ninu imọran iṣẹ akanṣe Imọ-jinlẹ Data yii, a yoo kọ bii a ṣe le rii arun Parkinson nipa lilo Python. O jẹ neurodegenerative, arun ilọsiwaju ti eto aifọkanbalẹ aarin ti o ni ipa lori gbigbe ati fa gbigbọn ati lile. O ni ipa lori awọn neuronu ti o nmu dopamine ni ọpọlọ, ati ni gbogbo ọdun, o kan diẹ sii ju 1 milionu eniyan ni India.

Ni ibamu si: Python

Ipilẹ data/Papọ: UCI ML Parkinsons dataset

Data Science ise agbese ti alabọde complexity

4. Ifarahan Ọrọ idanimọ

Ṣayẹwo jade ni pipe imuse ti Data Science apẹẹrẹ ise agbese - idanimọ ọrọ nipa lilo Librosa.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Jẹ ki a ni bayi ko bi a ṣe le lo awọn ile-ikawe oriṣiriṣi. Ise agbese Imọ Data yii nlo librosa fun idanimọ ọrọ. SER jẹ ilana ti idamo awọn ẹdun eniyan ati awọn ipinlẹ ipa lati ọrọ sisọ. Niwọn igba ti a lo ohun orin ati ipolowo lati ṣafihan ẹdun pẹlu awọn ohun wa, SER jẹ pataki. Ṣugbọn niwọn igba ti awọn ẹdun jẹ koko-ọrọ, asọye ohun jẹ iṣẹ-ṣiṣe nija kan. A yoo lo mfcc, chroma ati awọn iṣẹ mel ati lo ipilẹ data RAVDESS fun idanimọ ẹdun. A yoo ṣẹda classifier MLPC fun awoṣe yii.

Ni ibamu si: Python

Ipilẹ data/Papọ: RAVDESS dataset

5. Iwa akọ ati ọjọ ori

Ṣe iwunilori awọn agbanisiṣẹ pẹlu iṣẹ akanṣe Imọ-jinlẹ data tuntun - ti npinnu iwa ati ọjọ ori nipa lilo OpenCV.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Eyi jẹ Imọ-jinlẹ Data ti o nifẹ pẹlu Python. Lilo aworan kan, iwọ yoo kọ ẹkọ lati sọ asọtẹlẹ akọ ati ọjọ ori eniyan. Ninu eyi a yoo ṣafihan rẹ si Iranran Kọmputa ati awọn ipilẹ rẹ. A yoo kọ convolutional nkankikan nẹtiwọki ati pe yoo lo awọn awoṣe ikẹkọ nipasẹ Tal Hassner ati Gil Levy lori dataset Adience. Ni ọna a yoo lo diẹ ninu awọn faili .pb, .pbtxt, .prototxt ati .caffemodel.

Ni ibamu si: Python

Ipilẹ data/Papọ: Adience

6. Uber Data Analysis

Ṣayẹwo jade ni pipe Data Imọ ise agbese imuse pẹlu orisun koodu - Ise agbese Iṣiro data Uber ni R.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Eyi jẹ iṣẹ akanṣe iworan data pẹlu ggplot2 ninu eyiti a yoo lo R ati awọn ile-ikawe rẹ ati ṣe itupalẹ ọpọlọpọ awọn aye. A yoo lo dataset Uber Pickups Ilu New York ati ṣẹda awọn iwoye fun awọn fireemu akoko oriṣiriṣi ti ọdun. Eyi sọ fun wa bi akoko ṣe ni ipa lori irin-ajo alabara.

Ni ibamu si: R

Ipilẹ data/Papọ: Uber Pickups ni New York City dataset

7. Driver Drowsiness erin

Ṣe ilọsiwaju awọn ọgbọn rẹ nipa ṣiṣẹ lori Ise-iṣẹ Imọ-jinlẹ Data ti oke - Eto wiwa drowsiness pẹlu OpenCV & Keras.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Wiwakọ aifọkujẹ lewu pupọ, ati pe o fẹrẹ to ẹgbẹrun awọn ijamba maa n waye ni ọdọọdun nitori awọn awakọ ti sun oorun lakoko iwakọ. Ninu iṣẹ akanṣe Python yii, a yoo ṣẹda eto kan ti o le rii awọn awakọ ti oorun ati tun ṣe itaniji wọn pẹlu ifihan ohun ohun.

Ise agbese yii jẹ imuse nipa lilo Keras ati OpenCV. A yoo lo OpenCV fun wiwa oju ati oju ati pẹlu Keras a yoo ṣe iyatọ ipo oju (Ṣi tabi Tiipa) nipa lilo awọn ilana nẹtiwọọki ti o jinlẹ.

8. Chatbot

Ṣẹda Chatbot pẹlu Python ki o ṣe igbesẹ siwaju ninu iṣẹ rẹ - Chatbot pẹlu NLTK & Keras.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Chatbots jẹ apakan pataki ti iṣowo. Ọpọlọpọ awọn iṣowo ni lati pese awọn iṣẹ si awọn alabara wọn ati pe o gba agbara eniyan pupọ, akoko ati ipa lati ṣe iranṣẹ fun wọn. Chatbots le ṣe adaṣe pupọ ti ibaraenisepo alabara rẹ nipa didahun diẹ ninu awọn ibeere ti o wọpọ ti awọn alabara beere. Nibẹ ni o wa besikale meji orisi ti chatbots: Domain-pato ati Open-ašẹ. chatbot kan pato ti agbegbe ni a maa n lo lati yanju iṣoro kan pato. Nitorinaa, o nilo lati ṣe akanṣe rẹ lati ṣiṣẹ ni imunadoko ni aaye rẹ. Ṣii-ašẹ chatbots le wa ni beere eyikeyi ibeere, ki ikẹkọ wọn nilo kan tobi iye ti data.

Eto data: Intents json faili

Ni ibamu si: Python

To ti ni ilọsiwaju Data Science ise agbese

9. Aworan ifori monomono

Ṣayẹwo imuse pipe ti iṣẹ akanṣe pẹlu koodu orisun - Aworan ifori monomono pẹlu CNN & LSTM.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Apejuwe ohun ti o wa ninu aworan jẹ iṣẹ ti o rọrun fun eniyan, ṣugbọn fun awọn kọnputa, aworan kan jẹ lẹsẹsẹ awọn nọmba ti o jẹ aṣoju iye awọ ti ẹbun kọọkan. Eleyi jẹ a soro-ṣiṣe fun awọn kọmputa. Loye ohun ti o wa ninu aworan ati lẹhinna ṣiṣẹda apejuwe ni ede adayeba (bii Gẹẹsi) jẹ iṣẹ-ṣiṣe ti o nira miiran. Ise agbese yii nlo awọn ilana ikẹkọ ti o jinlẹ ninu eyiti a ṣe imuse Nẹtiwọọki Neural Convolutional (CNN) pẹlu Nẹtiwọọki Neural Loorekoore (LSTM) lati ṣẹda olupilẹṣẹ apejuwe aworan.

Eto data: Flicker 8K

Ni ibamu si: Python

Ilana: Keras

10. Kirẹditi kaadi jegudujera erin

Ṣe ohun ti o dara julọ lakoko ti o n ṣiṣẹ lori imọran iṣẹ akanṣe Imọ-jinlẹ Data rẹ - ri jegudujera kaadi kirẹditi lilo ẹrọ eko.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Ni bayi o ti bẹrẹ lati ni oye awọn ilana ati awọn imọran. Jẹ ki a lọ si diẹ ninu awọn iṣẹ akanṣe imọ-jinlẹ data to ti ni ilọsiwaju. Ninu iṣẹ akanṣe yii a yoo lo ede R pẹlu awọn algoridimu bii awọn igi ipinnu, ipadasẹhin eekaderi, awọn nẹtiwọọki nkankikan atọwọda ati ikasi igbega gradient. A yoo lo iwe data ti awọn iṣowo kaadi lati ṣe iyatọ awọn iṣowo kaadi kirẹditi bi ẹtan tabi otitọ. A yoo yan awọn awoṣe oriṣiriṣi fun wọn ati kọ awọn iṣipopada iṣẹ.

Ni ibamu si: R

Ipilẹ data/Papọ: Kaadi lẹkọ dataset

11. Movie Recommendation System

Kọ ẹkọ imuse ti iṣẹ akanṣe Imọ-jinlẹ data ti o dara julọ pẹlu koodu Orisun - Eto Iṣeduro fiimu ni ede R

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Ninu iṣẹ akanṣe Imọ-jinlẹ Data yii, a yoo lo R lati ṣe awọn iṣeduro fiimu naa nipasẹ kikọ ẹrọ. Eto iṣeduro nfi awọn didaba ranṣẹ si awọn olumulo nipasẹ ilana sisẹ kan ti o da lori awọn ayanfẹ awọn olumulo miiran ati itan lilọ kiri ayelujara. Ti A ati B ba fẹran Ile nikan, ati B fẹran Awọn ọmọbirin Itumọ, lẹhinna o le daba A - wọn le fẹran rẹ paapaa. Eyi n gba awọn alabara laaye lati ṣe ajọṣepọ pẹlu pẹpẹ.

Ni ibamu si: R

Ipilẹ data/Papọ: MovieLens data

12. Onibara ipin

Ṣe iwunilori awọn agbanisiṣẹ pẹlu iṣẹ akanṣe Imọ-jinlẹ Data kan (pẹlu koodu orisun) - Ipin alabara nipa lilo ẹkọ ẹrọ.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Ipin olura jẹ ohun elo olokiki ẹkọ ti ko ni abojuto. Lilo iṣupọ, awọn ile-iṣẹ ṣe idanimọ awọn apakan alabara lati fojusi ipilẹ olumulo ti o pọju. Wọn pin awọn alabara si awọn ẹgbẹ ni ibamu si awọn abuda ti o wọpọ gẹgẹbi akọ-abo, ọjọ-ori, awọn iwulo ati awọn iṣe inawo ki wọn le ṣe ta ọja wọn daradara si ẹgbẹ kọọkan. A yoo lo K-tumọ si iṣupọ, bakannaa ṣe akiyesi pinpin nipasẹ abo ati ọjọ ori. A yoo ṣe itupalẹ owo-wiwọle lododun wọn ati awọn ipele inawo.

Ni ibamu si: R

Ipilẹ data/Papọ: Mall_Customers dataset

13. Oyan akàn Classification

Ṣayẹwo imuse pipe ti iṣẹ akanṣe Imọ-jinlẹ data ni Python - Iyasọtọ akàn igbaya nipa lilo ẹkọ ti o jinlẹ.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Pada si idasi iṣoogun ti imọ-jinlẹ data, jẹ ki a kọ bii o ṣe le rii ọgbẹ igbaya nipa lilo Python. A yoo lo IDC_regular dataset lati ṣe idanimọ carcinoma ductal invasive, fọọmu ti o wọpọ julọ ti alakan igbaya. O ndagba ninu awọn ọna wara, nbọ sinu fibrous tabi ọra igbaya àsopọ ita ita. Ninu ero iṣẹ imọ-jinlẹ ikojọpọ data yii a yoo lo Jin ẹkọ ati Keras ìkàwé fun classification.

Ni ibamu si: Python

Ipilẹ data/Papọ: IDC_deede

14. Traffic Ami idanimọ

Iṣeyọri pipe ni imọ-ẹrọ awakọ ti ara ẹni pẹlu iṣẹ akanṣe Imọ-jinlẹ Data idanimọ ami ijabọ lilo CNN ìmọ orisun.

Awọn iṣẹ-ṣiṣe orisun-ìmọ 14 lati mu ilọsiwaju imọ-jinlẹ Data rẹ (rọrun, deede, lile)

Awọn ami opopona ati awọn ofin ijabọ jẹ pataki pupọ fun gbogbo awakọ lati yago fun awọn ijamba. Lati tẹle ofin naa, o nilo akọkọ lati ni oye kini ami ọna opopona dabi. Eniyan gbọdọ kọ gbogbo awọn ami opopona ṣaaju ki o to fun ni iwe-aṣẹ lati wakọ eyikeyi ọkọ. Ṣugbọn ni bayi nọmba awọn ọkọ ayọkẹlẹ adase n dagba, ati ni ọjọ iwaju nitosi eniyan kii yoo wakọ ọkọ ayọkẹlẹ kan ni ominira. Ninu iṣẹ idanimọ Oju-ọna, iwọ yoo kọ bii eto kan ṣe le ṣe idanimọ iru awọn ami opopona nipa gbigbe aworan bi titẹ sii. Atọka data idanimọ Ibuwọlu Ijabọ Ilu Jamani (GTSRB) ni a lo lati kọ nẹtiwọọki nkankikan ti o jinlẹ lati ṣe idanimọ kilasi eyiti ami ijabọ jẹ ti. A tun ṣẹda GUI ti o rọrun lati ṣe ajọṣepọ pẹlu ohun elo naa.

Ni ibamu si: Python

Eto data: GTSRB (Iṣe idanimọ Awọn ami Ijabọ ti Jamani)

Ka siwaju

orisun: www.habr.com

Fi ọrọìwòye kun