Sentimenta analÄ«ze ir vÄrdu analÄ«ze, lai noteiktu noskaÅojumu un viedokļus, kas var bÅ«t pozitÄ«vi vai negatÄ«vi. Å is ir klasifikÄcijas veids, kurÄ klases var bÅ«t binÄras (pozitÄ«vas un negatÄ«vas) vai daudzskaitlÄ« (laimÄ«gas, dusmÄ«gas, skumjas, nejaukas...). MÄs Ä«stenosim Å”o datu zinÄtnes projektu R un izmantosim datu kopu pakotnÄ "janeaustenR". MÄs izmantosim vispÄrÄjas nozÄ«mes vÄrdnÄ«cas, piemÄram, AFINN, bing un loughran, veiksim iekÅ”Äjo savienoÅ”anu, un beigÄs izveidosim vÄrdu mÄkoni, lai parÄdÄ«tu rezultÄtu.
Viltus ziÅas ir nepatiesa informÄcija, kas tiek izplatÄ«ta sociÄlajos medijos un citos tieÅ”saistes medijos, lai sasniegtu politiskos mÄrÄ·us. Å ajÄ Data Science projekta idejÄ mÄs izmantosim Python, lai izveidotu modeli, kas var precÄ«zi noteikt, vai ziÅu stÄsts ir Ä«sts vai viltots. MÄs izveidosim TfidfVectorizer un izmantosim PassiveAggressiveClassifier, lai klasificÄtu ziÅas āÄ«stÄsā un āviltusā. MÄs izmantosim 7796 Ć 4 formas datu kopu un visu izpildÄ«sim programmÄ Jupyter Lab.
MÄs esam sÄkuÅ”i izmantot Data Science, lai uzlabotu veselÄ«bas aprÅ«pi un pakalpojumus ā ja mÄs varam paredzÄt slimÄ«bu agrÄ«nÄ stadijÄ, tad mums bÅ«s daudz priekÅ”rocÄ«bu. TÄtad Å”ajÄ Data Science projekta idejÄ mÄs uzzinÄsim, kÄ atklÄt Parkinsona slimÄ«bu, izmantojot Python. TÄ ir neirodeÄ£eneratÄ«va, progresÄjoÅ”a centrÄlÄs nervu sistÄmas slimÄ«ba, kas ietekmÄ kustÄ«bas un izraisa trÄ«ci un stÄ«vumu. Tas ietekmÄ dopamÄ«nu ražojoÅ”os neironus smadzenÄs, un katru gadu tas skar vairÄk nekÄ 1 miljonu cilvÄku IndijÄ.
Tagad iemÄcÄ«simies izmantot dažÄdas bibliotÄkas. Å ajÄ datu zinÄtnes projektÄ runas atpazÄ«Å”anai tiek izmantota librosa. SER ir cilvÄka emociju un afektÄ«vo stÄvokļu identificÄÅ”anas process no runas. TÄ kÄ mÄs izmantojam toni un toni, lai izteiktu emocijas ar savÄm balsÄ«m, SER ir bÅ«tisks. TaÄu, tÄ kÄ emocijas ir subjektÄ«vas, audio anotÄcija ir sarežģīts uzdevums. MÄs izmantosim mfcc, chroma un mel funkcijas un izmantosim RAVDESS datu kopu emociju atpazÄ«Å”anai. Å im modelim izveidosim MLPC klasifikatoru.
Å Ä« ir interesanta datu zinÄtne ar Python. Izmantojot tikai vienu attÄlu, jÅ«s iemÄcÄ«sities paredzÄt personas dzimumu un vecumu. Å ajÄ mÄs jÅ«s iepazÄ«stinÄsim ar Computer Vision un tÄs principiem. MÄs bÅ«vÄsim konvolucionÄlais neironu tÄ«kls un izmantos modeļus, kurus Tal Hassner un Gil Levy apmÄcÄ«ja Adience datu kopÄ. Pa ceļam mÄs izmantosim dažus .pb, .pbtxt, .prototxt un .caffemodel failus.
Å is ir datu vizualizÄcijas projekts ar ggplot2, kurÄ izmantosim R un tÄ bibliotÄkas un analizÄsim dažÄdus parametrus. MÄs izmantosim Uber Pickups New York City datu kopu un veidosim vizualizÄcijas dažÄdiem gada laika periodiem. Tas mums parÄda, kÄ laiks ietekmÄ klientu ceļoÅ”anu.
Valoda: R
Datu kopa/pakete: Uber Pickups in New York City datu kopa
Miegains braukÅ”ana ir ÄrkÄrtÄ«gi bÄ«stama, un katru gadu notiek gandrÄ«z tÅ«kstotis negadÄ«jumu, jo autovadÄ«tÄji aizmiguÅ”i braukÅ”anas laikÄ. Å ajÄ Python projektÄ mÄs izveidosim sistÄmu, kas spÄj noteikt miegainos draiverus un arÄ« brÄ«dinÄt tos ar audio signÄlu.
Å is projekts tiek realizÄts izmantojot Keras un OpenCV. MÄs izmantosim OpenCV sejas un acu noteikÅ”anai, un ar Keras mÄs klasificÄsim acu stÄvokli (AtvÄrts vai AizvÄrts), izmantojot dziÄ¼Ä neironu tÄ«kla metodes.
TÄrzÄÅ”anas roboti ir neatÅemama biznesa sastÄvdaļa. Daudziem uzÅÄmumiem ir jÄpiedÄvÄ pakalpojumi saviem klientiem, un to apkalpoÅ”ana prasa daudz darbaspÄka, laika un pūļu. TÄrzÄÅ”anas roboti var automatizÄt lielu daļu jÅ«su mijiedarbÄ«bas ar klientiem, atbildot uz dažiem bieži uzdotiem jautÄjumiem. BÅ«tÄ«bÄ ir divu veidu tÄrzÄÅ”anas roboti: domÄna specifiskie un atvÄrtie domÄni. KonkrÄtas problÄmas risinÄÅ”anai bieži tiek izmantots domÄna specifisks tÄrzÄÅ”anas robots. TÄtad, jums tas ir jÄpielÄgo, lai efektÄ«vi strÄdÄtu savÄ jomÄ. AtvÄrtÄ domÄna tÄrzÄÅ”anas robotiem var uzdot jebkÄdus jautÄjumus, tÄpÄc to apmÄcÄ«bai ir nepiecieÅ”ams milzÄ«gs datu apjoms.
AttÄlÄ redzamÄ aprakstÄ«Å”ana ir viegls uzdevums cilvÄkiem, bet datoriem attÄls ir vienkÄrÅ”i skaitļu sÄrija, kas atspoguļo katra pikseļa krÄsu vÄrtÄ«bu. Datoriem tas ir grÅ«ts uzdevums. VÄl viens grÅ«ts uzdevums ir saprast, kas ir attÄlÄ, un pÄc tam izveidot aprakstu dabiskÄ valodÄ (piemÄram, angļu valodÄ). Å ajÄ projektÄ tiek izmantotas dziļas mÄcÄ«Å”anÄs metodes, kurÄs mÄs ievieÅ”am konvolucionÄlo neironu tÄ«klu (CNN) ar atkÄrtotu neironu tÄ«klu (LSTM), lai izveidotu attÄla apraksta Ä£eneratoru.
Tagad jÅ«s esat sÄcis izprast metodes un jÄdzienus. PÄriesim pie dažiem progresÄ«viem datu zinÄtnes projektiem. Å ajÄ projektÄ mÄs izmantosim R valodu ar tÄdiem algoritmiem kÄ lÄmumu koki, loÄ£istikas regresija, mÄkslÄ«gie neironu tÄ«kli un gradientu paaugstinÄÅ”anas klasifikators. MÄs izmantosim karÅ”u darÄ«jumu datu kopu, lai klasificÄtu kredÄ«tkarÅ”u darÄ«jumus kÄ krÄpnieciskus vai Ä«stus. MÄs tiem atlasÄ«sim dažÄdus modeļus un izveidosim veiktspÄjas lÄ«knes.
Å ajÄ datu zinÄtnes projektÄ mÄs izmantosim R, lai Ä«stenotu filmas ieteikumus, izmantojot maŔīnmÄcÄ«Å”anos. Ieteikumu sistÄma lietotÄjiem nosÅ«ta ieteikumus, izmantojot filtrÄÅ”anas procesu, pamatojoties uz citu lietotÄju preferencÄm un pÄrlÅ«koÅ”anas vÄsturi. Ja A un B patÄ«k Home Alone, bet B patÄ«k Mean Girls, tad varat ieteikt A ā arÄ« viÅiem tas varÄtu patikt. Tas ļauj klientiem mijiedarboties ar platformu.
PircÄju segmentÄÅ”ana ir populÄra lietojumprogramma mÄcÄ«Å”anÄs bez uzraudzÄ«bas. Izmantojot klasterizÄciju, uzÅÄmumi identificÄ klientu segmentus, lai mÄrÄ·Ätu uz potenciÄlo lietotÄju bÄzi. ViÅi iedala klientus grupÄs pÄc kopÄ«gÄm pazÄ«mÄm, piemÄram, dzimuma, vecuma, interesÄm un tÄrÄÅ”anas paradumiem, lai viÅi varÄtu efektÄ«vi tirgot savus produktus katrai grupai. MÄs izmantosim K nozÄ«mÄ klasterizÄciju, kÄ arÄ« vizualizÄt sadalÄ«jumu pÄc dzimuma un vecuma. PÄc tam mÄs analizÄsim viÅu gada ienÄkumu un izdevumu lÄ«meni.
Atgriežoties pie datu zinÄtnes medicÄ«niskÄ ieguldÄ«juma, uzzinÄsim, kÄ noteikt krÅ«ts vÄzi, izmantojot Python. MÄs izmantosim IDC_regular datu kopu, lai identificÄtu invazÄ«vu ductal karcinomu, kas ir visizplatÄ«tÄkÄ krÅ«ts vÄža forma. Tas attÄ«stÄs piena kanÄlos, urbjoties Ŕķiedru vai taukainajos krÅ«Å”u audos Ärpus kanÄla. Å ajÄ datu vÄkÅ”anas zinÄtnes projekta idejÄ mÄs izmantosim Dziļa mÄcÄ«Å”anÄs un Keras bibliotÄku klasifikÄcijai.
Ceļa zÄ«mes un satiksmes noteikumi ir ļoti svarÄ«gi ikvienam autovadÄ«tÄjam, lai izvairÄ«tos no negadÄ«jumiem. Lai ievÄrotu noteikumu, vispirms ir jÄsaprot, kÄ izskatÄs ceļa zÄ«me. Personai ir jÄapgÅ«st visas ceļa zÄ«mes, pirms viÅam tiek pieŔķirta jebkura transportlÄ«dzekļa vadÄ«Å”anas tiesÄ«bas. TaÄu Å”obrÄ«d pieaug autonomo transportlÄ«dzekļu skaits, un tuvÄkajÄ nÄkotnÄ cilvÄks vairs nebrauks ar auto patstÄvÄ«gi. Ceļa zÄ«mju atpazÄ«Å”anas projektÄ jÅ«s uzzinÄsiet, kÄ programma var atpazÄ«t ceļa zÄ«mju veidus, uzÅemot attÄlu kÄ ievadi. VÄcijas satiksmes zÄ«mju atpazÄ«Å”anas etalona (GTSRB) datu kopa tiek izmantota, lai izveidotu dziļu neironu tÄ«klu, lai atpazÄ«tu klasi, kurai ceļa zÄ«me pieder. MÄs arÄ« izveidojam vienkÄrÅ”u GUI, lai mijiedarbotos ar lietojumprogrammu.
Valoda: Pitons
Datu kopa: GTSRB (VÄcijas ceļa zÄ«mju atpazÄ«Å”anas etalons)