Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Data Science ho an'ny vao manomboka

1. Famakafakana ny fihetseham-po (Fandinihana ny fihetseham-po amin'ny alΓ lan'ny lahatsoratra)

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Jereo ny fampiharana ny tetikasa Data Science feno amin'ny fampiasana kaody loharano βˆ’ Tetikasa Fanadihadiana Sentiment ao amin'ny R.

Ny famakafakana ny fihetseham-po dia ny famakafakana ny teny hamaritana ny fihetseham-po sy ny hevitra, izay mety ho tsara na ratsy. Ity dia karazana fanasokajiana izay misy kilasy afaka mimari-droa (positive sy nΓ©gatif) na plural (faly, tezitra, malahelo, nasty...). Hampihatra ity tetikasa Data Science ity amin'ny R izahay ary hampiasa ny angona ao amin'ny fonosana "janeaustenR". Hampiasa rakibolana amin'ny tanjona ankapobeny toy ny AFINN, bing ary loughran isika, hanao fampifandraisana anatiny, ary amin'ny farany dia hamorona teny rahona hanehoana ny vokatra.

Language: R
Dataset/fonosana: janeaustenR

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Nadika tamin'ny fanohanan'ny EDISON Software ny lahatsoratra, izay manao efitrano fitting virtoaly ho an'ny fivarotana marika maro, ary koa rindrambaiko fitsapana.

2. Fikarohana vaovao sandoka

Raiso amin'ny ambaratonga manaraka ny fahaizanao amin'ny alΓ lan'ny asa amin'ny tetikasa Data Science ho an'ny vao manomboka - fitadiavana vaovao sandoka amin'ny Python.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Ny vaovao sandoka dia vaovao diso miparitaka amin'ny alΓ lan'ny media sosialy sy media an-tserasera hafa mba hanatratrarana tanjona ara-politika. Amin'ity hevitra momba ny tetikasa Data Science ity, dia hampiasa Python isika hananganana modely izay afaka mamaritra tsara raha tena misy na sandoka ny vaovao iray. Hamorona TfidfVectorizer izahay ary hampiasa PassiveAggressiveClassifier hanasokajiana ny vaovao ho β€œtena” sy β€œhosoka”. Hampiasa angon-drakitra amin'ny endrika 7796 Γ— 4 izahay ary hampandeha ny zava-drehetra ao amin'ny Jupyter Lab.

Language: Python

Dataset/fonosana: news.csv

3. Famantarana ny aretin'i Parkinson

Mandrosoa miaraka amin'ny hevitrao momba ny tetikasa Data Science - mamantatra ny aretina Parkinson amin'ny fampiasana XGBoost.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Nanomboka nampiasa ny Siansa Data izahay mba hanatsarana ny fitsaboana sy ny serivisy - raha afaka maminavina aretina aloha isika dia hanana tombony maro. Noho izany, amin'ity hevitra momba ny tetikasa Data Science ity dia hianatra ny fomba hamantarana ny aretin'i Parkinson amin'ny fampiasana Python isika. Izy io dia aretina neurodegenerative, mivoatra amin'ny rafi-pitatitra foibe izay misy fiantraikany amin'ny hetsika ary miteraka horohorontany sy henjana. Misy fiantraikany amin'ny neurons mamokatra dopamine ao amin'ny atidoha izany, ary isan-taona dia misy fiantraikany amin'ny olona 1 tapitrisa mahery any India izany.

Language: Python

Dataset/fonosana: Takelaka data UCI ML Parkinson

Tetikasan'ny Data Science amin'ny fahasarotana antonony

4. Fihetseham-po amin'ny kabary

Jereo ny fampiharana feno ny tetikasa ohatra momba ny Data Science βˆ’ fanekena kabary mampiasa Librosa.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Andeha isika izao hianatra ny fomba fampiasana trano famakiam-boky samihafa. Ity tetikasa Data Science ity dia mampiasa librosa amin'ny fanekena ny kabary. Ny SER dia dingana hamantarana ny fihetseham-pon'ny olombelona sy ny toetry ny fihetseham-po avy amin'ny kabary. Satria mampiasa feo sy feo izahay hanehoana ny fihetseham-po amin'ny feonay, dia ilaina ny SER. Saingy satria ny fihetseham-po dia subjective, asa sarotra ny fanoratana audio. Hampiasa ny fiasan'ny mfcc, chroma ary mel izahay ary hampiasa ny angon-drakitra RAVDESS mba hamantarana ny fihetseham-po. Hamorona fanasokajiana MLPC ho an'ity modely ity izahay.

Language: Python

Dataset/fonosana: Takelaka data RAVDESS

5. Fikarohana ny lahy sy ny vavy

Manaitra ny mpampiasa amin'ny tetikasa Data Science farany indrindra - mamaritra ny lahy sy ny vavy amin'ny fampiasana OpenCV.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Ity dia Siansa Data mahaliana miaraka amin'ny Python. Amin'ny fampiasana sary iray monja dia hianatra maminavina ny lahy sy ny vavy ianao. Amin'ity dia hampahafantatra anao ny Computer Vision sy ny fitsipiny. Hanorina isika tambajotra neural convolutional ary hampiasa modely nofanin'i Tal Hassner sy Gil Levy amin'ny angon-drakitra Adience. Teny an-dalana dia hampiasa rakitra .pb, .pbtxt, .prototxt ary .caffemodel izahay.

Language: Python

Dataset/fonosana: Adience

6. Famakafakana angona Uber

Jereo ny fampiharana ny tetikasa Data Science feno miaraka amin'ny kaody loharano βˆ’ Uber Data Analysis Project ao amin'ny R.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Tetik'asa fijerena angona miaraka amin'ny ggplot2 ity izay hampiasantsika R sy ny tranomboky ary hamakafaka ireo masontsivana isan-karazany. Hampiasa ny angon-drakitra Uber Pickups New York City izahay ary hamorona sary ho an'ny fe-potoana samihafa amin'ny taona. Izany dia milaza amintsika ny fiantraikan'ny fotoana amin'ny dia ny mpanjifa.

Language: R

Dataset/fonosana: Uber Pickups amin'ny angona New York City

7. Famantarana ny torimason'ny mpamily

Hatsarao ny fahaizanao amin'ny fiasana amin'ny Tetikasa Siansa Top Data - rafitra fitiliana torimaso miaraka amin'ny OpenCV & Keras.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Mampidi-doza tokoa ny mitondra fiara mandrendrehana, ary efa ho arivo isan-taona ny lozam-pifamoivoizana mitranga noho ny torimason'ny mpamily rehefa mitondra fiara. Amin'ity tetikasa Python ity dia hamorona rafitra afaka mamantatra ireo mpamily rendremana isika ary mampitandrina azy ireo amin'ny alΓ lan'ny famantarana feo.

Ity tetikasa ity dia ampiharina amin'ny Keras sy OpenCV. Hampiasa OpenCV izahay ho an'ny maso sy maso ary miaraka amin'i Keras dia hanasokajy ny toetry ny maso (Misokatra na Mihidy) amin'ny alΓ lan'ny teknika tambajotra neural lalina.

8. Chatbot

Mamorona Chatbot miaraka amin'ny Python ary mandrosoa amin'ny asanao - Chatbot miaraka amin'ny NLTK & Keras.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Ny chatbots dia ampahany manan-danja amin'ny orinasa. Betsaka ny orinasa tsy maintsy manolotra tolotra ho an'ny mpanjifany ary mitaky hery, fotoana ary ezaka be ny manompo azy ireo. Ny Chatbots dia afaka manamboatra ny ankamaroan'ny fifandraisan'ny mpanjifanao amin'ny alΓ lan'ny famaliana ireo fanontaniana mahazatra apetraky ny mpanjifa. Amin'ny ankapobeny dia misy karazany roa ny chatbots: Domain-specific sy Open-domain. Ny chatbot manokana momba ny sehatra dia matetika ampiasaina hamahana olana manokana. Noho izany, mila manamboatra azy io ianao mba hiasa tsara amin'ny sehatra misy anao. Ny chatbots misokatra amin'ny sehatra misokatra dia azo apetraka amin'ny fanontaniana rehetra, noho izany dia mitaky data be dia be ny fampiofanana azy ireo.

Angon-drakitra: Intents json file

Language: Python

Tetikasa Advanced Data Science

9. Famoronana sary famantarana

Jereo ny fampiharana feno ny tetikasa miaraka amin'ny kaody loharano βˆ’ Mpamorona sary misy sary miaraka amin'ny CNN & LSTM.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Ny famaritana ny ao anaty sary dia asa mora ho an'ny olombelona, ​​fa ho an'ny solosaina kosa, ny sary dia andiana isa fotsiny izay maneho ny sandan'ny lokon'ny piksel tsirairay. Asa sarotra ho an'ny solosaina izany. Asa sarotra iray hafa ny fahazoana izay ao anaty sary ary avy eo mamorona famaritana amin'ny fiteny voajanahary (toy ny teny anglisy). Ity tetikasa ity dia mampiasa teknika fianarana lalina izay ametrahanay ny Convolutional Neural Network (CNN) miaraka amin'ny Recurrent Neural Network (LSTM) mba hamoronana mpamorona famaritana sary.

Angon-drakitra: Flickr 8K

Language: Python

Rafitra: Keras

10. Fikarohana hosoka amin'ny carte de crΓ©dit

Ataovy izay tsara indrindra vitanao rehefa miasa amin'ny hevitrao momba ny tetikasa Data Science βˆ’ mamantatra ny hosoka amin'ny carte de crΓ©dit amin'ny fampiasana machine learning.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Amin'izao fotoana izao dia efa manomboka mahazo ny teknika sy ny foto-kevitra ianao. Andao hiroso amin'ny tetikasa siantifika data mandroso sasany. Amin'ity tetikasa ity dia hampiasa fiteny R miaraka amin'ny algorithm toy ny hazo fanapahan-kevitra, regression logistic, tambajotra neural artifisialy ary mpanasokajy gradient boosting. Hampiasa angon-drakitra momba ny fifampiraharahana amin'ny carte de crΓ©dit izahay hanasokajiana ny fifanakalozana amin'ny carte de crΓ©dit ho hosoka na tena izy. Hifidy modely samihafa ho azy ireo isika ary hanangana curve fampisehoana.

Language: R

Dataset/fonosana: Data Transactions Card

11. Rafitra fanolorana sarimihetsika

Halalino ny fampiharana ny tetikasa Data Science tsara indrindra miaraka amin'ny kaody loharano - Sarimihetsika Recommendation System amin'ny fiteny R

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Amin'ity tetikasa Data Science ity dia hampiasa R izahay mba hampiharana ny tolo-kevitry ny sarimihetsika amin'ny alΓ lan'ny fianarana milina. Ny rafitra fanolorana dia mandefa soso-kevitra amin'ny mpampiasa amin'ny alalan'ny sivana mifototra amin'ny safidin'ny mpampiasa hafa sy ny tantaran'ny fitetezana. Raha tia an'i Home Alone i A sy B, ary tia Mean Girls i B, dia azonao atao ny manolotra an'i A - mety ho tiany koa izany. Izany dia ahafahan'ny mpanjifa mifandray amin'ny sehatra.

Language: R

Dataset/fonosana: Takelaka data MovieLens

12. Fizarana mpanjifa

Manaitra ny mpampiasa amin'ny tetikasa Data Science (anisan'izany ny kaody loharano) - Fizarana mpanjifa mampiasa fianarana milina.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Fampiharana malaza ny fizarana mpividy fianarana tsy voafehy. Amin'ny fampiasana clustering, ny orinasa dia mamaritra ny ampahany amin'ny mpanjifa mba hikendry ny mety ho mpampiasa. Zarain'izy ireo ho vondrona ny mpanjifa araka ny toetra iraisan'izy ireo toy ny lahy sy ny vavy, ny taona, ny zavatra mahaliana ary ny fahazarana mandany mba hahafahan'izy ireo mivarotra ny vokatra amin'ny vondrona tsirairay. Hampiasaintsika K-midika hoe clustering, ary alaivo sary an-tsaina ny fizarana araka ny lahy sy ny vavy sy ny taona. Hodinihintsika avy eo ny haavon'ny fidiram-bolany sy ny fandaniana isan-taona.

Language: R

Dataset/fonosana: Takelaka data Mall_Customers

13. Fanasokajiana ny homamiadan'ny nono

Jereo ny fampiharana feno ny tetikasa Data Science amin'ny Python βˆ’ Fanasokajiana kanseran'ny nono mampiasa fianarana lalina.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Miverina amin'ny fandraisana anjara ara-pitsaboana amin'ny siansa data, andao hianatra ny fomba hamantarana ny homamiadan'ny nono amin'ny fampiasana Python. Hampiasa ny angona IDC_regular izahay hamantarana ny kanseran'ny ductal invasive, ny endrika mahazatra indrindra amin'ny homamiadan'ny nono. Mivoatra ao amin'ny lakandranon-dronono izy io, mitsambikina ao amin'ny tadin'ny nono fibrous na matavy ivelan'ny lakandrano. Amin'ity tetikasa siantifika fanangonana angona ity dia hampiasaintsika Deep Learning ary ny tranomboky Keras ho an'ny fanasokajiana.

Language: Python

Dataset/fonosana: IDC_regular

14. Famantarana ny fifamoivoizana

Fanatrarana mazava tsara amin'ny teknolojia mitondra fiara miaraka amin'ny tetikasa Data Science famantarana famantarana ny fifamoivoizana mampiasa CNN loharano misokatra.

Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra)

Tena zava-dehibe ho an’ny mpamily tsirairay ny famantarana ny lalana sy ny fitsipi-pifehezana mba hisorohana ny loza. Mba hanarahana ny fitsipika, dia mila mahatakatra aloha ny endriky ny famantarana ny lalana. Tsy maintsy mianatra ny famantarana rehetra ny olona iray alohan'ny hanomezana azy ny fahazoan-dΓ lana hitondra fiara. Saingy ankehitriny dia mitombo ny isan'ny fiara tsy miankina, ary tsy ho ela dia tsy hitondra fiara irery intsony ny olona iray. Ao amin'ny tetikasa Famantarana famantarana ny lalana dia hianatra ny fomba ahafahan'ny programa iray mamantatra ny karazana famantarana ny lalana amin'ny alΓ lan'ny fakana sary ho fampidirana. Ny angona German Traffic Sign Recognition Benchmark (GTSRB) dia ampiasaina hananganana tambajotra neural lalina hamantarana ny kilasy misy ny famantarana ny fifamoivoizana. Mamorona GUI tsotra ihany koa izahay hifaneraserana amin'ny fampiharana.

Language: Python

Angon-drakitra: GTSRB (Famantarana famantarana famantarana ny fifamoivoizana alemana)

Hamaky bebe kokoa

Source: www.habr.com

Add a comment