14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Илми маълумот барои шурӯъкунандагон

1. Таҳлили эҳсосот (таҳлили эҳсосот тавассути матн)

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Татбиқи пурраи лоиҳаи Data Science -ро бо истифода аз рамзи сарчашма санҷед Лоиҳаи таҳлили эҳсосот дар Р.

Таҳлили эҳсосот ин таҳлили калимаҳо барои муайян кардани эҳсосот ва андешаҳо мебошад, ки метавонанд мусбат ё манфӣ бошанд. Ин як навъи таснифот аст, ки дар он синфҳо метавонанд дуӣ (мусбат ва манфӣ) ё ҷамъ (хушбахт, хашмгин, ғамгин, бад...) бошанд. Мо ин лоиҳаи Илми маълумотро дар R амалӣ хоҳем кард ва маҷмӯи додаҳоро дар бастаи "janeaustenR" истифода хоҳем кард. Мо луғатҳои таъиноти умумӣ, аз қабили AFINN, bing ва loughran -ро истифода мебарем, пайвасти ботиниро иҷро мекунем ва дар охир мо абри калимаро барои намоиш додани натиҷа эҷод мекунем.

Забон: R
Маҷмӯи маълумот/Баста: janeaustenR

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Мақола бо дастгирии EDISON Software тарҷума шудааст, ки утоқҳои мувофиқи маҷозӣ барои мағозаҳои бисёр бренди месозад, инчунин нармафзорро озмоиш мекунад.

2. Муайян кардани хабарҳои қалбакӣ

Тавассути кор дар лоиҳаи Data Science барои шурӯъкунандагон малакаҳои худро ба сатҳи оянда бардоред - ошкор кардани хабарҳои қалбакӣ бо Python.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Хабарҳои қалбакӣ маълумоти бардурӯғест, ки тавассути шабакаҳои иҷтимоӣ ва дигар васоити ахбори омма барои ноил шудан ба ҳадафҳои сиёсӣ паҳн карда мешавад. Дар ин идеяи лоиҳаи Data Science, мо Python-ро барои сохтани моделе истифода мебарем, ки тавонад воқеан ё қалбакӣ будани хабарро дақиқ муайян кунад. Мо TfidfVectorizer эҷод мекунем ва аз PassiveAggressiveClassifier истифода мебарем, то хабарҳоро ба "воқеӣ" ва "қалбакӣ" тасниф кунем. Мо маҷмӯи додаҳои шакли 7796 × 4 -ро истифода мебарем ва ҳама чизро дар Jupyter Lab иҷро мекунем.

Забон: Python

Маҷмӯи маълумот/Баста: news.csv

3. Муайян кардани бемории Паркинсон

Бо идеяи лоиҳаи илмии худ ба пеш ҳаракат кунед - ошкор кардани бемории Паркинсон бо истифода аз XGBoost.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Мо истифодаи Data Science-ро барои беҳтар кардани хидматрасонии тиббӣ ва хидматрасонӣ оғоз кардем - агар мо бемориро дар марҳилаи аввал пешгӯӣ карда тавонем, пас мо бартариҳои зиёд хоҳем дошт. Ҳамин тавр, дар ин идеяи лоиҳаи Data Science, мо меомӯзем, ки чӣ гуна бемории Паркинсонро бо истифода аз Python муайян кунем. Ин як бемории нейродегенеративӣ, прогрессивии системаи марказии асаб аст, ки ба ҳаракат таъсир мерасонад ва боиси ларзиш ва сахтӣ мегардад. Он ба нейронҳои тавлидкунандаи дофамин дар мағзи сар таъсир мерасонад ва ҳар сол ба беш аз 1 миллион нафар дар Ҳиндустон таъсир мерасонад.

Забон: Python

Маҷмӯи маълумот/Баста: Маҷмӯи маълумоти UCI ML Parkinsons

Лоиҳаҳои Илми маълумотҳои мураккаби миёна

4. Шинохти эҳсосоти сухан

Татбиқи пурраи лоиҳаи мисоли Data Science -ро санҷед шинохти нутқ бо истифода аз Librosa.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Биёед ҳоло чӣ гуна истифода бурдани китобхонаҳои гуногунро омӯзем. Ин лоиҳаи Data Science librosa-ро барои шинохти нутқ истифода мебарад. SER раванди муайян кардани эҳсосот ва ҳолати аффективии инсон аз нутқ мебошад. Азбаски мо барои ифодаи эҳсосот бо овози худ оҳанг ва баландро истифода мебарем, SER мувофиқ аст. Аммо азбаски эҳсосот субъективӣ мебошанд, шарҳи аудио як вазифаи душвор аст. Мо функсияҳои mfcc, chroma ва mel-ро истифода мебарем ва маҷмӯи додаҳои RAVDESSро барои шинохти эҳсосот истифода мебарем. Мо барои ин модел таснифи MLPC эҷод мекунем.

Забон: Python

Маҷмӯи маълумот/Баста: Маҷмӯи маълумоти RAVDESS

5. Муайян кардани ҷинс ва синну сол

Корфармоёнро бо лоиҳаи охирини Data Science ба ҳайрат оред - муайян кардани ҷинс ва синну сол бо истифода аз OpenCV.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Ин як илми ҷолиби маълумот бо Python аст. Бо истифода аз як тасвир, шумо пешгӯии ҷинс ва синну соли шахсро меомӯзед. Дар ин ҷо мо шуморо бо компютер Vision ва принсипҳои он шинос хоҳем кард. месозем шабакаи нейронҳои конволютсионӣ ва моделҳоеро, ки Тал Ҳасснер ва Гил Леви дар маҷмӯаи додаҳои Adience таълим додаанд, истифода хоҳад кард. Дар баробари ин мо баъзе файлҳои .pb, .pbtxt, .prototxt ва .caffemodel истифода хоҳем кард.

Забон: Python

Маҷмӯи маълумот/Баста: Адиенс

6. Таҳлили маълумоти Uber

Татбиқи пурраи лоиҳаи Data Science -ро бо рамзи сарчашма санҷед Лоиҳаи таҳлили маълумотҳои Uber дар Р.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Ин як лоиҳаи визуализатсияи додаҳо бо ggplot2 мебошад, ки дар он мо R ва китобхонаҳои онро истифода мебарем ва параметрҳои гуногунро таҳлил мекунем. Мо маҷмӯи додаҳои Uber Pickups New York City-ро истифода мебарем ва барои чаҳорчӯбаҳои гуногуни сол визуализатсия эҷод мекунем. Ин ба мо мегӯяд, ки чӣ тавр вақт ба саёҳати муштариён таъсир мерасонад.

Забон: R

Маҷмӯи маълумот/Баста: Маҷмӯи маълумоти Uber Pickups дар Ню Йорк

7. Муайян кардани хоболудии ронанда

Маҳорати худро тавассути кор дар Лоиҳаи Top Data Science такмил диҳед - системаи муайянкунии хоболудӣ бо OpenCV & Keras.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Ронкунии хоболуд нихоят хавфнок буда, хар сол аз сабаби хоб рафтани ронандагон дар вакти рондани мошин кариб хазор ходисаи фалокат руй медихад. Дар ин лоиҳаи Python, мо системаеро эҷод мекунем, ки метавонад ронандагони хоболудро ошкор кунад ва инчунин онҳоро бо сигнали аудио ҳушдор диҳад.

Ин лоиҳа бо истифода аз Keras ва OpenCV амалӣ карда мешавад. Мо OpenCV-ро барои муайян кардани чеҳра ва чашм истифода хоҳем кард ва бо Keras мо ҳолати чашмро (Кушода ё Пӯшида) бо истифода аз усулҳои амиқи шабакаи нейронӣ тасниф хоҳем кард.

8. Чатбот

Бо Python Chatbot эҷод кунед ва дар касбатон як қадам ба пеш гузоред - Чатбот бо NLTK & Keras.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Чатботҳо қисми ҷудонашавандаи тиҷорат мебошанд. Бисёре аз корхонаҳо бояд ба мизоҷони худ хидмат пешниҳод кунанд ва барои хидмат ба онҳо қувваи корӣ, вақт ва кӯшиши зиёд лозим аст. Чатботҳо метавонанд тавассути посух додан ба баъзе саволҳои маъмуле, ки муштариён мепурсанд, бисёре аз муоширати муштариёни шуморо автоматӣ кунанд. Асосан ду намуди чатботҳо мавҷуданд: домени махсус ва домени кушод. Чатботи мушаххаси домен аксар вақт барои ҳалли мушкилоти мушаххас истифода мешавад. Ҳамин тавр, шумо бояд онро танзим кунед, то дар соҳаи худ самаранок кор кунед. Чатботҳои домении кушода метавонанд ҳама гуна саволҳоро пурсанд, аз ин рӯ омӯзиши онҳо миқдори зиёди маълумотро талаб мекунад.

Маҷмӯи маълумот: Ниятҳои файли json

Забон: Python

Лоиҳаҳои пешрафтаи илми маълумот

9. Генератори сарлавҳаи тасвир

Татбиқи пурраи лоиҳаро бо рамзи сарчашма санҷед - Генератори тасвири тасвир бо CNN & LSTM.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Тавсифи он чизе, ки дар тасвир аст, барои одамон кори осон аст, аммо барои компютерҳо, тасвир танҳо як қатор рақамҳост, ки арзиши ранги ҳар як пикселро ифода мекунанд. Ин барои компютерҳо кори душвор аст. Фаҳмидани он чизе, ки дар тасвир мавҷуд аст ва сипас бо забони табиӣ (масалан, англисӣ) тавсиф кардан кори душвор аст. Ин лоиҳа усулҳои омӯзиши амиқро истифода мебарад, ки дар он мо Шабакаи Нейралии Конволютсионӣ (CNN) бо Шабакаи Нейралии Рекуррентӣ (LSTM) барои эҷоди генератори тавсифи тасвир истифода мебарем.

Маҷмӯи маълумот: Flickr 8K

Забон: Python

Чаҳорчӯба: Керас

10. Ошкор кардани қаллобӣ дар корти кредитӣ

Ҳангоми кор дар ғояи лоиҳаи илмии худ тамоми кори аз дастатон меомадаро кунед - бо истифода аз омӯзиши мошинсозӣ қаллобии корти кредитиро ошкор кунед.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Ҳоло шумо ба фаҳмидани техника ва консепсияҳо шурӯъ кардаед. Биёед ба баъзе лоиҳаҳои пешрафтаи илми маълумот гузарем. Дар ин лоиҳа мо забони R бо алгоритмҳои монанди дарахтони қарор, регрессияи логистикӣ, шабакаҳои нейронҳои сунъӣ ва таснифгари тақвияти градиент. Мо маҷмӯи маълумотҳои амалиёти кортро барои тасниф кардани амалиёти кортҳои кредитӣ ҳамчун қаллобӣ ё аслӣ истифода хоҳем кард. Мо барои онҳо моделҳои гуногунро интихоб мекунем ва хатҳои иҷроишро месозем.

Забон: R

Маҷмӯи маълумот/Баста: Маҷмӯи маълумотҳои амалиёти корт

11. Системаи тавсияи фильм

Татбиқи лоиҳаи беҳтарини илми маълумотро бо рамзи сарчашма омӯзед - Системаи тавсияи филм бо забони R

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Дар ин лоиҳаи Data Science, мо R-ро барои татбиқи тавсияҳои филм тавассути омӯзиши мошинсозӣ истифода хоҳем кард. Системаи тавсиядиҳӣ пешниҳодҳоро ба корбарон тавассути раванди филтр дар асоси афзалиятҳои корбарони дигар ва таърихи дидан мефиристад. Агар A ва B -ро дар хона танҳо дӯст доранд ва B Духтарони миёнаравро дӯст дорад, пас шумо метавонед A-ро пешниҳод кунед - шояд ба онҳо низ маъқул шавад. Ин ба муштариён имкон медиҳад, ки бо платформа муошират кунанд.

Забон: R

Маҷмӯи маълумот/Баста: Маҷмӯи додаҳои MovieLens

12. Сегментатсияи муштариён

Корфармоёнро бо лоиҳаи Data Science (аз ҷумла коди сарчашма) ба ҳайрат оред - Сегментатсияи муштариён бо истифода аз омӯзиши мошин.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Сегментатсияи харидорон як барномаи маъмул аст омӯзиши беназорат. Бо истифода аз кластер, ширкатҳо сегментҳои муштариёнро муайян мекунанд, то ба пойгоҳи эҳтимолии корбарон ҳадаф гиранд. Онҳо муштариёнро аз рӯи хусусиятҳои умумӣ ба монанди ҷинс, синну сол, манфиатҳо ва одатҳои хароҷот ба гурӯҳҳо тақсим мекунанд, то онҳо тавонанд маҳсулоти худро ба ҳар як гурӯҳ самаранок фурӯшанд. истифода мебарем K-маънои гурӯҳбандиро дорад, инчунин тақсимотро аз рӯи ҷинс ва синну сол тасаввур кунед. Сипас, мо сатҳи даромад ва хароҷоти солонаи онҳоро таҳлил мекунем.

Забон: R

Маҷмӯи маълумот/Баста: Маҷмӯи маълумоти Mall_Customers

13. Таснифи саратони сина

Татбиқи пурраи лоиҳаи Data Science дар Python -ро санҷед Таснифи саратони сина бо истифода аз омӯзиши амиқ.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Ба саҳми тиббии илми маълумот бармегардем, биёед бифаҳмем, ки чӣ тавр бо истифода аз Python саратони синаро ошкор кунем. Мо маҷмӯи додаҳои IDC_regular-ро барои муайян кардани карциномаҳои инвазивӣ, шакли маъмултарини саратони сина истифода хоҳем бурд. Он дар каналҳои шир инкишоф ёфта, ба бофтаи нахдор ё чарбии сина берун аз канал ворид мешавад. Дар ин ҷамъоварии маълумот идеяи лоиҳаи илмии мо истифода хоҳем кард Омӯзиши чуқур ва китобхонаи Керас барои тасниф.

Забон: Python

Маҷмӯи маълумот/Баста: IDC_regular

14. Шиносоии аломатҳои ҳаракат

Ба даст овардани дақиқ дар технологияи худидоракунии ронандагӣ бо лоиҳаи Data Science шинохти аломати ҳаракат бо истифода аз CNN манбаи кушода.

14 лоиҳаи кушодаасос барои такмил додани малакаҳои илми маълумот (осон, муқаррарӣ, сахт)

Аломатхои рох ва коидахои харакат барои хар як ронанда барои руй надодан ба фалокат ахамияти калон доранд. Барои риоя кардани қоида, шумо аввал бояд фаҳмед, ки аломати роҳ чӣ гуна аст. Шахсе бояд пеш аз додани иҷозатномаи рондани ягон воситаи нақлиёт тамоми аломатҳои роҳро омӯзад. Аммо ҳоло шумораи мошинҳои мустақил меафзояд ва дар ояндаи наздик одам мустақилона мошин меронад. Дар лоиҳаи Шинохти аломатҳои роҳ, шумо мефаҳмед, ки чӣ гуна барнома метавонад намуди аломатҳои роҳро тавассути гирифтани тасвир ҳамчун вуруд эътироф кунад. Маҷмӯи маълумот оид ба эътирофи аломатҳои трафики Олмон (GTSRB) барои сохтани шабакаи амиқи нейрон барои шинохтани синфе, ки аломати ҳаракат ба он тааллуқ дорад, истифода мешавад. Мо инчунин як GUI оддиро барои муошират бо барнома эҷод мекунем.

Забон: Python

Маҷмӯи маълумот: GTSRB (Нишони эътирофи аломатҳои трафики Олмон)

Бештар

Манбаъ: will.com

Илова Эзоҳ