የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

የውሂብ ሳይንስ ለጀማሪዎች

1. የስሜት ትንተና (የስሜት ትንተና በጽሁፍ)

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

የምንጭ ኮድ -ን በመጠቀም የውሂብ ሳይንስ ፕሮጀክት ሙሉ አተገባበርን ይመልከቱ ስሜት ትንተና ፕሮጀክት በ R.

የስሜታዊነት ትንተና ስሜትን እና አስተያየቶችን ለመለየት የቃላት ትንተና ሲሆን ይህም አዎንታዊ ወይም አሉታዊ ሊሆን ይችላል. ይህ ክፍሎቹ ሁለትዮሽ (አዎንታዊ እና አሉታዊ) ወይም ብዙ (ደስተኛ፣ ቁጡ፣ ሀዘን፣ አስጸያፊ...) ሊሆኑ የሚችሉበት የምድብ አይነት ነው። ይህንን የውሂብ ሳይንስ ፕሮጀክት በ R ውስጥ እንተገብራለን እና የውሂብ ስብስብን በ "janeaustenR" ጥቅል ውስጥ እንጠቀማለን. እንደ AFINN, Bing እና Loughran ያሉ አጠቃላይ ዓላማ መዝገበ ቃላትን እንጠቀማለን, ውስጣዊ መቀላቀልን እናደርጋለን እና በመጨረሻ ውጤቱን ለማሳየት ደመና ቃል እንፈጥራለን.

ቋንቋ: R
የውሂብ ስብስብ/ጥቅል፡ janeousten አር

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

ጽሑፉ የተተረጎመው በ EDISON ሶፍትዌር ድጋፍ ነው, እሱም ለብዙ-ብራንድ መደብሮች ምናባዊ ተስማሚ ክፍሎችን ይሠራል, እንዲሁም ሶፍትዌርን ይፈትሻል.

2. የውሸት ዜና ማወቂያ

በዳታ ሳይንስ ፕሮጄክት ለጀማሪዎች - በመስራት ችሎታህን ወደ ላቀ ደረጃ ውሰድ በፓይዘን የሐሰት ዜና ማወቂያ.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

የውሸት ዜና የፖለቲካ ግቦችን ለማሳካት በማህበራዊ ሚዲያ እና በሌሎች የኦንላይን ሚዲያዎች የሚሰራጩ የውሸት መረጃዎች ናቸው። በዚህ የዳታ ሳይንስ ፕሮጄክት ሀሳብ ውስጥ ዜናው እውነት ወይም ሀሰት መሆኑን በትክክል የሚወስን ሞዴል ለመስራት Pythonን እንጠቀማለን። TfidfVectorizer እንፈጥራለን እና ዜናዎችን ወደ “እውነተኛ” እና “ሐሰት” ለመከፋፈል PassiveAggressiveClassifierን እንጠቀማለን። 7796×4 ቅርጽ ያለው ዳታ ስብስብ እንጠቀማለን እና ሁሉንም ነገር በጁፒተር ላብ ውስጥ እናደርጋለን።

ቋንቋ: ዘንዶ

የውሂብ ስብስብ/ጥቅል፡ news.csv

3. የፓርኪንሰን በሽታን መለየት

በዳታ ሳይንስ ፕሮጀክት ሃሳብ ላይ በመስራት ወደፊት ቀጥል - የፓርኪንሰን በሽታን በ XGBoost መለየት.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

የጤና እንክብካቤን እና አገልግሎቶችን ለማሻሻል ዳታ ሳይንስን መጠቀም ጀምረናል - በሽታውን ገና በለጋ ደረጃ መተንበይ ከቻልን ብዙ ጥቅሞች ይኖሩናል። ስለዚህ፣ በዚህ የዳታ ሳይንስ ፕሮጀክት ሃሳብ፣ ፒቲንን በመጠቀም የፓርኪንሰን በሽታን እንዴት መለየት እንደሚቻል እንማራለን። እንቅስቃሴን የሚጎዳ እና መንቀጥቀጥ እና ጥንካሬን የሚያስከትል የማዕከላዊው የነርቭ ሥርዓት እድገትን የሚያመጣ የነርቭ ዲጄኔሬቲቭ በሽታ ነው። በአንጎል ውስጥ ዶፖሚን የሚያመነጩ የነርቭ ሴሎችን ይጎዳል, እና በየዓመቱ በህንድ ውስጥ ከ 1 ሚሊዮን በላይ ሰዎችን ይጎዳል.

ቋንቋ: ዘንዶ

የውሂብ ስብስብ/ጥቅል፡ UCI ML የፓርኪንሰንስ መረጃ ስብስብ

የመካከለኛ ውስብስብነት የውሂብ ሳይንስ ፕሮጀክቶች

4. የንግግር ስሜት እውቅና

የውሂብ ሳይንስ ናሙና ፕሮጀክት ሙሉ አተገባበርን ይመልከቱ - የንግግር ማወቂያ ከሊብሮሳ ጋር.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

አሁን እንዴት የተለያዩ ቤተ-መጻሕፍትን እንደምንጠቀም እንማር። ይህ የውሂብ ሳይንስ ፕሮጀክት ለንግግር ማወቂያ ሊብሮሳ ይጠቀማል። SER የሰዎች ስሜቶችን እና አነቃቂ ሁኔታዎችን ከንግግር የመለየት ሂደት ነው። በድምፃችን ስሜትን ለመግለጽ ቃና እና ድምጽ ስለምንጠቀም፣ SER ጠቃሚ ነው። ግን ስሜቶች ግላዊ ስለሆኑ የድምጽ ማብራሪያ ከባድ ስራ ነው። የ mfcc፣ chroma እና mel ተግባራትን እንጠቀማለን እና የRAVDESS ዳታ ስብስብን ለስሜት እውቅና እንጠቀማለን። ለዚህ ሞዴል MLPC ክላሲፋየር እንፈጥራለን።

ቋንቋ: ዘንዶ

የውሂብ ስብስብ/ጥቅል፡ RAVDESS የውሂብ ስብስብ

5. ጾታ እና ዕድሜን መለየት

ቀጣሪዎችን በአዲሱ የውሂብ ሳይንስ ፕሮጀክት ያስደምሙ - ጾታ እና ዕድሜን በOpenCV መለየት.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

ይህ ከፓይዘን ጋር አስደሳች የውሂብ ሳይንስ ነው። አንድ ምስል ብቻ በመጠቀም የአንድን ሰው ጾታ እና ዕድሜ እንዴት እንደሚተነብዩ ይማራሉ. በዚህ ውስጥ የኮምፒዩተር ቪዥን እና መርሆቹን እናስተዋውቅዎታለን. እንገነባለን። convolutional neural አውታረ መረብ እና በTal Hasner እና Gil Levy የሰለጠኑ ሞዴሎችን በአዲነስ ዳታ ስብስብ ላይ ይጠቀማል። በመንገድ ላይ አንዳንድ .pb፣ .pbtxt፣ .prototxt እና .caffemodel ፋይሎችን እንጠቀማለን።

ቋንቋ: ዘንዶ

የውሂብ ስብስብ/ጥቅል፡ አድኢንስ

6. የኡበር መረጃ ትንተና

የውሂብ ሳይንስ ፕሮጀክትን ከምንጭ ኮድ ጋር ሙሉ ለሙሉ ትግበራ ይመልከቱ የኡበር መረጃ ትንተና ፕሮጀክት በአር.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

ይህ R እና ቤተ-መጻሕፍቶቹን የምንጠቀምበት እና የተለያዩ መለኪያዎች የምንተነትንበት ggplot2 ያለው የመረጃ እይታ ፕሮጀክት ነው። የ Uber Pickups ኒው ዮርክ ዳታ ስብስብን እንጠቀማለን እና ለተለያዩ የዓመቱ የጊዜ ክፈፎች ምስላዊ ምስሎችን እንፈጥራለን። ይህ ጊዜ የደንበኞችን ጉዞ እንዴት እንደሚጎዳ ይነግረናል።

ቋንቋ: R

የውሂብ ስብስብ/ጥቅል፡ Uber Pickups በኒው ዮርክ ከተማ የውሂብ ስብስብ

7. የአሽከርካሪዎች ድብታ ማወቅ

በከፍተኛ የውሂብ ሳይንስ ፕሮጀክት ላይ በመስራት ችሎታዎን ያሳድጉ - ከOpenCV እና Keras ጋር የእንቅልፍ ማወቂያ ስርዓት.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

በእንቅልፍ ማሽከርከር እጅግ በጣም አደገኛ ነው, በየዓመቱ ወደ አንድ ሺህ የሚጠጉ አደጋዎች አሽከርካሪዎች በሚያሽከረክሩበት ጊዜ በእንቅልፍ ውስጥ ይወድቃሉ. በዚህ የፓይዘን ፕሮጄክት እንቅልፍ የሚነኩ አሽከርካሪዎችን የሚያውቅ እና በድምፅ የሚያስጠነቅቅ ስርዓት እንፈጥራለን።

ይህ ፕሮጀክት Keras እና OpenCV በመጠቀም ነው የሚተገበረው። ፊትን እና አይንን ለመለየት OpenCV ን እንጠቀማለን እና በ Keras እገዛ ጥልቅ የነርቭ ኔትወርክ ዘዴዎችን በመጠቀም የዓይንን ሁኔታ (ክፍት ወይም ዝግ) እንመድባለን ።

8. ቻትቦት

ከፓይዘን ጋር ቻትቦት ይገንቡ እና በሙያዎ ውስጥ አንድ እርምጃ ወደፊት ይውሰዱ - ቻትቦት ከNLTK እና Keras ጋር.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

ቻትቦቶች የንግድ ሥራ ዋና አካል ናቸው። ብዙ የንግድ ድርጅቶች ለደንበኞቻቸው አገልግሎት መስጠት አለባቸው እና እነሱን ለማገልገል ብዙ የሰው ኃይል፣ ጊዜ እና ጥረት ይጠይቃል። ቻትቦቶች ደንበኞቻቸው የሚጠይቋቸውን አንዳንድ የተለመዱ ጥያቄዎችን በመመለስ አብዛኛው የደንበኛ መስተጋብር በራስ ሰር መስራት ይችላሉ። በመሠረቱ ሁለት አይነት ቻትቦቶች አሉ፡- Domain-scific እና Open-domain። አንድን የተወሰነ ችግር ለመፍታት ጎራ-ተኮር ቻትቦት ብዙ ጊዜ ጥቅም ላይ ይውላል። ስለዚህ በመስክዎ ውስጥ ውጤታማ በሆነ መልኩ እንዲሰራ ማበጀት ያስፈልግዎታል። ክፍት-ጎራ ቻትቦቶች ማንኛውንም ጥያቄዎች ሊጠየቁ ይችላሉ ፣ስለዚህ እነሱን ማሰልጠን ብዙ ውሂብ ይጠይቃል።

የውሂብ ስብስብ፡- Intents json ፋይል

ቋንቋ: ዘንዶ

የላቀ የውሂብ ሳይንስ ፕሮጀክቶች

9. የምስል መግለጫ አመንጪ

የተሟላውን የፕሮጀክት አተገባበር ከምንጭ ኮድ - ጋር ይመልከቱ የምስል መግለጫ ጀነሬተር ከ CNN እና LSTM ጋር.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

በምስሉ ላይ ያለውን ነገር መግለጽ ለሰው ልጆች ቀላል ስራ ነው፡ ለኮምፒውተሮች ግን ምስል የእያንዳንዱን ፒክሰል የቀለም እሴት የሚወክሉ የቁጥሮች ስብስብ ብቻ ነው። ይህ ለኮምፒዩተሮች ከባድ ስራ ነው. በምስሉ ላይ ያለውን ነገር መረዳት እና የተፈጥሮ ቋንቋ መግለጫ መፍጠር (ለምሳሌ እንግሊዝኛ) ሌላው ከባድ ስራ ነው። ይህ ፕሮጀክት የምስል መግለጫ ጄነሬተር ለመፍጠር Convolutional Neural Network (CNN) ከተደጋጋሚ የነርቭ ኔትወርክ (LSTM) ጋር የምንተገብርባቸውን ጥልቅ የመማር ዘዴዎችን ይጠቀማል።

የውሂብ ስብስብ፡- ፍሊከር 8 ኪ

ቋንቋ: ዘንዶ

መዋቅር፡ ኬራሎች

10. የክሬዲት ካርድ ማጭበርበር ማወቅ

በዳታ ሳይንስ ፕሮጀክት ሃሳብ ላይ በመስራት የተቻለህን አድርግ - ከማሽን መማር ጋር የክሬዲት ካርድ ማጭበርበር ማወቅ.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

አሁን ዘዴዎችን እና ፅንሰ ሀሳቦችን መረዳት ጀምረሃል። ወደ አንዳንድ የላቁ የውሂብ ሳይንስ ፕሮጀክቶች እንሂድ። በዚህ ፕሮጀክት የ R ቋንቋን እንደ ስልተ ቀመሮች እንጠቀማለን። የውሳኔ ዛፎች፣ የሎጂስቲክ ሪግሬሽን ፣ ሰው ሰራሽ የነርቭ አውታረ መረቦች እና ቀስ በቀስ የሚጨምር ክላሲፋየር። የክሬዲት ካርድ ግብይቶችን እንደ ማጭበርበር እና እውነተኛ ለመከፋፈል የካርድ ግብይቶችን ዳታ ስብስብ እንጠቀማለን። ለእነሱ የተለያዩ ሞዴሎችን እንመርጣለን እና የአፈፃፀም ኩርባዎችን እንገነባለን.

ቋንቋ: R

የውሂብ ስብስብ/ጥቅል፡ የካርድ ግብይቶች የውሂብ ስብስብ

11. የፊልም ምክር ስርዓት

ከምንጭ ኮድ ጋር ምርጡን የውሂብ ሳይንስ ፕሮጀክት ትግበራ ያስሱ - የፊልም ጥቆማ ስርዓት በአር

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

በዚህ የዳታ ሳይንስ ፕሮጀክት የፊልሙን ምክሮች በማሽን መማር ለማስፈጸም R እንጠቀማለን። የምክር ስርዓቱ በሌሎች ተጠቃሚዎች ምርጫዎች እና የአሰሳ ታሪክ ላይ በመመስረት በማጣራት ሂደት ለተጠቃሚዎች ጥቆማዎችን ይልካል። ሀ እና ለ ቤት ብቻን ከወደዱ እና B አማካኝ ልጃገረዶችን ከወደዱ ሀን መጠቆም ይችላሉ - እነሱም ሊወዱት ይችላሉ። ይህ ደንበኞች ከመድረክ ጋር እንዲገናኙ ያስችላቸዋል.

ቋንቋ: R

የውሂብ ስብስብ/ጥቅል፡ MovieLens የውሂብ ስብስብ

12. የደንበኛ ክፍፍል

ቀጣሪዎችን በዳታ ሳይንስ ፕሮጀክት (የምንጭ ኮድን ጨምሮ) ያስደምሙ - ከማሽን ትምህርት ጋር የደንበኛ ክፍፍል.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

የገዢ ክፍል ታዋቂ መተግበሪያ ነው። ቁጥጥር የማይደረግበት ትምህርት. ክላስተርን በመጠቀም ኩባንያዎች የደንበኛ ክፍሎችን ከተጠቃሚ መሰረት ጋር ለመስራት ይገልፃሉ። ደንበኞቻቸውን እንደ ጾታ፣ እድሜ፣ ፍላጎት እና የወጪ ልማዶች ባሉ የጋራ ባህሪያት መሰረት በቡድን ይከፋፍሏቸዋል በዚህም ምርቶቻቸውን ለእያንዳንዱ ቡድን በብቃት ለገበያ ያቀርባሉ። እንጠቀማለን ኬ-ማለት ማሰባሰብ ማለት ነው, እንዲሁም ስርጭቱን በጾታ እና በእድሜ ይሳሉ. ከዚያም አመታዊ ገቢያቸውን እና የወጪ ደረጃቸውን እንመረምራለን።

ቋንቋ: R

የውሂብ ስብስብ/ጥቅል፡ የገበያ ማዕከል_ደንበኞች ውሂብ ስብስብ

13. የጡት ካንሰር ምደባ

በ Python ውስጥ ያለውን የውሂብ ሳይንስ ፕሮጀክት ሙሉ አተገባበርን ይመልከቱ ጥልቅ ትምህርትን በመጠቀም የጡት ካንሰር ምደባ.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

ወደ ዳታ ሳይንስ የህክምና አስተዋፅኦ ስንመለስ፣ የጡት ካንሰርን በፓይዘን እንዴት እንደሚለይ እንወቅ። በጣም የተለመደው የጡት ካንሰር አይነት ወራሪ ductal carcinomaን ለመለየት የIDC_መደበኛ መረጃ ስብስብን እንጠቀማለን። ከቧንቧው ውጭ ባለው የጡት እጢ ፋይበር ወይም ቅባት ቲሹ ውስጥ ዘልቆ በመግባት በወተት ቱቦዎች ውስጥ ያድጋል። በዚህ የመረጃ አሰባሰብ የሳይንስ ፕሮጀክት ሃሳብ ውስጥ እንጠቀማለን። ጥልቀት ያለው ትምህርት እና የኬራስ ቤተ-መጽሐፍት ለምድብ.

ቋንቋ: ዘንዶ

የውሂብ ስብስብ/ጥቅል፡ IDC_መደበኛ

14. የትራፊክ ምልክቶች እውቅና

በመረጃ ሳይንስ ፕሮጀክት በራስ የመንዳት የመኪና ቴክኖሎጂ ትክክለኛነትን ማሳካት CNN በመጠቀም የትራፊክ ምልክት ማወቂያ ክፍት ምንጭ.

የውሂብ ሳይንስ ክህሎቶችን ለማሻሻል 14 ክፍት ምንጭ ፕሮጀክቶች (ቀላል፣ መደበኛ፣ ከባድ)

የመንገድ ምልክቶች እና የትራፊክ ህጎች ለእያንዳንዱ አሽከርካሪ አደጋዎችን ለማስወገድ በጣም አስፈላጊ ናቸው. ደንቡን ለመከተል በመጀመሪያ የመንገድ ምልክት ምን እንደሚመስል መረዳት ያስፈልግዎታል. አንድ ሰው ማንኛውንም ተሽከርካሪ የመንዳት መብት ከመሰጠቱ በፊት ሁሉንም የመንገድ ምልክቶች መማር አለበት. አሁን ግን የራስ ገዝ ተሽከርካሪዎች ቁጥር እየጨመረ ነው, እና በቅርብ ጊዜ ውስጥ, አንድ ሰው በራሱ መኪና መንዳት አይችልም. በመንገድ ምልክት እውቅና ፕሮጀክት ውስጥ ምስልን እንደ ግብአት በማንሳት መርሃግብሩ የመንገድ ምልክትን እንዴት እንደሚያውቅ ይማራሉ ። የጀርመን የመንገድ ምልክት እውቅና ማመሳከሪያ ዳታ ስብስብ (GTSRB) የትራፊክ ምልክት ያለበትን ክፍል ለመለየት ጥልቅ የሆነ የነርቭ መረብ ለመገንባት ያገለግላል። እንዲሁም ከመተግበሪያው ጋር ለመግባባት ቀላል GUI እየፈጠርን ነው።

ቋንቋ: ዘንዶ

የውሂብ ስብስብ፡- GTRB (የጀርመን የትራፊክ ምልክት እውቅና ቤንችማርክ)

ተጨማሪ ያንብቡ

ምንጭ: hab.com

አስተያየት ያክሉ