Վերապատրաստման նախագծերի 52 տվյալների հավաքածու

  1. Առևտրի կենտրոնի հաճախորդների տվյալների հավաքածու — խանութի այցելուների տվյալները՝ ID, սեռ, տարիք, եկամուտ, ծախսերի վարկանիշ: (Դիմումի տարբերակ. Հաճախորդների սեգմենտավորման նախագիծ մեքենայական ուսուցմամբ)
  2. Iris Dataset — Սկսնակների համար նախատեսված տվյալների հավաքածու, որը պարունակում է տարբեր ծաղիկների համար նախատեսված sepals և թերթիկների չափսեր:
  3. MNIST տվյալների հավաքածու — ձեռագիր թվերի հավաքածու: 60 ուսումնական պատկեր և 000 թեստային պատկեր:
  4. Բոստոնի բնակարանային տվյալների հավաքածու օրինաչափությունների ճանաչման հանրաճանաչ տվյալների բազա է: Պարունակում է տեղեկատվություն Բոստոնում գտնվող տների մասին՝ բնակարանների քանակ, վարձակալության գներ, հանցագործության ինդեքս։
  5. Կեղծ լուրերի հայտնաբերման տվյալների հավաքածու — պարունակում է 7796 գրառում նորությունների նշումներով՝ ճշմարիտ կամ կեղծ: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. Կեղծ լուրերի հայտնաբերման Python նախագիծ )
  6. Գինու որակի տվյալների բազա — պարունակում է տեղեկատվություն գինու մասին՝ 4898 գրառում 14 պարամետրով։
  7. SOCR-ի տվյալներ – Բարձրությունների և կշիռների տվյալների հավաքածու - լավ տարբերակ է սկսելու համար: Պարունակում է 25 տարեկան մարդկանց հասակի և քաշի 000 գրառում։

    Վերապատրաստման նախագծերի 52 տվյալների հավաքածու

    Հոդվածը թարգմանվել է EDISON Software-ի աջակցությամբ, որը «գերազանց» կատարում է Հարավային Չինաստանի պատվերներըԻսկ մշակում է վեբ հավելվածներ և կայքեր.

  8. Պարկինսոնի տվյալների հավաքածու — Պարկինսոնի հիվանդությամբ հիվանդների 195 գրառում՝ 25 վերլուծական պարամետրերով: Կարող է օգտագործվել հիվանդ և առողջ մարդկանց միջև տարբերության նախնական գնահատման համար: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. Պարկինսոնի հիվանդության հայտնաբերման մեքենայական ուսուցման նախագիծ)
  9. Titanic Dataset — պարունակում է տեղեկություններ ուղևորների մասին (տարիքը, սեռը, ինքնաթիռում գտնվող հարազատները և այլն) 891 ուսումնամարզական հավաքակազմում և 418 թեստային հավաքածուում:
  10. Uber Pickups Dataset — 4.5 թվականին Uber-ով 2014 միլիոն ուղևորությունների և 14 թվականին՝ 2015 միլիոնի մասին տեղեկություններ։ (Դիմումի տարբերակ R-ի կոդով. Uber տվյալների վերլուծության նախագիծը Ռ)
  11. Chars74k տվյալների հավաքածու — պարունակում է 64 դասի բրիտանական և կանադական խորհրդանիշների պատկերներ՝ 0-9, AZ, az. 7700 7.7k բնական պատկերներ, 3400k ձեռագիր, 62000 համակարգչային սինթեզված տառատեսակներ:
  12. Վարկային քարտի խարդախության հայտնաբերման տվյալների հավաքածու — պարունակում է տեղեկատվություն վարկաբեկված վարկային քարտերի գործարքների մասին: (Աղբյուրով դիմումի տարբերակ. Վարկային քարտերի խարդախության հայտնաբերման մեքենայական ուսուցման նախագիծ)
  13. Chatbot Intents Dataset — JSON ֆայլ, որը պարունակում է տարբեր պիտակներ՝ ողջույններ, հրաժեշտ, հիվանդանոցի_որոնում, դեղատան_որոնում և այլն: Պարունակում է հարց-պատասխանի ձևանմուշների հավաքածու: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. Chatbot նախագիծ Python-ում)
  14. Enron էլփոստի տվյալների հավաքածու — պարունակում է կես միլիոն նամակ Enron-ի 150 մենեջերներից:
  15. Yelp Dataset — պարունակում է 1,2 միլիոն առաջարկ 1,6 միլիոն օգտատերերի մոտ 1,2 միլիոն կազմակերպություններից:
  16. Վտանգված տվյալների հավաքածու — ավելի քան 200 հարց ու պատասխան ձայնագրություն հանրահայտ հեռուստախաղից:
  17. Recommender Systems Dataset — UCSD համալսարանի տվյալների հավաքածուներով պորտալ: Պարունակում է հանրաճանաչ կայքերի ակնարկների գրառումներ (Goodreads, Amazon): Հիանալի է առաջարկությունների համակարգեր ստեղծելու համար: (Դիմումի տարբերակ R-ի կոդով. Ֆիլմերի առաջարկությունների համակարգի նախագիծ Ռ )
  18. UCI Spambase տվյալների հավաքածու — սպամի հայտնաբերման ուսումնական տվյալների բազա: Պարունակում է 4601 տառ՝ 57 մետատվյալների պարամետրերով:
  19. Flickr 30k տվյալների հավաքածու — ավելի քան 30 պատկերներ և ենթագրեր: (Flickr 8k տվյալների հավաքածու - 8000 պատկեր: Python աղբյուրի նախագիծ. Image Caption Generator Python Project)
  20. IMDB-ի ակնարկներ — 25 ֆիլմերի ակնարկներ ուսուցման հավաքածուում և 000 թեստային հավաքածուում: (Դիմումի տարբերակ R-ի կոդով. Զգացմունքների վերլուծություն տվյալների գիտության նախագիծ)
  21. MS COCO տվյալների բազա — 1,5 միլիոն հատկորոշված ​​պատկեր:
  22. CIFAR-10 և CIFAR-100 տվյալների բազա — CIFAR-10-ը պարունակում է 60,000*32 պիքսել 32-0 թվերի 9 փոքր պատկերներ: CIFAR-100 - համապատասխանաբար, 0-100:
  23. GTSRB (գերմանական ճանապարհային նշանների ճանաչման չափանիշ) Տվյալների հավաքածու — 50 ճանապարհային նշանների 000 պատկեր: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. Ճանապարհային նշանների ճանաչման Python նախագիծ)
  24. ImageNet տվյալների բազա — պարունակում է ավելի քան 100 արտահայտություն և մոտ 000 պատկեր յուրաքանչյուր արտահայտության համար:
  25. Կրծքագեղձի հիստոպաթոլոգիայի պատկերների տվյալների հավաքածու — տվյալների հավաքածուն պարունակում է կրծքագեղձի քաղցկեղի նմուշների պատկերներ: (Հավելվածի տարբերակ՝ միացված աղբյուրի կոդով Կրծքագեղձի քաղցկեղի դասակարգման Python նախագիծ)
  26. Cityscapes տվյալների հավաքածու — պարունակում է տարբեր քաղաքների փողոցների վիդեո հաջորդականությունների բարձրորակ ծանոթագրություններ:
  27. Կինետիկ տվյալների հավաքածու - պարունակում է մոտ 6,5 միլիոն բարձրորակ տեսանյութերի URL հղում:
  28. MPII մարդկային դիրքի հավաքածու — Տվյալների հավաքածուն պարունակում է մարդկային դիրքերի 25 պատկերներ՝ համատեղ անոտացիաներով:
  29. 20BN-something-something տվյալների հավաքածու v2 - բարձրորակ տեսանյութերի հավաքածու, որը ցույց է տալիս, թե ինչպես է մարդը կատարում ինչ-որ գործողություն:
  30. Օբյեկտ 365 տվյալների հավաքածու — բարձրորակ պատկերների հավաքածու՝ օբյեկտների սահմանափակող տուփերով:
  31. Լուսանկարների էսքիզավորման տվյալների հավաքածու — պարունակում է ավելի քան 1000 պատկեր՝ իրենց ուրվագծային գծագրերով:
  32. CQ500 տվյալների հավաքածու — տվյալների հավաքածուն պարունակում է գլխի 491 CT սկանավորում՝ 193 շերտով:
  33. IMDB-Wiki տվյալների բազա — տվյալների հավաքածու՝ սեռով և տարիքով նշվող դեմքերի ավելի քան 5 միլիոն պատկերներով: (Հավելվածի տարբերակ՝ միացված աղբյուրի կոդով Սեռի և տարիքի հայտնաբերման Python նախագիծ)
  34. Youtube 8M տվյալների հավաքածու - Պիտակավորված տեսանյութերի հավաքածու, որը պարունակում է 6,1 միլիոն Youtube տեսանյութի ID
  35. Urban Sound 8K տվյալների բազա — քաղաքային ձայնային տվյալների հավաքածու (պարունակում է 8732 քաղաքային հնչյուններ 10 դասերից):
  36. LSUN տվյալների հավաքածու - տեսարանների և առարկաների միլիոնավոր գունավոր պատկերների հավաքածու (մոտ 59 միլիոն պատկեր, 10 տարբեր տեսարանների կատեգորիաներ և 20 տարբեր օբյեկտների կատեգորիաներ):
  37. RAVDESS տվյալների հավաքածու — զգացմունքային խոսքի տեսալսողական բազա: (Հավելվածի տարբերակ՝ միացված աղբյուրի կոդով Խոսքի զգացմունքների ճանաչման Python նախագիծ)
  38. Librispeech Dataset — տվյալների հավաքածուն պարունակում է 1000 ժամ անգլերեն խոսք՝ տարբեր շեշտադրումներով:
  39. Baidu Apolloscape տվյալների հավաքածու — տվյալների բազա՝ ինքնակառավարման տեխնոլոգիաների մշակման համար:
  40. Quandl Data Portal — տնտեսական և ֆինանսական տվյալների շտեմարան (կա անվճար և վճարովի բովանդակություն):
  41. Համաշխարհային բանկի բաց տվյալների պորտալ — տեղեկատվություն Համաշխարհային բանկի կողմից զարգացող երկրներին տրված վարկերի մասին։
  42. ԱՄՀ տվյալների պորտալ Միջազգային արժութային հիմնադրամի պորտալ է, որը հրապարակում է տվյալներ միջազգային ֆինանսների, պարտքի դրույքաչափերի, ներդրումների, արժութային պահուստների և ապրանքների վերաբերյալ:
  43. Ամերիկյան տնտեսական ասոցիացիայի (AEA) տվյալների պորտալ - ԱՄՆ մակրոտնտեսական տվյալների որոնման ռեսուրս:
  44. Google Trends տվյալների պորտալ - Google-ի միտումների տվյալները կարող են օգտագործվել տվյալների տեսողական ուսումնասիրության և վերլուծության համար:
  45. Financial Times Market Data Portal ռեսուրս է ամբողջ աշխարհից ֆինանսական շուկաների վերաբերյալ արդի տեղեկատվության համար:
  46. Data.gov պորտալ - ԱՄՆ կառավարության բաց տվյալների պորտալ (գյուղատնտեսություն, առողջապահություն, կլիմա, կրթություն, էներգետիկա, ֆինանսներ, գիտություն և հետազոտություն և այլն):
  47. Տվյալների պորտալ՝ բաց կառավարության տվյալներ (Հնդկաստան) Հնդկաստանի բաց կառավարության տվյալների հարթակն է:
  48. Սննդի միջավայր Atlas Data Portal — պարունակում է հետազոտությունների տվյալներ Միացյալ Նահանգներում սննդի վերաբերյալ:
  49. Առողջության տվյալների պորտալ ԱՄՆ Առողջապահության և մարդկային ծառայությունների նախարարության պորտալն է:
  50. Հիվանդությունների վերահսկման և կանխարգելման կենտրոնների տվյալների պորտալ - պարունակում է առողջության հետ կապված տվյալների լայն շրջանակ:
  51. Լոնդոնի տվյալների խանութի պորտալ - տվյալներ Լոնդոնում մարդկանց կյանքի մասին:
  52. Կանադայի կառավարության բաց տվյալների պորտալ - կանադացիների մասին բաց տվյալների պորտալ (գյուղատնտեսություն, արվեստ, երաժշտություն, կրթություն, կառավարություն, առողջապահություն և այլն)

Կարդալ ավելին

Source: www.habr.com

Գնեք հուսալի հոստինգ DDoS պաշտպանությամբ կայքերի, VPS VDS սերվերների համար 🔥 Գնեք հուսալի կայքերի հոսթինգ՝ DDoS պաշտպանությամբ, VPS VDS սերվերներով | ProHoster