52 tacar sonraí do thionscadail oiliúna

  1. Tacar Sonraí Custaiméirí Meall — sonraí cuairteoirí siopa: id, inscne, aois, ioncam, rátáil caiteachais. (Rogha iarratais: Tionscadal Deighilte Custaiméara le Foghlaim Meaisín)
  2. Tacar Sonraí Iris — tacar sonraí do thosaitheoirí, ina bhfuil méideanna seipil agus peitil do bhláthanna éagsúla.
  3. Tacar Sonraí MNIST — tacar sonraí d’uimhreacha lámhscríofa. 60 íomhá oiliúna agus 000 íomhánna tástála.
  4. Tacar Sonraí Tithíochta Boston is tacar sonraí coitianta é chun patrún a aithint. Tá faisnéis ann faoi thithe i mBostún: líon na n-árasán, praghsanna cíosa, innéacs coireachta.
  5. Tacar Sonraí Braite Nuachta Bréige — ina bhfuil 7796 iontráil ar a bhfuil marcanna nuachta: fíor nó bréagach. (Rogha feidhmchláir le cód foinse i Python: Tionscadal Python Braite Nuachta Bréige )
  6. Bunachar sonraí cáilíochta fíona — ina bhfuil faisnéis faoi fhíon: 4898 taifead le 14 pharaiméadar.
  7. Sonraí SOCR – Tacar Sonraí Airde agus Meáchain - rogha mhaith chun tús a chur leis. Tá 25 taifead ann ar airde agus meáchan daoine 000 mbliana d’aois.

    52 tacar sonraí do thionscadail oiliúna

    Aistríodh an t-alt le tacaíocht ó EDISON Software, a comhlíonann sé orduithe ó Dheisceart na Síne “go han-mhaith”Agus forbraíonn feidhmchláir ghréasáin agus láithreáin ghréasáin.

  8. Tacar Sonraí Parkinson — 195 taifead othar a bhfuil galar Parkinson orthu, le 25 paraiméadair anailíse. Is féidir é a úsáid le haghaidh réamh-mheasúnú ar an difríocht idir daoine breoite agus daoine sláintiúla. (Rogha feidhmchláir le cód foinse i Python: Tionscadal Meaisín Foghlama maidir le Galar Parkinson a Bhrath)
  9. Tacar sonraí Titanic — ina bhfuil faisnéis faoi phaisinéirí (aois, inscne, gaolta ar bord, etc.) 891 sa tacar oiliúna agus 418 sa tacar tástála.
  10. Tacar Sonraí Uber Pickups — faisnéis faoi 4.5 milliún turas ar Uber in 2014 agus 14 milliún in 2015. (Rogha feidhmchláir le cód foinse in R: Tionscadal Anailíse Sonraí Uber i R)
  11. Tacar Sonraí Chars74k — ina bhfuil íomhánna de shiombail na Breataine agus Cheanada de 64 rang: 0-9, AZ, a-z. 7700 7.7k íomhá nádúrtha, 3400k lámhscríofa, 62000 cló sintéiseithe ríomhaire.
  12. Tacar Sonraí Braite Calaoise Cárta Creidmheasa — ina bhfuil faisnéis faoi idirbhearta cártaí creidmheasa faoi chontúirt. (Rogha feidhmchláir leis an bhfoinse: Tionscadal Foghlama Meaisín Braite Calaoise Cárta Creidmheasa)
  13. Tacar Sonraí Intinn Chatbot — comhad JSON ina bhfuil clibeanna éagsúla: beannachtaí, slán, ospidéal_cuardach, cógas_cuardach, etc. Tá sraith de theimpléid ceisteanna-freagra ann. (Rogha feidhmchláir le cód foinse i Python: Tionscadal Chatbot i Python)
  14. Tacar Sonraí Ríomhphost Enron — leathmhilliún litir ó 150 bainisteoir Enron.
  15. An Tacar Sonraí Yelp — ina bhfuil 1,2 milliún moladh ó 1,6 milliún úsáideoir thart ar 1,2 milliún eagraíocht.
  16. Tacar Sonraí Contúirt — níos mó ná 200 taifead ceisteanna agus freagraí ón gcluiche teilifíse móréilimh.
  17. Tacar Sonraí Córais Molta — tairseach le bailiúchán tacar sonraí ó Ollscoil UCSD. Tá taifid athbhreithnithe ar shuíomhanna móréilimh (Goodreads, Amazon). Sármhaith le córais mholtóra a chruthú. (Rogha feidhmchláir le cód foinse in R: Tionscadal Córas Molta Scannán i R )
  18. Tacar Sonraí Turscar UCI — tacar sonraí oiliúna chun turscar a bhrath. Tá 4601 litir ann agus 57 paraiméadair meiteashonraí ann.
  19. Tacar Sonraí Flickr 30k — níos mó ná 30 íomhá agus fotheideal. (Tacar Sonraí Flickr 8k — 8000 íomhá. Tionscadal foinse Python: Gineadóir Fotheideal Íomhá Tionscadal Python)
  20. Léirmheasanna IMDB — 25 léirmheas scannán sa tacar oiliúna agus 000 sa tacar tástála. (Rogha feidhmchláir le cód foinse in R: Tionscadal Eolaíochta Sonraí Anailís Mothúcháin)
  21. Tacar sonraí MS COCO — 1,5 milliún íomhá clibeáilte.
  22. Tacar sonraí CIFAR-10 agus CIFAR-100 — Cuimsíonn CIFAR-10 60,000 íomhá beag d’uimhreacha 32*32 picteilín 0-9. CIFAR-100 - faoi seach, 0-100.
  23. GTSRB (tagarmharc aitheantais comharthaí tráchta na Gearmáine) Tacar Sonraí — 50 íomhá de 000 comhartha bóthair. (Rogha feidhmchláir le cód foinse i Python: Tionscadal Python Aithint Comharthaí Tráchta)
  24. Tacar sonraí ImageNet — níos mó ná 100 frása agus thart ar 000 íomhá in aghaidh na habairte.
  25. Tacar Sonraí Íomhánna Histeapaiteolaíochta Cíche — tá íomhánna de shamplaí ailse chíche sa tacar sonraí. (Rogha feidhmchláir le cód foinse ar Tionscadal Python Aicmithe Ailse Cíche)
  26. Tacar Sonraí Cityscapes — tá nótaí d'ardchaighdeán ann ar sheichimh fhíse de shráideanna i gcathracha éagsúla.
  27. Cinéitic Tacar Sonraí - ina bhfuil nasc URL chuig thart ar 6,5 milliún físeán ardcháilíochta.
  28. Bunachar sonraí staidiúir an duine MPII — tá 25 íomhá de staideanna daonna le comhnótaí sa tacar sonraí.
  29. Tacar sonraí 20BN-rud éigin v2 - sraith d'fhíseáin ardchaighdeáin a thaispeánann an chaoi a ndéanann duine gníomh éigin.
  30. Cuspóir 365 tacar sonraí — tacar sonraí d’íomhánna ardcháilíochta le boscaí teorannaithe réad.
  31. Tacar sonraí sceitseála grianghraif — níos mó ná 1000 íomhá lena n-imlíne líníochtaí.
  32. Tacar Sonraí CQ500 — tá 491 scanadh CT den chloigeann sa tacar sonraí le 193 slisne.
  33. Tacar sonraí IMDB-Wiki — tacar sonraí ina bhfuil níos mó ná 5 mhilliún íomhá d’aghaidheanna marcáilte de réir inscne agus aoise. (Rogha feidhmchláir le cód foinse ar Tionscadal Python Aimsithe Inscne & Aoise)
  34. Youtube 8m tacar sonraí - Tacar sonraí físeán lipéadaithe ina bhfuil 6,1 milliún ID físeáin Youtube
  35. Tacar sonraí Uirbeach Sound 8K — tacar sonraí fuaime uirbeacha (tá 8732 fuaim uirbeach as 10 n-aicme ann).
  36. Tacar Sonraí LSUN - tacar sonraí de na milliúin íomhánna datha de radhairc agus de réada (thart ar 59 milliún íomhá, 10 gcatagóir radharc éagsúil agus 20 catagóir réad éagsúil).
  37. Tacar Sonraí RAVDESS — bunachar sonraí closamhairc de chaint mhothúchánach. (Rogha feidhmchláir le cód foinse ar Tionscadal Python Aithint Mothúcháin Urlabhra)
  38. Tacar Sonraí Librispeech — tá 1000 uair an chloig de chaint Bhéarla le haicinn éagsúla sa tacar sonraí.
  39. Tacar Sonraí Baidu Apolloscape — tacar sonraí chun teicneolaíochtaí féintiomáinte a fhorbairt.
  40. Tairseach Sonraí Quandl — stór sonraí eacnamaíocha agus airgeadais (tá ábhar in aisce agus íoctha ann).
  41. Tairseach Sonraí Oscailte an Bhainc Dhomhanda — faisnéis maidir le hiasachtaí arna n-eisiúint ag an mBanc Domhanda chuig tíortha i mbéal forbartha.
  42. Tairseach Sonraí an IMF is tairseach cistí airgeadaíochta idirnáisiúnta é a fhoilsíonn sonraí ar airgeadas idirnáisiúnta, rátaí fiachais, infheistíocht, cúlchistí malairte eachtraí agus tráchtearraí.
  43. Tairseach Sonraí Chumann Eacnamaíochta Mheiriceá (AEA). - Acmhainn chun sonraí maicreacnamaíocha SAM a chuardach.
  44. Tairseach Sonraí Google Trends - Is féidir sonraí treochtaí Google a úsáid chun sonraí a iniúchadh agus a anailísiú go radhairc.
  45. Tairseach Sonraí Margaidh Financial Times Is acmhainn é le haghaidh faisnéise cothrom le dáta ar mhargaí airgeadais ar fud an domhain.
  46. Tairseach Data.gov - Tairseach sonraí oscailte rialtas SAM (talmhaíocht, sláinte, aeráid, oideachas, fuinneamh, airgeadas, eolaíocht agus taighde, etc.).
  47. Tairseach Sonraí: Sonraí rialtais oscailte (India) Is é ardán sonraí rialtais oscailte na hIndia.
  48. Tairseach Sonraí Atlas don chomhshaol bia — ina bhfuil sonraí taighde ar chothú sna Stáit Aontaithe.
  49. Tairseach Sonraí Sláinte is tairseach de chuid Roinn Sláinte agus Seirbhísí Daonna SAM.
  50. Tairseach Sonraí na nIonad um Rialú Galar agus Cosc - ina bhfuil raon leathan sonraí a bhaineann leis an tsláinte.
  51. Tairseach Sonraí Londain - sonraí faoi shaol na ndaoine i Londain.
  52. Tairseach Sonraí Oscailte Rialtas Cheanada - tairseach sonraí oscailte faoi Cheanada (talmhaíocht, ealaín, ceol, oideachas, rialtas, cúram sláinte, etc.)

Leigh Nios mo

Foinse: will.com

Add a comment