Takelaka data mpanjifa Mall - data momba ny mpitsidika fivarotana: ID, lahy sy vavy, taona, fidiram-bola, naoty fandaniana. (Safidy fampiharana:Tetikasa fizarana mpanjifa miaraka amin'ny fianarana milina )Takelaka data Iris - angon-drakitra ho an'ny vao manomboka, misy ny haben'ny sepal sy ny felany ho an'ny voninkazo isan-karazany.Takelaka data MNIST - angona misy isa sora-tanana. 60 sary fiofanana sy 000 sary fitsapana.Boston Housing Dataset dia angon-drakitra malaza ho famantarana ny lamina. Ahitana fampahalalana momba ny trano any Boston: isan'ny trano, vidin'ny fanofana, fanondroana heloka bevava.Angon-drakitra momba ny vaovao sandoka — misy lahatsoratra 7796 misy marika vaovao: marina na diso. (Safidy fampiharana miaraka amin'ny kaody loharano amin'ny Python:Tetikasa Python Detection Vaovao sandoka )Data momba ny kalitaon'ny divay — misy fampahalalana momba ny divay: rakitsoratra 4898 misy paramètre 14.Angon-drakitra SOCR - Angon-drakitra momba ny haavony sy lanja - safidy tsara hanombohana. Misy firaketana 25 momba ny haavony sy ny lanjan'ny olona 000 taona.
Nadika tamin'ny fanohanan'ny EDISON Software ny lahatsoratra, izaymanatanteraka ny baiko avy any atsimon'i Shina "tsara" , ary koamamolavola rindranasa an-tranonkala sy tranokala .Takelaka data Parkinson - Firaketana 195 momba ny marary voan'ny aretin'i Parkinson, miaraka amin'ny mari-pamantarana fanadihadiana 25. Azo ampiasaina amin'ny fanombanana mialoha ny fahasamihafana misy eo amin'ny marary sy ny olona salama. (Safidy fampiharana miaraka amin'ny kaody loharano amin'ny Python:Tetikasa fianarana milina momba ny fitiliana ny aretin'i Parkinson )Takelaka data Titanic - misy fampahalalana momba ny mpandeha (taona, lahy sy vavy, havana ao anaty sambo, sns.) 891 ao amin'ny toeram-piofanana ary 418 ao amin'ny andrana.Uber Pickups Dataset - fampahalalana momba ny dia 4.5 tapitrisa amin'ny Uber tamin'ny 2014 ary 14 tapitrisa tamin'ny 2015. (Safidy fampiharana miaraka amin'ny kaody loharano ao amin'ny R:Uber Data Analysis Project ao amin'ny R )Takelaka data Chars74K — misy sarin'ny marika anglisy sy kanadiana misy kilasy 64: 0-9, A-Z, a-z. 7700 7.7k sary voajanahary, 3400 sora-tanana, 62000 litera vita amin'ny ordinatera.Dataset momba ny hosoka amin'ny carte de crédit - misy fampahalalana momba ny fifampiraharahana amin'ny carte de crédit simba. (Safidy fampiharana miaraka amin'ny loharano:Tetikasa fianarana milina fikarohana hosoka amin'ny carte de crédit )Chatbot Intents Dataset - rakitra JSON misy marika isan-karazany: fiarahabana, veloma, hôpitaly_fikarohana, pharmacy_search, sns. Ahitana modely misy valin'ny fanontaniana maromaro. (Safidy fampiharana miaraka amin'ny kaody loharano amin'ny Python:Tetikasa Chatbot amin'ny Python )Enron Email Dataset - misy taratasy antsasa-tapitrisa avy amin'ny mpitantana Enron 150.Takelaka data Yelp - misy soso-kevitra 1,2 tapitrisa avy amin'ny mpampiasa 1,6 tapitrisa eo amin'ny fikambanana 1,2 tapitrisa.Takelaka data Jeopardy — mihoatra ny 200 ny firaketana fanontaniana sy valiny avy amin'ny lalao fahitalavitra malaza.Recommender Systems Dataset - vavahadin-tserasera misy angon-drakitra avy amin'ny UCSD University. Ahitana rakitsoratry ny hevitra momba ny tranokala malaza (Goodreads, Amazon). Tsara ho an'ny famoronana rafitra manoro hevitra. (Safidy fampiharana miaraka amin'ny kaody loharano ao amin'ny R:Tetikasa System Recommendation Movie ao amin'ny R )Takelaka data UCI - angon-drakitra fanofanana ho an'ny fitadiavana spam. Misy litera 4601 misy masontsivana metadata 57.Takelaka data Flickr 30k - sary sy lohateny maherin'ny 30. (Takelaka data Flickr 8k — 8000 sary. Tetikasa loharano Python:Tetikasa Python Generator Image Caption )Hevitra IMDB — 25 ny fijerena sarimihetsika ao amin'ny seta fanofanana ary 000 ao amin'ny andrana. (Safidy fampiharana miaraka amin'ny kaody loharano ao amin'ny R:Tetikasa Siansa momba ny angon-drakitra momba ny fihetseham-po )Takelaka data MS COCO - 1,5 tapitrisa sary voamarika.Takelaka data CIFAR-10 - Ny CIFAR-10 dia misy sary kely 60,000 amin'ny 32*32 piksel isa 0-9. CIFAR-100 - tsirairay avy, 0-100.GTSRB (famantarana famantarana famantarana ny fifamoivoizana alemana) Dataset — sary 50 amin'ny famantarana ara-dalana 000. (Safidy fampiharana miaraka amin'ny kaody loharano amin'ny Python:Tetikasa Python Recognition Signs Traffic )Data ImageNet - misy andian-teny maherin'ny 100 ary sary 000 eo ho eo isaky ny fehezanteny.Dataset sarin'ny histopathology nono - Ny angon-drakitra dia misy sarin'ny kanseran'ny nono. (Safidy fampiharana miaraka amin'ny kaody loharano mandehaTetikasa Python fanasokajiana kanseran'ny nono )Takelaka data Cityscapes - misy fanamarihana avo lenta momba ny filaharan'ny arabe amin'ny tanàna samihafa.Takelaka data Kinetics - misy rohy URL mankany amin'ny horonan-tsary avo lenta 6,5 tapitrisa eo ho eo.Takelaka data MPII - Ny angon-drakitra dia misy sary 25 amin'ny sarin'olombelona miaraka amin'ny fanamarihana iraisana.Takelaka data 20BN - andian-dahatsary avo lenta mampiseho ny fomba anaovan'ny olona hetsika sasany.Takelaka data 365 - angon-drakitra misy sary avo lenta miaraka amin'ny boaty mifamatotra zavatra.Data sketch sary - misy sary mihoatra ny 1000 miaraka amin'ny sariny.Takelaka data CQ500 - Ny angon-drakitra dia misy scan CT 491 amin'ny loha miaraka amin'ny silaka 193.Takelaka data IMDB-Wiki - angon-drakitra misy sary mihoatra ny 5 tapitrisa amin'ny endrika voamariky ny lahy sy ny vavy. (Safidy fampiharana miaraka amin'ny kaody loharano mandehaTetikasa Python Detection Gender & Age )Takelaka data 8M - angon-dahatsary misy marika izay misy ID video Youtube 6,1 tapitrisaTakelaka data Urban Sound 8K - angon-drakitra momba ny feo an-tanàn-dehibe (misy feo an-tanàn-dehibe 8732 avy amin'ny kilasy 10).Takelaka data LS105 - angon-drakitra misy sary miloko an-tapitrisany misy sary sy zavatra (sary 59 tapitrisa eo ho eo, sokajy sehatra 10 samihafa ary sokajy zavatra 20 samihafa).Takelaka data RAVD — angon-drakitra audiovisual momba ny lahateny ara-pihetseham-po. (Safidy fampiharana miaraka amin'ny kaody loharano mandehaTetikasa Python Recognition Fihetseham-pitenenana )Takelaka data Librispeech - Ny angon-drakitra dia misy 1000 ora amin'ny teny anglisy miaraka amin'ny lantom-peo samihafa.Takelaka data Baidu Apolloscape - angona ho an'ny fampivoarana ny teknolojia mitondra fiara.Quandl Data Portal - fitahirizana angon-drakitra ara-toekarena sy ara-bola (misy votoaty maimaim-poana sy karama).Ny Banky Iraisam-pirenena Open Data Portal - fampahalalana momba ny fampindramam-bola navoakan'ny Banky iraisam-pirenena ho an'ny firenena an-dalam-pandrosoana.Takelaka data IMF dia vavahadin'ny tahirim-bola iraisam-pirenena izay mamoaka angon-drakitra momba ny vola iraisam-pirenena, ny tahan'ny trosa, ny fampiasam-bola, ny tahirim-bola vahiny ary ny entana.Portal angon-drakitra American Economic Association (AEA). - Loharanom-pitadiavana ny angona macroeconomic amerikana.Google Trends Data Portal - Ny angona fironana Google dia azo ampiasaina hikaroka sy hamakafaka ny angona.Portal angona momba ny tsenan'ny Financial Times dia loharanom-baovao momba ny tsena ara-bola manerana izao tontolo izao.Portal Data.gov - vavahadin-tserasera misokatra ny governemanta amerikana (fambolena, fahasalamana, toetrandro, fanabeazana, angovo, fitantanam-bola, siansa sy fikarohana, sns.).Portal data: angon-drakitra misokatra ho an'ny governemanta (India) dia sehatra angon-drakitra misokatra ho an'ny governemanta ao India.Toeram-pisakafoanana Atlas Data Portal - misy angona fikarohana momba ny sakafo any Etazonia.Portal momba ny fahasalamana dia vavahadin'ny Departemanta Amerikana misahana ny Fahasalamana sy ny Sampan-draharahan'ny olombelona.Ivontoerana momba ny fanaraha-maso sy ny fisorohana ny aretina ny vavahadin-tserasera - misy angon-drakitra isan-karazany mifandraika amin'ny fahasalamana.Portal London Datastore - angona momba ny fiainan'ny olona any Londres.Portal angon-drakitra misokatra ho an'ny governemanta Canada - vavahadin-tserasera misokatra momba ny Kanadiana (fambolena, zavakanto, mozika, fanabeazana, governemanta, fitsaboana, sns.)
Hamaky bebe kokoa
Tetik'asa misokatra 14 hanatsarana ny fahaiza-manaon'ny Data Science (mora, mahazatra, sarotra) Dojo eo anoloana: tetik'asa hampiofanana ny fahaizan'ny mpamorona (5 vaovao + 43 taona) Top 12 Infografika IT Dynamic mahaliana indrindra
Source: www.habr.com