- — խանութի այցելուների տվյալները՝ ID, սեռ, տարիք, եկամուտ, ծախսերի վարկանիշ: (Դիմումի տարբերակ. )
- — Սկսնակների համար նախատեսված տվյալների հավաքածու, որը պարունակում է տարբեր ծաղիկների համար նախատեսված sepals և թերթիկների չափսեր:
- — ձեռագիր թվերի հավաքածու: 60 ուսումնական պատկեր և 000 թեստային պատկեր:
- օրինաչափությունների ճանաչման հանրաճանաչ տվյալների բազա է: Պարունակում է տեղեկատվություն Բոստոնում գտնվող տների մասին՝ բնակարանների քանակ, վարձակալության գներ, հանցագործության ինդեքս։
- — պարունակում է 7796 գրառում նորությունների նշումներով՝ ճշմարիտ կամ կեղծ: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. )
- — պարունակում է տեղեկատվություն գինու մասին՝ 4898 գրառում 14 պարամետրով։
- - լավ տարբերակ է սկսելու համար: Պարունակում է 25 տարեկան մարդկանց հասակի և քաշի 000 գրառում։
Հոդվածը թարգմանվել է EDISON Software-ի աջակցությամբ, որը Իսկ . - — Պարկինսոնի հիվանդությամբ հիվանդների 195 գրառում՝ 25 վերլուծական պարամետրերով: Կարող է օգտագործվել հիվանդ և առողջ մարդկանց միջև տարբերության նախնական գնահատման համար: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. )
- — պարունակում է տեղեկություններ ուղևորների մասին (տարիքը, սեռը, ինքնաթիռում գտնվող հարազատները և այլն) 891 ուսումնամարզական հավաքակազմում և 418 թեստային հավաքածուում:
- — 4.5 թվականին Uber-ով 2014 միլիոն ուղևորությունների և 14 թվականին՝ 2015 միլիոնի մասին տեղեկություններ։ (Դիմումի տարբերակ R-ի կոդով. )
- — պարունակում է 64 դասի բրիտանական և կանադական խորհրդանիշների պատկերներ՝ 0-9, AZ, az. 7700 7.7k բնական պատկերներ, 3400k ձեռագիր, 62000 համակարգչային սինթեզված տառատեսակներ:
- — պարունակում է տեղեկատվություն վարկաբեկված վարկային քարտերի գործարքների մասին: (Աղբյուրով դիմումի տարբերակ. )
- — JSON ֆայլ, որը պարունակում է տարբեր պիտակներ՝ ողջույններ, հրաժեշտ, հիվանդանոցի_որոնում, դեղատան_որոնում և այլն: Պարունակում է հարց-պատասխանի ձևանմուշների հավաքածու: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. )
- — պարունակում է կես միլիոն նամակ Enron-ի 150 մենեջերներից:
- — պարունակում է 1,2 միլիոն առաջարկ 1,6 միլիոն օգտատերերի մոտ 1,2 միլիոն կազմակերպություններից:
- — ավելի քան 200 հարց ու պատասխան ձայնագրություն հանրահայտ հեռուստախաղից:
- — UCSD համալսարանի տվյալների հավաքածուներով պորտալ: Պարունակում է հանրաճանաչ կայքերի ակնարկների գրառումներ (Goodreads, Amazon): Հիանալի է առաջարկությունների համակարգեր ստեղծելու համար: (Դիմումի տարբերակ R-ի կոդով. )
- — սպամի հայտնաբերման ուսումնական տվյալների բազա: Պարունակում է 4601 տառ՝ 57 մետատվյալների պարամետրերով:
- — ավելի քան 30 պատկերներ և ենթագրեր: ( - 8000 պատկեր: Python աղբյուրի նախագիծ. )
- — 25 ֆիլմերի ակնարկներ ուսուցման հավաքածուում և 000 թեստային հավաքածուում: (Դիմումի տարբերակ R-ի կոդով. )
- — 1,5 միլիոն հատկորոշված պատկեր:
- — CIFAR-10-ը պարունակում է 60,000*32 պիքսել 32-0 թվերի 9 փոքր պատկերներ: CIFAR-100 - համապատասխանաբար, 0-100:
- — 50 ճանապարհային նշանների 000 պատկեր: (Python-ի սկզբնական կոդով հավելվածի տարբերակ. )
- — պարունակում է ավելի քան 100 արտահայտություն և մոտ 000 պատկեր յուրաքանչյուր արտահայտության համար:
- — տվյալների հավաքածուն պարունակում է կրծքագեղձի քաղցկեղի նմուշների պատկերներ: (Հավելվածի տարբերակ՝ միացված աղբյուրի կոդով )
- — պարունակում է տարբեր քաղաքների փողոցների վիդեո հաջորդականությունների բարձրորակ ծանոթագրություններ:
- - պարունակում է մոտ 6,5 միլիոն բարձրորակ տեսանյութերի URL հղում:
- — Տվյալների հավաքածուն պարունակում է մարդկային դիրքերի 25 պատկերներ՝ համատեղ անոտացիաներով:
- - բարձրորակ տեսանյութերի հավաքածու, որը ցույց է տալիս, թե ինչպես է մարդը կատարում ինչ-որ գործողություն:
- — բարձրորակ պատկերների հավաքածու՝ օբյեկտների սահմանափակող տուփերով:
- — պարունակում է ավելի քան 1000 պատկեր՝ իրենց ուրվագծային գծագրերով:
- — տվյալների հավաքածուն պարունակում է գլխի 491 CT սկանավորում՝ 193 շերտով:
- — տվյալների հավաքածու՝ սեռով և տարիքով նշվող դեմքերի ավելի քան 5 միլիոն պատկերներով: (Հավելվածի տարբերակ՝ միացված աղբյուրի կոդով )
- - Պիտակավորված տեսանյութերի հավաքածու, որը պարունակում է 6,1 միլիոն Youtube տեսանյութի ID
- — քաղաքային ձայնային տվյալների հավաքածու (պարունակում է 8732 քաղաքային հնչյուններ 10 դասերից):
- - տեսարանների և առարկաների միլիոնավոր գունավոր պատկերների հավաքածու (մոտ 59 միլիոն պատկեր, 10 տարբեր տեսարանների կատեգորիաներ և 20 տարբեր օբյեկտների կատեգորիաներ):
- — զգացմունքային խոսքի տեսալսողական բազա: (Հավելվածի տարբերակ՝ միացված աղբյուրի կոդով )
- — տվյալների հավաքածուն պարունակում է 1000 ժամ անգլերեն խոսք՝ տարբեր շեշտադրումներով:
- — տվյալների բազա՝ ինքնակառավարման տեխնոլոգիաների մշակման համար:
- — տնտեսական և ֆինանսական տվյալների շտեմարան (կա անվճար և վճարովի բովանդակություն):
- — տեղեկատվություն Համաշխարհային բանկի կողմից զարգացող երկրներին տրված վարկերի մասին։
- Միջազգային արժութային հիմնադրամի պորտալ է, որը հրապարակում է տվյալներ միջազգային ֆինանսների, պարտքի դրույքաչափերի, ներդրումների, արժութային պահուստների և ապրանքների վերաբերյալ:
- - ԱՄՆ մակրոտնտեսական տվյալների որոնման ռեսուրս:
- - Google-ի միտումների տվյալները կարող են օգտագործվել տվյալների տեսողական ուսումնասիրության և վերլուծության համար:
- ռեսուրս է ամբողջ աշխարհից ֆինանսական շուկաների վերաբերյալ արդի տեղեկատվության համար:
- - ԱՄՆ կառավարության բաց տվյալների պորտալ (գյուղատնտեսություն, առողջապահություն, կլիմա, կրթություն, էներգետիկա, ֆինանսներ, գիտություն և հետազոտություն և այլն):
- Հնդկաստանի բաց կառավարության տվյալների հարթակն է:
- — պարունակում է հետազոտությունների տվյալներ Միացյալ Նահանգներում սննդի վերաբերյալ:
- ԱՄՆ Առողջապահության և մարդկային ծառայությունների նախարարության պորտալն է:
- - պարունակում է առողջության հետ կապված տվյալների լայն շրջանակ:
- - տվյալներ Լոնդոնում մարդկանց կյանքի մասին:
- - կանադացիների մասին բաց տվյալների պորտալ (գյուղատնտեսություն, արվեստ, երաժշտություն, կրթություն, կառավարություն, առողջապահություն և այլն)
Կարդալ ավելին
Source: www.habr.com
