ProHoster > Օրագիր > Վարչակազմը > Տվյալների ինժեներ մասնագիտությունը ստանալու համար համահարթեցման պլան
Տվյալների ինժեներ մասնագիտությունը ստանալու համար համահարթեցման պլան
Վերջին ութ տարին ես աշխատում եմ որպես նախագծի մենեջեր (աշխատանքում կոդ չեմ գրում), ինչը, բնականաբար, բացասաբար է անդրադառնում իմ տեխնոլոգիական հետին պլանի վրա։ Որոշեցի փակել իմ տեխնոլոգիական բացը և ստանալ տվյալների ինժեների մասնագիտությունը։ Տվյալների ինժեների հիմնական հմտությունը տվյալների պահեստներ նախագծելու, կառուցելու և պահպանելու կարողությունն է:
Մարզումների պլան եմ կազմել, կարծում եմ՝ դա օգտակար կլինի ոչ միայն ինձ։ Ծրագիրը կենտրոնացած է ինքնուրույն ուսուցման դասընթացների վրա: Առաջնահերթությունը տրվում է ռուսերենի անվճար դասընթացներին։
Բաժիններ:
Ալգորիթմներ և տվյալների կառուցվածքներ: Հիմնական բաժին. Սովորեք, և մնացած ամեն ինչ նույնպես կաշխատի: Կարևոր է ձեռք բերել կոդը և օգտագործել հիմնական կառուցվածքներն ու ալգորիթմները:
Տվյալների բազաներ և տվյալների պահեստներ, Բիզնես հետախուզություն: Մենք ալգորիթմներից անցնում ենք տվյալների պահպանման և մշակման:
Hadoop և Big Data. Երբ տվյալների բազան ներառված չէ կոշտ սկավառակի վրա, կամ երբ տվյալները պետք է վերլուծվեն, բայց Excel-ն այլևս չի կարող դրանք բեռնել, սկսվում են մեծ տվյալներ: Իմ կարծիքով, այս հատվածին անհրաժեշտ է անցնել միայն նախորդ երկուսի խորը ուսումնասիրությունից հետո։
Ալգորիթմներ և տվյալների կառուցվածքներ
Իմ պլանում ես ներառել եմ Python-ի սովորելը, մաթեմատիկայի և ալգորիթմացման հիմունքները կրկնելը:
Տվյալների բազաներ և տվյալների պահեստներ, Բիզնես հետախուզություն
Գիրք՝ Martin Kleppman - Բարձր բեռնված հավելվածներ: Ծրագրավորում, մասշտաբավորում, աջակցություն: Գիրքը նկարագրում է, թե ինչպես են աշխատում տվյալների տարբեր մոդելները, դրանց իրականացումը ներսից, սահմանափակումներն ու ընտրությունը՝ կախված առաջադրանքից:
Տվյալների պահեստների, ETL, OLAP խորանարդների կառուցման հետ կապված թեմաները մեծապես կախված են գործիքներից, ուստի ես այս փաստաթղթի դասընթացներին հղումներ չեմ տալիս: Նման համակարգերը նպատակահարմար է ուսումնասիրել կոնկրետ ընկերությունում կոնկրետ նախագծի վրա աշխատելիս: ETL-ի հետ ծանոթանալու համար կարող եք փորձել Տաղանդ կամ Օդափոխումը.
Իմ կարծիքով, կարևոր է ուսումնասիրել ժամանակակից Data Vault նախագծման մեթոդոլոգիան հղում 1, հղում 2. Իսկ դա սովորելու լավագույն միջոցը այն վերցնելն ու պարզ օրինակով իրականացնելն է: GitHub-ում Data Vault-ի իրականացման մի քանի օրինակներ կան ՈՒղեցույց. Ժամանակակից Տվյալների Պահեստի Գիրք. Արագաշարժ տվյալների պահեստի մոդելավորում տվյալների պահոցով Հանս Հուլտգրենի կողմից:
Վերջնական օգտագործողների համար Business Intelligence գործիքներին ծանոթանալու համար կարող եք օգտագործել հաշվետվությունների, վահանակների, տվյալների մինի պահեստների անվճար դիզայներ Power BI Desktop: Ուսումնական նյութեր. հղում 1, հղում 2.
Hadoop և Big Data
Դուք պետք է սկսեք MapReduce-ի անկախ իրականացումից՝ առանց երրորդ կողմի գրադարանների: Սա թույլ կտա ապագայում ավելի լավ հասկանալ բազմաթելային իրականացումները: Նկարագրված է հիանալի օրինակ Python-ում այստեղ.
Այն ամենը, ինչ սովորում ես, չէ, որ կարելի է կիրառել աշխատավայրում: Ուստի ձեզ անհրաժեշտ է ավարտական նախագիծ, որում կփորձեք կիրառել նոր գիտելիքներ։
Ծրագրում տվյալների վերլուծության և մեքենայական ուսուցման հետ կապված թեմաներ չկան: սա ավելի շատ վերաբերում է Data Scientist մասնագիտությանը: Չկան նաև AWS ամպերի, Azure-ի հետ կապված թեմաներ: այս թեմաները մեծապես կախված են հարթակի ընտրությունից:
Հարցեր համայնքին.
Որքանո՞վ է համարժեք իմ հարթեցման պլանը: Ինչ հեռացնել կամ ավելացնել:
Ի՞նչ նախագիծ կառաջարկեք որպես թեզ: