خطة التسوية للحصول على مهندس بيانات المهنة

على مدار السنوات الثماني الماضية ، كنت أعمل كمدير مشروع (لا أكتب كودًا في العمل) ، مما يؤثر سلبًا بشكل طبيعي على الخلفية التكنولوجية الخاصة بي. قررت سد فجوتي التكنولوجية والحصول على مهنة مهندس البيانات. المهارة الأساسية لمهندس البيانات هي القدرة على تصميم مستودعات البيانات وبنائها وصيانتها.

لقد وضعت خطة تدريب ، وأعتقد أنها ستكون مفيدة ليس فقط بالنسبة لي. تركز الخطة على دورات الدراسة الذاتية. تعطى الأولوية للدورات المجانية باللغة الروسية.

أقسام:

  • الخوارزميات وهياكل البيانات. قسم رئيسي. تعلمها وسيعمل كل شيء آخر أيضًا. من المهم وضع يديك على الكود واستخدام الهياكل والخوارزميات الأساسية.
  • قواعد البيانات ومخازن البيانات ، ذكاء الأعمال. نحن ننتقل من الخوارزميات إلى تخزين البيانات ومعالجتها.
  • Hadoop والبيانات الضخمة. عندما لا يتم تضمين قاعدة البيانات على محرك الأقراص الثابتة ، أو عندما تحتاج البيانات إلى التحليل ، ولكن لم يعد بإمكان Excel تحميلها ، تبدأ البيانات الكبيرة. في رأيي ، من الضروري الانتقال إلى هذا القسم فقط بعد دراسة عميقة للجزئين السابقين.

الخوارزميات وهياكل البيانات

في خطتي ، قمت بتضمين تعلم بايثون ، وتكرار أساسيات الرياضيات والخوارزمية.

قواعد البيانات ومخازن البيانات ، ذكاء الأعمال

تعتمد الموضوعات المتعلقة ببناء مستودعات البيانات ومكعبات ETL و OLAP بشكل كبير على الأدوات ، لذلك لا أعطي روابط للدورات التدريبية في هذا المستند. يُنصح بدراسة مثل هذه الأنظمة عند العمل في مشروع معين في شركة معينة. للتعرف على ETL ، يمكنك المحاولة Talend أو تدفق الهواء.

في رأيي ، من المهم دراسة منهجية تصميم Data Vault الحديثة رابط 1, رابط 2. وأفضل طريقة لتعلمها هي أخذها وتنفيذها بمثال بسيط. هناك العديد من أمثلة تنفيذ Data Vault على GitHub رابط. كتاب مستودع البيانات الحديث: نمذجة مستودع البيانات السريع باستخدام مخزن البيانات بواسطة هانز هولتغرين.

للتعرف على أدوات Business Intelligence للمستخدمين النهائيين ، يمكنك استخدام المصمم المجاني للتقارير ولوحات المعلومات ومستودعات البيانات المصغرة Power BI Desktop. المواد التعليمية: رابط 1, رابط 2.

Hadoop والبيانات الضخمة

اختتام

لا يمكن تطبيق كل شيء تتعلمه في العمل. لذلك ، فأنت بحاجة إلى مشروع تخرج ستحاول فيه تطبيق معارف جديدة.

لا توجد موضوعات متعلقة بتحليل البيانات وتعلم الآلة في الخطة. هذا ينطبق أكثر على مهنة عالم البيانات. لا توجد أيضًا موضوعات متعلقة بسحابة AWS ، Azure. هذه المواضيع تعتمد بشكل كبير على اختيار النظام الأساسي.

أسئلة للمجتمع:
ما مدى ملاءمة خطة التسوية الخاصة بي؟ ما الذي يجب إزالته أو إضافته؟
ما المشروع الذي تنصح به كأطروحة؟

المصدر: www.habr.com

إضافة تعليق