وفقًا لـ Statista، بحلول عام 2025، سينمو حجم سوق البيانات الضخمة إلى 175 زيتابايت مقارنة بـ 41 في عام 2019 (
مقدمة
ما هو مهندس البيانات؟ هذا هو الشخص المسؤول عن إنشاء وصيانة بنية البيانات في مشروع علوم البيانات. قد تشمل المسؤوليات ضمان التدفق السلس للبيانات بين الخادم والتطبيق، ودمج برامج إدارة البيانات الجديدة، وتحسين عمليات البيانات الأساسية، وإنشاء خطوط أنابيب البيانات.
هناك عدد كبير من التقنيات والأدوات التي يجب على مهندس البيانات إتقانها للعمل مع الحوسبة السحابية ومستودعات البيانات وETL (الاستخراج والتحويل والتحميل) وما إلى ذلك. علاوة على ذلك، فإن عدد المهارات المطلوبة يتزايد باستمرار، لذلك يحتاج مهندس البيانات إلى تجديد معارفه المعرفية بانتظام. تتضمن قائمتنا دورات للمبتدئين والمهنيين ذوي الخبرة. اختر ما يناسبك.
1. شهادة درجة النانو في هندسة البيانات (
سوف تتعلم كيفية تصميم نماذج البيانات، وإنشاء مستودعات البيانات وبحيرات البيانات، وأتمتة خطوط أنابيب البيانات، والعمل مع صفائف مجموعات البيانات. في نهاية البرنامج، ستختبر مهاراتك الجديدة من خلال إكمال مشروع التخرج.
مدة: 5 أشهر، 5 ساعات في الأسبوع
لغة: إنجليزي
السعر: $ شنومكس
مستوى: أولي
2. احصل على شهادة مهندس بيانات (
يعلمون من الأساسيات. يمكنك التقدم خطوة بخطوة، باستخدام المحاضرات والمشاريع العملية للعمل على مهاراتك. بحلول نهاية التدريب، ستكون جاهزًا للعمل مع تعلم الآلة والبيانات الضخمة. يوصى بمعرفة لغة بايثون على الأقل بالحد الأدنى.
مدة: 8 أشهر، 10 ساعات في الأسبوع
لغة: إنجليزي
السعر؟؟؟؟
مستوى: أولي
3. كن مهندس بيانات: إتقان المفاهيم (
سوف تقوم بتطوير مهارات هندسة البيانات وDevOps، وتتعلم كيفية إنشاء تطبيقات البيانات الضخمة، وإنشاء خطوط أنابيب البيانات، ومعالجة التطبيقات في الوقت الفعلي باستخدام Hazelcast وقاعدة البيانات.
مدة: يعتمد عليك
لغة: إنجليزي
السعر: الشهر الأول - مجانا
مستوى: أولي
4. دورات هندسة البيانات (
فيما يلي سلسلة من البرامج التي تعرّفك على هندسة البيانات وتعلمك كيفية تطوير الحلول التحليلية. يتم تقسيم الدورات إلى فئات بناءً على مستوى الصعوبة، بحيث يمكنك اختيار واحدة وفقًا لمستوى خبرتك. ستتعلم أثناء التدريب استخدام Spark وHadoop وAzure وإدارة بيانات الشركة.
مدة: يعتمد عليك
لغة: إنجليزي
السعر: يعتمد على الدورة المختارة
مستوى: مبتدئ متوسط متقدم
5. مهندس البيانات (
تستحق هذه الدورة الالتحاق بها إذا كانت لديك خبرة في لغة Python وترغب في تعميق معرفتك وبناء مهنة كعالم بيانات. سوف تتعلم كيفية بناء خطوط بيانات باستخدام Python وpandas، وتحميل مجموعات كبيرة من البيانات إلى قاعدة بيانات Postgres بعد التنظيف والتحويل والتحقق من صحتها.
مدة: يعتمد عليك
لغة: إنجليزي
السعر: يعتمد على نموذج الاشتراك
مستوى: مبتدئ، متوسط
6. هندسة البيانات باستخدام Google Cloud (
ستساعدك هذه الدورة على اكتساب المهارات التي تحتاجها لبناء مهنة في مجال البيانات الضخمة. على سبيل المثال، العمل مع BigQuery وSpark. ستكتسب المعرفة التي تحتاجها للتحضير للحصول على شهادة Google Cloud Professional Data Engineer المعترف بها في المجال.
مدة: 4 اشهر
لغة: إنجليزي
السعر: مجاني في الوقت الراهن
مستوى: مبتدئ، متوسط
7. هندسة البيانات، البيانات الضخمة على Google Cloud Platform (
دورة مثيرة للاهتمام توفر المعرفة العملية بأنظمة معالجة البيانات في برنامج GCP. خلال الدورة، سوف تتعلم كيفية تصميم الأنظمة قبل البدء في عملية التطوير. بالإضافة إلى ذلك، ستقوم أيضًا بتحليل كل من البيانات المنظمة وغير المنظمة، وتطبيق القياس التلقائي، وتطبيق تقنيات تعلم الآلة لاستخراج المعلومات.
مدة: 3 اشهر
لغة: إنجليزي
السعر: مجاني في الوقت الراهن
مستوى: مبتدئ، متوسط
8. جامعة كاليفورنيا في سان دييغو: تخصص البيانات الضخمة (
تعتمد الدورة على استخدام إطار عمل Hadoop وSpark وتطبيق تقنيات البيانات الضخمة هذه على عملية تعلم الآلة. ستتعلم أساسيات استخدام Hadoop مع MapReduce وSpark وPig وHive. تعرف على كيفية إنشاء نماذج تنبؤية واستخدام تحليلات الرسم البياني لنمذجة المشكلات. يرجى ملاحظة أن هذه الدورة لا تتطلب أي خبرة في البرمجة.
مدة: 8 أشهر 10 ساعات في الأسبوع
لغة: إنجليزي
السعر: مجاني في الوقت الراهن
مستوى: أولي
9. ترويض البيانات الضخمة باستخدام Apache Spark وPython (
ستتعلم كيفية استخدام بنية الدفق وإطارات البيانات في Spark3، وستكتسب فهمًا لكيفية استخدام خدمة Elastic MapReduce من Amazon للعمل مع مجموعة Hadoop الخاصة بك. تعلم كيفية تحديد المشكلات في تحليل البيانات الضخمة وفهم كيفية عمل مكتبات GraphX مع تحليل الشبكة وكيف يمكنك استخدام MLlib.
مدة: يعتمد عليك
لغة: إنجليزي
السعر: من 800 روبل إلى 149,99 دولارًا (حسب حظك)
مستوى: مبتدئ، متوسط
10. برنامج PG في هندسة البيانات الضخمة (
ستمنحك هذه الدورة فهمًا لكيفية عمل Aadhaar، وكيف يقوم Facebook بتخصيص موجز الأخبار، وكيف يمكن استخدام هندسة البيانات بشكل عام. ستكون المواضيع الرئيسية هي معالجة البيانات (بما في ذلك المعالجة في الوقت الفعلي)، وMapReduce، وتحليلات البيانات الضخمة.
مدة: 11 شهر
لغة: إنجليزي
السعر: حوالي 3000 دولار
مستوى: أولي
11. عالم بيانات المهنة (
سوف تتعلم البرمجة بلغة بايثون، وتدرس أطر تدريب الشبكات العصبية Tensorflow وKeras. أتقن قواعد بيانات MongoDB وPostgreSQL وSQLite3 وتعلم كيفية العمل مع مكتبات Pandas وNumPy وMatpotlib.
مدة: 300 ساعة تدريبية
لغة: الروسية
السعر: أول ستة أشهر مجانا، ثم 3900 روبل شهريا
مستوى: أولي
12. مهندس البيانات 7.0 (
سوف تتلقى دراسة متعمقة لهندسة Kafka وHDFS وClickHouse وSpark وAirflow وهندسة lambda وهندسة kappa. سوف تتعلم كيفية ربط الأدوات ببعضها البعض، وتشكيل خطوط الأنابيب، والحصول على حل أساسي. للدراسة، مطلوب الحد الأدنى من المعرفة ببايثون 3.
مدة: 21 درسًا، 7 أسابيع
لغة: الروسية
السعر: من 60 إلى 000 روبل
مستوى: أولي
إذا كنت ترغب في إضافة دورة جيدة أخرى إلى القائمة، يمكنك إلغاء الاشتراك في التعليقات أو في رسالة خاصة. سنقوم بتحديث المنشور.
ماذا يمكنك أن تقرأ في المدونة؟
→
→
→
→
→
اشترك في موقعنا
المصدر: www.habr.com