لغة R لمستخدمي Excel (دورة فيديو مجانية)

بسبب الحجر الصحي، يقضي الكثيرون الآن نصيب الأسد من وقتهم في المنزل، ويمكن، بل وينبغي، قضاء هذه المرة بشكل مفيد.

في بداية الحجر الصحي، قررت إنهاء بعض المشاريع التي بدأتها منذ بضعة أشهر. أحد هذه المشاريع كان دورة الفيديو "لغة R لمستخدمي Excel". من خلال هذه الدورة، أردت تقليل حاجز الدخول إلى لغة R، وسد النقص الموجود في المواد التدريبية حول هذا الموضوع باللغة الروسية قليلاً.

إذا كان كل العمل مع البيانات في الشركة التي تعمل بها لا يزال يتم في Excel، فأنا أقترح عليك التعرف على أداة تحليل بيانات أكثر حداثة، وفي نفس الوقت مجانية تمامًا.

لغة R لمستخدمي Excel (دورة فيديو مجانية)

محتوى

إذا كنت مهتمًا بتحليل البيانات ، فقد تكون مهتمًا ببرنامجي تيليجرام и موقع YouTube القنوات. معظم محتوياته مخصص للغة R.

  1. مراجع
  2. عن الدورة
  3. لمن هذه الدورة؟
  4. برنامج الدورة
    4.1 الدرس الأول: تثبيت لغة R وبيئة تطوير RStudio
    4.2 الدرس الثاني: هياكل البيانات الأساسية في لغة R
    4.3 الدرس 3: قراءة البيانات من ملفات TSV وCSV وExcel وجداول بيانات Google
    4.4 الدرس 4: تصفية الصفوف واختيار وإعادة تسمية الأعمدة وخطوط الأنابيب في R
    4.5 الدرس 5: إضافة الأعمدة المحسوبة إلى جدول في R
    4.6 الدرس السادس: تجميع البيانات وتجميعها في R
    4.7 الدرس السابع: الربط الرأسي والأفقي للجداول في لغة R
    4.8 الدرس 8: وظائف النافذة في R
    4.9 الدرس التاسع: الجداول الدوارة أو ما يماثلها من الجداول المحورية في لغة R
    4.10 الدرس 10: تحميل ملفات JSON في R وتحويل القوائم إلى جداول
    4.11 الدرس 11: التخطيط بسرعة باستخدام الدالة qplot()
    4.12 الدرس 12: رسم طبقة بطبقة باستخدام حزمة ggplot2
  5. اختتام

مراجع

عن الدورة

وتتمحور الدورة حول الهندسة المعمارية tidyverse، والحزم المتضمنة فيه: readr, vroom, dplyr, tidyr, ggplot2. بالطبع، هناك حزم أخرى جيدة في R تؤدي عمليات مماثلة، على سبيل المثال data.table، ولكن بناء الجملة tidyverse بديهية وسهلة القراءة حتى بالنسبة للمستخدم غير المدرب، لذلك أعتقد أنه من الأفضل البدء في تعلم لغة R بها tidyverse.

سترشدك الدورة خلال جميع عمليات تحليل البيانات، بدءًا من التحميل وحتى تصور النتيجة النهائية.

لماذا R وليس بايثون؟ نظرًا لأن R هي لغة وظيفية، فمن السهل على مستخدمي Excel التبديل إليها، لأنها لا حاجة للخوض في البرمجة التقليدية الموجهة للكائنات.

في الوقت الحالي، تم التخطيط لـ 12 درس فيديو، تتراوح مدة كل منها من 5 إلى 20 دقيقة.

سيتم فتح الدروس تدريجيا. سأفتح كل يوم اثنين إمكانية الوصول إلى درس جديد على موقع الويب الخاص بي. قناة يوتيوب في قائمة تشغيل منفصلة.

لمن هذه الدورة؟

أعتقد أن هذا واضح من العنوان، ولكن سأصفه بمزيد من التفصيل.

تستهدف الدورة أولئك الذين يستخدمون Microsoft Excel بنشاط في عملهم وينفذون جميع أعمالهم باستخدام البيانات الموجودة هناك. بشكل عام، إذا قمت بفتح تطبيق Microsoft Excel مرة واحدة على الأقل في الأسبوع، فإن الدورة مناسبة لك.

لا يشترط أن تكون لديك مهارات البرمجة لإكمال الدورة، لأن... الدورة تستهدف المبتدئين.

ولكن، ربما، بدءًا من الدرس 4، ستكون هناك مواد مثيرة للاهتمام لمستخدمي R النشطين أيضًا، لأن... الوظيفة الرئيسية لهذه الحزم مثل dplyr и tidyr سيتم مناقشتها بشيء من التفصيل.

برنامج الدورة

الدرس الأول: تثبيت لغة R وبيئة تطوير RStudio

تاريخ النشر: مسيرة 23 2020

المراجع:

فيديو:

الوصف:
درس تمهيدي سنقوم خلاله بتنزيل البرامج اللازمة وتثبيتها، ونفحص بإيجاز إمكانيات وواجهة بيئة تطوير RStudio.

الدرس الثاني: هياكل البيانات الأساسية في لغة R

تاريخ النشر: مسيرة 30 2020

المراجع:

فيديو:

الوصف:
سيساعدك هذا الدرس على فهم هياكل البيانات المتوفرة في لغة R. سننظر بالتفصيل في المتجهات وإطارات التاريخ والقوائم. دعونا نتعلم كيفية إنشائها والوصول إلى عناصرها الفردية.

الدرس 3: قراءة البيانات من ملفات TSV وCSV وExcel وجداول بيانات Google

تاريخ النشر: أبريل 6 2020

المراجع:

فيديو:

الوصف:
يبدأ العمل مع البيانات، بغض النظر عن الأداة، باستخراجها. يتم استخدام الحزم أثناء الدرس vroom, readxl, googlesheets4 لتحميل البيانات إلى بيئة R من ملفات csv وtsv وExcel وجداول بيانات Google.

الدرس 4: تصفية الصفوف واختيار وإعادة تسمية الأعمدة وخطوط الأنابيب في R

تاريخ النشر: أبريل 13 2020

المراجع:

فيديو:

الوصف:
هذا الدرس يدور حول الحزمة dplyr. سنكتشف فيه كيفية تصفية إطارات البيانات وتحديد الأعمدة الضرورية وإعادة تسميتها.

سوف نتعرف أيضًا على ماهية خطوط الأنابيب وكيف تساعد في جعل كود R الخاص بك أكثر قابلية للقراءة.

الدرس 5: إضافة الأعمدة المحسوبة إلى جدول في R

تاريخ النشر: أبريل 20 2020

المراجع:

فيديو:

الوصف:
في هذا الفيديو نواصل تعرفنا على المكتبة tidyverse والحزمة dplyr.
دعونا نلقي نظرة على عائلة الوظائف mutate()وسنتعلم كيفية استخدامها لإضافة أعمدة محسوبة جديدة إلى الجدول.

الدرس السادس: تجميع البيانات وتجميعها في R

تاريخ النشر: أبريل 27 2020

المراجع:

فيديو:

الوصف:
هذا الدرس مخصص لإحدى العمليات الرئيسية لتحليل البيانات وتجميعها وتجميعها. خلال الدرس سوف نستخدم الحزمة dplyr وظائف group_by() и summarise().

سننظر إلى عائلة الوظائف بأكملها summarise()أي summarise(), summarise_if() и summarise_at().

الدرس السابع: الربط الرأسي والأفقي للجداول في لغة R

تاريخ النشر: مايو 4 2020

المراجع:

فيديو:

الوصف:
سيساعدك هذا الدرس على فهم عمليات الربط الرأسي والأفقي للجداول.

الاتحاد العمودي يعادل عملية UNION في لغة استعلام SQL.

تعتبر الصلة الأفقية معروفة بشكل أفضل لمستخدمي Excel بفضل وظيفة VLOOKUP؛ في SQL، يتم تنفيذ هذه العمليات بواسطة عامل التشغيل JOIN.

خلال الدرس سوف نقوم بحل مشكلة عملية سنستخدم خلالها الحزم dplyr, readxl, tidyr и stringr.

الوظائف الرئيسية التي سننظر فيها:

  • bind_rows() - الانضمام الرأسي للجداول
  • left_join() - الربط الأفقي للجداول
  • semi_join() - بما في ذلك ربط الجداول
  • anti_join() - الانضمام إلى الجدول الحصري

الدرس 8: وظائف النافذة في R

تاريخ النشر: مايو 11 2020

المراجع:

الوصف:
تتشابه وظائف النافذة في المعنى مع وظائف التجميع، كما أنها تأخذ مجموعة من القيم كمدخلات وتجري عمليات حسابية عليها، ولكنها لا تغير عدد الصفوف في نتيجة الإخراج.

في هذا البرنامج التعليمي نواصل دراسة الحزمة dplyr، والوظائف group_by(), mutate()، وكذلك جديدة cumsum(), lag(), lead() и arrange().

الدرس التاسع: الجداول الدوارة أو ما يماثلها من الجداول المحورية في لغة R

تاريخ النشر: مايو 18 2020

المراجع:

الوصف:
يستخدم معظم مستخدمي برنامج Excel الجداول المحورية، وهي أداة ملائمة يمكنك من خلالها تحويل مجموعة من البيانات الأولية إلى تقارير قابلة للقراءة في غضون ثوانٍ.

سننظر في هذا البرنامج التعليمي في كيفية تدوير الجداول في لغة R، وتحويلها من التنسيق الواسع إلى التنسيق الطويل والعكس.

معظم الدرس مخصص للحزمة tidyr والوظائف pivot_longer() и pivot_wider().

الدرس 10: تحميل ملفات JSON في R وتحويل القوائم إلى جداول

تاريخ النشر: مايو 25 2020

المراجع:

الوصف:
يعد JSON وXML من التنسيقات الشائعة للغاية لتخزين المعلومات وتبادلها، وذلك عادةً بسبب صغر حجمها.

لكن من الصعب تحليل البيانات المقدمة بمثل هذه التنسيقات، لذا قبل التحليل من الضروري إدخالها في شكل جدول، وهو بالضبط ما سنتعلمه في هذا الفيديو.

الدرس مخصص للحزمة tidyr، المدرجة في قلب المكتبة tidyverse، والوظائف unnest_longer(), unnest_wider() и hoist().

الدرس 11: التخطيط بسرعة باستخدام الدالة qplot()

تاريخ النشر: 1 2020 يونيو

المراجع:

الوصف:
صفقة ggplot2 هي إحدى أدوات تصور البيانات الأكثر شيوعًا ليس فقط في R.

في هذا الدرس سوف نتعلم كيفية إنشاء رسوم بيانية بسيطة باستخدام الدالة qplot()، ودعونا نحلل جميع حججها.

الدرس 12: رسم طبقة بطبقة باستخدام حزمة ggplot2

تاريخ النشر: 8 2020 يونيو

المراجع:

الوصف:
يوضح الدرس القوة الكاملة للحزمة ggplot2 وقواعد بناء الرسوم البيانية في الطبقات المضمنة فيها.

سنقوم بتحليل الأشكال الهندسية الرئيسية الموجودة في الحزمة ونتعلم كيفية تطبيق الطبقات لإنشاء رسم بياني.

اختتام

لقد حاولت أن أتناول تكوين برنامج الدورة التدريبية بإيجاز قدر الإمكان، لتسليط الضوء فقط على المعلومات الأكثر أهمية التي ستحتاجها من أجل اتخاذ الخطوات الأولى في تعلم أداة تحليل البيانات القوية مثل لغة R.

الدورة ليست دليلاً شاملاً لتحليل البيانات باستخدام لغة R، ولكنها ستساعدك على فهم جميع التقنيات اللازمة لذلك.

بينما تم تصميم برنامج الدورة لمدة 12 أسبوعًا، سأفتح الوصول إلى دروس جديدة كل أسبوع في أيام الاثنين، لذلك أوصي الاشتراك على قناة اليوتيوب حتى لا يفوتك نشر الدرس الجديد.

المصدر: www.habr.com

إضافة تعليق