زبان R برای کاربران اکسل (دوره ویدیویی رایگان)

به دلیل قرنطینه، اکنون بسیاری از زمان خود را در خانه می گذرانند و این زمان می تواند و حتی باید مفید باشد.

در ابتدای قرنطینه تصمیم گرفتم پروژه هایی را که از چند ماه پیش شروع کرده بودم به پایان برسانم. یکی از این پروژه ها دوره ویدیویی “زبان R برای کاربران اکسل” بود. با این دوره، من می خواستم مانع ورود به R را کاهش دهم و کمی کمبود موجود در مواد آموزشی در مورد این موضوع به زبان روسی را پر کنم.

اگر همه کارها با داده‌ها در شرکتی که در آن کار می‌کنید هنوز در اکسل انجام می‌شود، پیشنهاد می‌کنم با ابزار مدرن‌تر و در عین حال کاملا رایگان آنالیز داده‌ها آشنا شوید.

زبان R برای کاربران اکسل (دوره ویدیویی رایگان)

مقدار

اگر به تجزیه و تحلیل داده ها علاقه دارید، ممکن است به من علاقه مند شوید تلگراف и یوتیوب کانال ها بیشتر مطالب به زبان R اختصاص داده شده است.

  1. مراجع
  2. در مورد دوره
  3. این دوره برای چه کسانی است؟
  4. برنامه دوره
    4.1. درس 1: نصب زبان R و محیط توسعه RStudio
    4.2. درس 2: ساختارهای داده پایه در R
    4.3. درس 3: خواندن داده ها از فایل های TSV، CSV، Excel و Google Sheets
    4.4. درس 4: فیلتر کردن ردیف ها، انتخاب و تغییر نام ستون ها، خطوط لوله در R
    4.5. درس 5: اضافه کردن ستون های محاسبه شده به جدول در R
    4.6. درس 6: گروه بندی و تجمیع داده ها در R
    4.7. درس 7: اتصال عمودی و افقی جداول در R
    4.8. درس 8: توابع پنجره در R
    4.9. درس 9: میزهای چرخشی یا آنالوگ جداول محوری در R
    4.10. درس 10: بارگیری فایل های JSON در R و تبدیل لیست ها به جداول
    4.11. درس 11: ترسیم سریع با استفاده از تابع ()qplot
    4.12. درس 12: رسم طرح لایه به لایه با استفاده از بسته ggplot2
  5. نتیجه

مراجع

در مورد دوره

این دوره حول محور معماری طراحی شده است tidyverseو بسته های موجود در آن: readr, vroom, dplyr, tidyr, ggplot2. البته پکیج های خوب دیگری نیز در R وجود دارند که مثلاً عملیات مشابهی را انجام می دهند data.table، اما نحو tidyverse شهودی، آسان برای خواندن حتی برای یک کاربر آموزش ندیده، بنابراین فکر می کنم بهتر است یادگیری زبان R را با tidyverse.

این دوره شما را در تمام عملیات تجزیه و تحلیل داده ها، از بارگذاری تا تجسم نتیجه نهایی، راهنمایی می کند.

چرا R و نه پایتون؟ از آنجایی که R یک زبان کاربردی است، برای کاربران اکسل راحت تر به آن سوئیچ می کنند، زیرا نیازی به کاوش در برنامه نویسی شی گرا سنتی نیست.

در حال حاضر 12 درس تصویری برنامه ریزی شده است که هر کدام از 5 تا 20 دقیقه طول می کشد.

دروس به تدریج باز خواهد شد. هر دوشنبه من دسترسی به یک درس جدید را در وب سایت خود باز خواهم کرد. کانال یوتیوب در یک لیست پخش جداگانه

این دوره برای چه کسانی است؟

من فکر می کنم این از عنوان مشخص است، با این حال، من آن را با جزئیات بیشتر توضیح خواهم داد.

این دوره برای کسانی است که به طور فعال از مایکروسافت اکسل در کار خود استفاده می کنند و تمام کارهای خود را با داده ها در آنجا پیاده سازی می کنند. به طور کلی، اگر برنامه مایکروسافت اکسل را حداقل یک بار در هفته باز کنید، دوره برای شما مناسب است.

برای تکمیل دوره نیازی به داشتن مهارت های برنامه نویسی نیست، زیرا ... این دوره برای مبتدیان در نظر گرفته شده است.

اما، شاید با شروع از درس 4، مطالب جالبی برای کاربران فعال R نیز وجود داشته باشد، زیرا ... عملکرد اصلی چنین بسته هایی مانند dplyr и tidyr با جزئیات مورد بحث قرار خواهد گرفت.

برنامه دوره

درس 1: نصب زبان R و محیط توسعه RStudio

تاریخ انتشار: مارس 23 2020

لینک ها:

ویدئو:

توضیحات:
یک درس مقدماتی که طی آن نرم افزارهای لازم را دانلود و نصب می کنیم و به طور خلاصه به بررسی قابلیت ها و رابط محیط توسعه RStudio می پردازیم.

درس 2: ساختارهای داده پایه در R

تاریخ انتشار: مارس 30 2020

لینک ها:

ویدئو:

توضیحات:
این درس به شما کمک می کند تا بفهمید چه ساختارهای داده ای در زبان R موجود است. ما به طور مفصل به بردارها، فریم های تاریخ و لیست ها نگاه خواهیم کرد. بیایید یاد بگیریم که چگونه آنها را ایجاد کنیم و به عناصر جداگانه آنها دسترسی پیدا کنیم.

درس 3: خواندن داده ها از فایل های TSV، CSV، Excel و Google Sheets

تاریخ انتشار: 6 آوریل 2020

لینک ها:

ویدئو:

توضیحات:
کار با داده ها، صرف نظر از ابزار، با استخراج آن آغاز می شود. در طول درس از پکیج ها استفاده می شود vroom, readxl, googlesheets4 برای بارگذاری داده ها در محیط R از فایل های csv، tsv، Excel و Google Sheets.

درس 4: فیلتر کردن ردیف ها، انتخاب و تغییر نام ستون ها، خطوط لوله در R

تاریخ انتشار: 13 آوریل 2020

لینک ها:

ویدئو:

توضیحات:
این درس در مورد بسته است dplyr. در آن نحوه فیلتر کردن دیتافریم ها، انتخاب ستون های لازم و تغییر نام آنها را خواهیم فهمید.

همچنین خواهیم آموخت که خطوط لوله چیست و چگونه به خوانایی بیشتر کد R شما کمک می کنند.

درس 5: اضافه کردن ستون های محاسبه شده به جدول در R

تاریخ انتشار: 20 آوریل 2020

لینک ها:

ویدئو:

توضیحات:
در این ویدیو آشنایی خود را با کتابخانه ادامه می دهیم tidyverse و بسته بندی dplyr.
بیایید به خانواده توابع نگاه کنیم mutate()و ما یاد خواهیم گرفت که چگونه از آنها برای اضافه کردن ستون های محاسبه شده جدید به جدول استفاده کنیم.

درس 6: گروه بندی و تجمیع داده ها در R

تاریخ انتشار: 27 آوریل 2020

لینک ها:

ویدئو:

توضیحات:
این درس به یکی از عملیات اصلی تجزیه و تحلیل، گروه بندی و تجمیع داده ها اختصاص دارد. در طول درس از پکیج استفاده خواهیم کرد dplyr و توابع group_by() и summarise().

ما کل خانواده توابع را بررسی خواهیم کرد summarise()، یعنی summarise(), summarise_if() и summarise_at().

درس 7: اتصال عمودی و افقی جداول در R

تاریخ انتشار: مه 4 2020

لینک ها:

ویدئو:

توضیحات:
این درس به شما کمک می کند تا عملیات اتصال عمودی و افقی جداول را درک کنید.

یک اتحادیه عمودی معادل عملیات UNION در زبان پرس و جو SQL است.

اتصال افقی به لطف تابع VLOOKUP برای کاربران اکسل بهتر شناخته شده است؛ در SQL، چنین عملیاتی توسط عملگر JOIN انجام می شود.

در طول درس یک مسئله عملی را حل خواهیم کرد که در طی آن از بسته ها استفاده خواهیم کرد dplyr, readxl, tidyr и stringr.

توابع اصلی که در نظر خواهیم گرفت:

  • bind_rows() - اتصال عمودی جداول
  • left_join() - اتصال افقی جداول
  • semi_join() - از جمله پیوستن به جداول
  • anti_join() - پیوستن به جدول منحصر به فرد

درس 8: توابع پنجره در R

تاریخ انتشار: مه 11 2020

لینک ها:

توضیحات:
توابع پنجره از نظر معنی مشابه توابع جمع‌آوری هستند؛ آنها همچنین آرایه‌ای از مقادیر را به عنوان ورودی می‌گیرند و عملیات حسابی روی آن‌ها انجام می‌دهند، اما تعداد ردیف‌ها را در نتیجه خروجی تغییر نمی‌دهند.

در این آموزش به مطالعه پکیج ادامه می دهیم dplyr، و توابع group_by(), mutate()، و همچنین جدید cumsum(), lag(), lead() и arrange().

درس 9: میزهای چرخشی یا آنالوگ جداول محوری در R

تاریخ انتشار: مه 18 2020

لینک ها:

توضیحات:
اکثر کاربران اکسل از جداول محوری استفاده می کنند؛ این ابزار مناسبی است که با آن می توانید مجموعه ای از داده های خام را در عرض چند ثانیه به گزارش های قابل خواندن تبدیل کنید.

در این آموزش نحوه چرخش جداول در R و تبدیل آنها از فرمت گسترده به طولانی و بالعکس را بررسی خواهیم کرد.

بیشتر درس به پکیج اختصاص دارد tidyr و توابع pivot_longer() и pivot_wider().

درس 10: بارگیری فایل های JSON در R و تبدیل لیست ها به جداول

تاریخ انتشار: مه 25 2020

لینک ها:

توضیحات:
JSON و XML فرمت های بسیار محبوبی برای ذخیره و تبادل اطلاعات هستند که معمولاً به دلیل فشرده بودن آنهاست.

اما تجزیه و تحلیل داده های ارائه شده در چنین قالب هایی دشوار است، بنابراین قبل از تجزیه و تحلیل، لازم است آنها را به شکل جدولی بیاوریم، که دقیقاً همان چیزی است که در این ویدیو خواهیم آموخت.

درس به پکیج اختصاص دارد tidyr، در هسته کتابخانه گنجانده شده است tidyverse، و توابع unnest_longer(), unnest_wider() и hoist().

درس 11: ترسیم سریع با استفاده از تابع ()qplot

تاریخ انتشار: ژوئن 1 2020

لینک ها:

توضیحات:
بسته بندی ggplot2 یکی از محبوب ترین ابزارهای تجسم داده ها نه تنها در R.

در این درس می آموزیم که چگونه با استفاده از تابع، نمودارهای ساده بسازیم qplot()و بیایید تمام استدلال های او را تجزیه و تحلیل کنیم.

درس 12: رسم طرح لایه به لایه با استفاده از بسته ggplot2

تاریخ انتشار: ژوئن 8 2020

لینک ها:

توضیحات:
این درس قدرت کامل بسته را نشان می دهد ggplot2 و گرامر ساختن نمودارها در لایه های تعبیه شده در آن.

ما هندسه های اصلی موجود در بسته را تجزیه و تحلیل خواهیم کرد و نحوه اعمال لایه ها برای ساخت یک نمودار را یاد خواهیم گرفت.

نتیجه

من سعی کردم تا حد امکان مختصر به شکل گیری برنامه دوره نزدیک شوم تا فقط لازم ترین اطلاعاتی را که برای برداشتن اولین گام ها در یادگیری ابزار تجزیه و تحلیل داده قدرتمندی مانند زبان R به آنها نیاز دارید برجسته کنم.

این دوره راهنمای جامعی برای تجزیه و تحلیل داده ها با استفاده از زبان R نیست، اما به شما کمک می کند تا تمام تکنیک های لازم برای این کار را درک کنید.

در حالی که برنامه دوره برای 12 هفته طراحی شده است، هر هفته دوشنبه ها دسترسی به درس های جدید را باز خواهم کرد، بنابراین توصیه می کنم اشتراک در در کانال یوتیوب تا انتشار یک درس جدید را از دست ندهید.

منبع: www.habr.com

اضافه کردن نظر