به دلیل قرنطینه، اکنون بسیاری از زمان خود را در خانه می گذرانند و این زمان می تواند و حتی باید مفید باشد.
در ابتدای قرنطینه تصمیم گرفتم پروژه هایی را که از چند ماه پیش شروع کرده بودم به پایان برسانم. یکی از این پروژه ها دوره ویدیویی “زبان R برای کاربران اکسل” بود. با این دوره، من می خواستم مانع ورود به R را کاهش دهم و کمی کمبود موجود در مواد آموزشی در مورد این موضوع به زبان روسی را پر کنم.
اگر همه کارها با دادهها در شرکتی که در آن کار میکنید هنوز در اکسل انجام میشود، پیشنهاد میکنم با ابزار مدرنتر و در عین حال کاملا رایگان آنالیز دادهها آشنا شوید.
مقدار
اگر به تجزیه و تحلیل داده ها علاقه دارید، ممکن است به من علاقه مند شوید تلگراف и یوتیوب کانال ها بیشتر مطالب به زبان R اختصاص داده شده است.
این دوره حول محور معماری طراحی شده است tidyverseو بسته های موجود در آن: readr, vroom, dplyr, tidyr, ggplot2. البته پکیج های خوب دیگری نیز در R وجود دارند که مثلاً عملیات مشابهی را انجام می دهند data.table، اما نحو tidyverse شهودی، آسان برای خواندن حتی برای یک کاربر آموزش ندیده، بنابراین فکر می کنم بهتر است یادگیری زبان R را با tidyverse.
این دوره شما را در تمام عملیات تجزیه و تحلیل داده ها، از بارگذاری تا تجسم نتیجه نهایی، راهنمایی می کند.
چرا R و نه پایتون؟ از آنجایی که R یک زبان کاربردی است، برای کاربران اکسل راحت تر به آن سوئیچ می کنند، زیرا نیازی به کاوش در برنامه نویسی شی گرا سنتی نیست.
در حال حاضر 12 درس تصویری برنامه ریزی شده است که هر کدام از 5 تا 20 دقیقه طول می کشد.
دروس به تدریج باز خواهد شد. هر دوشنبه من دسترسی به یک درس جدید را در وب سایت خود باز خواهم کرد. کانال یوتیوب در یک لیست پخش جداگانه
این دوره برای چه کسانی است؟
من فکر می کنم این از عنوان مشخص است، با این حال، من آن را با جزئیات بیشتر توضیح خواهم داد.
این دوره برای کسانی است که به طور فعال از مایکروسافت اکسل در کار خود استفاده می کنند و تمام کارهای خود را با داده ها در آنجا پیاده سازی می کنند. به طور کلی، اگر برنامه مایکروسافت اکسل را حداقل یک بار در هفته باز کنید، دوره برای شما مناسب است.
برای تکمیل دوره نیازی به داشتن مهارت های برنامه نویسی نیست، زیرا ... این دوره برای مبتدیان در نظر گرفته شده است.
اما، شاید با شروع از درس 4، مطالب جالبی برای کاربران فعال R نیز وجود داشته باشد، زیرا ... عملکرد اصلی چنین بسته هایی مانند dplyr и tidyr با جزئیات مورد بحث قرار خواهد گرفت.
توضیحات:
این درس به شما کمک می کند تا بفهمید چه ساختارهای داده ای در زبان R موجود است. ما به طور مفصل به بردارها، فریم های تاریخ و لیست ها نگاه خواهیم کرد. بیایید یاد بگیریم که چگونه آنها را ایجاد کنیم و به عناصر جداگانه آنها دسترسی پیدا کنیم.
درس 3: خواندن داده ها از فایل های TSV، CSV، Excel و Google Sheets
توضیحات:
کار با داده ها، صرف نظر از ابزار، با استخراج آن آغاز می شود. در طول درس از پکیج ها استفاده می شود vroom, readxl, googlesheets4 برای بارگذاری داده ها در محیط R از فایل های csv، tsv، Excel و Google Sheets.
درس 4: فیلتر کردن ردیف ها، انتخاب و تغییر نام ستون ها، خطوط لوله در R
توضیحات:
در این ویدیو آشنایی خود را با کتابخانه ادامه می دهیم tidyverse و بسته بندی dplyr.
بیایید به خانواده توابع نگاه کنیم mutate()و ما یاد خواهیم گرفت که چگونه از آنها برای اضافه کردن ستون های محاسبه شده جدید به جدول استفاده کنیم.
توضیحات:
این درس به یکی از عملیات اصلی تجزیه و تحلیل، گروه بندی و تجمیع داده ها اختصاص دارد. در طول درس از پکیج استفاده خواهیم کرد dplyr و توابع group_by() и summarise().
ما کل خانواده توابع را بررسی خواهیم کرد summarise()، یعنی summarise(), summarise_if() и summarise_at().
توضیحات:
توابع پنجره از نظر معنی مشابه توابع جمعآوری هستند؛ آنها همچنین آرایهای از مقادیر را به عنوان ورودی میگیرند و عملیات حسابی روی آنها انجام میدهند، اما تعداد ردیفها را در نتیجه خروجی تغییر نمیدهند.
در این آموزش به مطالعه پکیج ادامه می دهیم dplyr، و توابع group_by(), mutate()، و همچنین جدید cumsum(), lag(), lead() и arrange().
توضیحات:
اکثر کاربران اکسل از جداول محوری استفاده می کنند؛ این ابزار مناسبی است که با آن می توانید مجموعه ای از داده های خام را در عرض چند ثانیه به گزارش های قابل خواندن تبدیل کنید.
در این آموزش نحوه چرخش جداول در R و تبدیل آنها از فرمت گسترده به طولانی و بالعکس را بررسی خواهیم کرد.
بیشتر درس به پکیج اختصاص دارد tidyr و توابع pivot_longer() и pivot_wider().
درس 10: بارگیری فایل های JSON در R و تبدیل لیست ها به جداول
توضیحات:
JSON و XML فرمت های بسیار محبوبی برای ذخیره و تبادل اطلاعات هستند که معمولاً به دلیل فشرده بودن آنهاست.
اما تجزیه و تحلیل داده های ارائه شده در چنین قالب هایی دشوار است، بنابراین قبل از تجزیه و تحلیل، لازم است آنها را به شکل جدولی بیاوریم، که دقیقاً همان چیزی است که در این ویدیو خواهیم آموخت.
درس به پکیج اختصاص دارد tidyr، در هسته کتابخانه گنجانده شده است tidyverse، و توابع unnest_longer(), unnest_wider() и hoist().
توضیحات:
این درس قدرت کامل بسته را نشان می دهد ggplot2 و گرامر ساختن نمودارها در لایه های تعبیه شده در آن.
ما هندسه های اصلی موجود در بسته را تجزیه و تحلیل خواهیم کرد و نحوه اعمال لایه ها برای ساخت یک نمودار را یاد خواهیم گرفت.
نتیجه
من سعی کردم تا حد امکان مختصر به شکل گیری برنامه دوره نزدیک شوم تا فقط لازم ترین اطلاعاتی را که برای برداشتن اولین گام ها در یادگیری ابزار تجزیه و تحلیل داده قدرتمندی مانند زبان R به آنها نیاز دارید برجسته کنم.
این دوره راهنمای جامعی برای تجزیه و تحلیل داده ها با استفاده از زبان R نیست، اما به شما کمک می کند تا تمام تکنیک های لازم برای این کار را درک کنید.
در حالی که برنامه دوره برای 12 هفته طراحی شده است، هر هفته دوشنبه ها دسترسی به درس های جدید را باز خواهم کرد، بنابراین توصیه می کنم اشتراک در در کانال یوتیوب تا انتشار یک درس جدید را از دست ندهید.