Excel භාවිතා කරන්නන් සඳහා R භාෂාව (නොමිලේ වීඩියෝ පාඨමාලාව)

නිරෝධායනය හේතුවෙන්, බොහෝ දෙනෙක් දැන් තම කාලයෙන් සිංහ කොටස නිවසේ ගත කරන අතර, මෙම කාලය ප්රයෝජනවත් ලෙස ගත කළ හැකිය.

නිරෝධායනය ආරම්භයේදී, මම මාස කිහිපයකට පෙර ආරම්භ කළ ව්‍යාපෘති කිහිපයක් අවසන් කිරීමට තීරණය කළෙමි. මෙම ව්‍යාපෘති වලින් එකක් වූයේ "එක්සෙල් පරිශීලකයින් සඳහා ආර් භාෂාව" වීඩියෝ පාඨමාලාවයි. මෙම පාඨමාලාව සමඟ, මම R වෙත ඇතුල් වීමට ඇති බාධකය අඩු කිරීමට අවශ්ය වූ අතර, රුසියානු භාෂාවෙන් මෙම මාතෘකාව පිළිබඳ පුහුණු ද්රව්යවල පවතින හිඟය තරමක් පිරවීම.

ඔබ සේවය කරන ආයතනයේ දත්ත සමඟ සියලු වැඩ තවමත් Excel හි සිදු කරන්නේ නම්, වඩාත් නවීන සහ ඒ සමඟම සම්පූර්ණයෙන්ම නොමිලේ දත්ත විශ්ලේෂණ මෙවලමක් සමඟ දැන හඳුනා ගැනීමට මම යෝජනා කරමි.

Excel භාවිතා කරන්නන් සඳහා R භාෂාව (නොමිලේ වීඩියෝ පාඨමාලාව)

අන්තර්ගතය

ඔබ දත්ත විශ්ලේෂණයට කැමති නම්, ඔබ මගේ ගැන උනන්දු විය හැකිය ටෙලිග්රාෆ් и ප්රථම අදියර නාලිකා. බොහෝ අන්තර්ගතයන් R භාෂාව සඳහා කැප කර ඇත.

  1. යොමු
  2. පාඨමාලාව ගැන
  3. මෙම පාඨමාලාව කා සඳහාද?
  4. පාඨමාලා වැඩසටහන
    4.1. පාඩම 1: R භාෂාව සහ RStudio සංවර්ධන පරිසරය ස්ථාපනය කිරීම
    4.2. පාඩම 2: R හි මූලික දත්ත ව්‍යුහයන්
    4.3. පාඩම 3: TSV, CSV, Excel ගොනු සහ Google Sheets වෙතින් දත්ත කියවීම
    4.4. පාඩම 4: පේළි පෙරීම, තීරු තේරීම සහ නැවත නම් කිරීම, R හි නල මාර්ග
    4.5. 5 වන පාඩම: R හි වගුවකට ගණනය කළ තීරු එකතු කිරීම
    4.6. පාඩම 6: R හි දත්ත සමූහගත කිරීම සහ එකතු කිරීම
    4.7. පාඩම 7: R හි වගු සිරස් සහ තිරස් සම්බන්ධ කිරීම
    4.8. පාඩම 8: R හි කවුළු කාර්යයන්
    4.9. පාඩම 9: R හි භ්‍රමණය වන වගු හෝ විවර්තන වගු වල ප්‍රතිසමයක්
    4.10. පාඩම 10: R හි JSON ගොනු පූරණය කිරීම සහ ලැයිස්තු වගු බවට පරිවර්තනය කිරීම
    4.11. පාඩම 11: qplot() ශ්‍රිතය භාවිතයෙන් ඉක්මනින් සැලසුම් කිරීම
    4.12. පාඩම 12: ggplot2 පැකේජය භාවිතා කරමින් ස්ථරයෙන් බිම් කොටස් සැලසුම් කිරීම
  5. නිගමනය

යොමු

පාඨමාලාව ගැන

පාඨමාලාව ගෘහ නිර්මාණ ශිල්පය වටා ව්‍යුහගත කර ඇත tidyverse, සහ එහි අඩංගු පැකේජ: readr, vroom, dplyr, tidyr, ggplot2. ඇත්ත වශයෙන්ම, R හි සමාන මෙහෙයුම් සිදු කරන වෙනත් හොඳ පැකේජ තිබේ, උදාහරණයක් ලෙස data.table, නමුත් වාක්‍ය ඛණ්ඩය tidyverse බුද්ධිමය, නුපුහුණු පරිශීලකයෙකුට පවා කියවීමට පහසුය, එබැවින් R භාෂාව ඉගෙනීම ආරම්භ කිරීම වඩා හොඳ යැයි මම සිතමි tidyverse.

පූරණය කිරීමේ සිට නිමි ප්‍රතිඵලය දෘශ්‍යමාන කිරීම දක්වා සියලුම දත්ත විශ්ලේෂණ මෙහෙයුම් හරහා පාඨමාලාව ඔබට මග පෙන්වනු ඇත.

R සහ Python නොවන්නේ ඇයි? R යනු ක්‍රියාකාරී භාෂාවක් නිසා, Excel භාවිතා කරන්නන්ට එයට මාරුවීම පහසු වේ, මන්ද සාම්ප්‍රදායික වස්තු-නැඹුරු ක්‍රමලේඛනය ගැන සොයා බැලීම අවශ්‍ය නොවේ.

මේ මොහොතේ, වීඩියෝ පාඩම් 12 ක් සැලසුම් කර ඇති අතර, ඒවා විනාඩි 5 සිට 20 දක්වා පවතී.

පාඩම් ටිකෙන් ටික විවෘත වනු ඇත. සෑම සඳුදා දිනකම මම මගේ වෙබ් අඩවියේ නව පාඩමකට ප්‍රවේශය විවෘත කරමි. YouTube නාලිකාව වෙනම ධාවන ලැයිස්තුවක.

මෙම පාඨමාලාව කා සඳහාද?

මාතෘකාවෙන් මෙය පැහැදිලි යැයි මම සිතමි, කෙසේ වෙතත්, මම එය වඩාත් විස්තරාත්මකව විස්තර කරමි.

මෙම පාඨමාලාව ඉලක්ක කර ඇත්තේ මයික්‍රොසොෆ්ට් එක්සෙල් තම කාර්යයේදී සක්‍රියව භාවිතා කරන සහ එහි දත්ත සමඟ ඔවුන්ගේ සියලු වැඩ ක්‍රියාත්මක කරන අයයි. සාමාන්යයෙන්, ඔබ අවම වශයෙන් සතියකට වරක් Microsoft Excel යෙදුම විවෘත කරන්නේ නම්, පාඨමාලාව ඔබට සුදුසු වේ.

පාඨමාලාව සම්පූර්ණ කිරීමට ඔබට ක්‍රමලේඛන කුසලතා අවශ්‍ය නොවේ, මන්ද... මෙම පාඨමාලාව ආරම්භකයින් සඳහා ඉලක්ක කර ඇත.

නමුත්, සමහර විට, 4 වන පාඩමෙන් පටන්ගෙන, සක්‍රීය R භාවිතා කරන්නන් සඳහා ද සිත්ගන්නා කරුණු ඇත, මන්ද ... වැනි පැකේජවල ප්රධාන ක්රියාකාරිත්වය dplyr и tidyr තරමක් විස්තරාත්මකව සාකච්ඡා කරනු ඇත.

පාඨමාලා වැඩසටහන

පාඩම 1: R භාෂාව සහ RStudio සංවර්ධන පරිසරය ස්ථාපනය කිරීම

ප්‍රකාශන දිනය: මාර්තු 23 2020

ආශ්රිත:

වීඩියෝ:

විස්තරය:
අපි අවශ්‍ය මෘදුකාංග බාගත කර ස්ථාපනය කරන හඳුන්වාදීමේ පාඩමක් සහ RStudio සංවර්ධන පරිසරයේ හැකියාවන් සහ අතුරු මුහුණත කෙටියෙන් විමසා බලමු.

පාඩම 2: R හි මූලික දත්ත ව්‍යුහයන්

ප්‍රකාශන දිනය: මාර්තු 30 2020

ආශ්රිත:

වීඩියෝ:

විස්තරය:
මෙම පාඩම R භාෂාවෙන් ලබා ගත හැකි දත්ත ව්‍යුහයන් මොනවාද යන්න තේරුම් ගැනීමට ඔබට උපකාරී වනු ඇත.අපි දෛශික, දින රාමු සහ ලැයිස්තු පිළිබඳව විස්තරාත්මකව බලමු. ඒවා නිර්මාණය කරන්නේ කෙසේද සහ ඒවායේ තනි අංග වෙත ප්‍රවේශ වන්නේ කෙසේදැයි ඉගෙන ගනිමු.

පාඩම 3: TSV, CSV, Excel ගොනු සහ Google Sheets වෙතින් දත්ත කියවීම

ප්‍රකාශන දිනය: අප්රේල් මස 6 2020

ආශ්රිත:

වීඩියෝ:

විස්තරය:
මෙවලම කුමක් වුවත් දත්ත සමඟ වැඩ කිරීම ආරම්භ වන්නේ එහි නිස්සාරණයෙනි. පාඩම අතරතුර පැකේජ භාවිතා වේ vroom, readxl, googlesheets4 csv, tsv, Excel ගොනු සහ Google Sheets වෙතින් R පරිසරයට දත්ත පැටවීම සඳහා.

පාඩම 4: පේළි පෙරීම, තීරු තේරීම සහ නැවත නම් කිරීම, R හි නල මාර්ග

ප්‍රකාශන දිනය: අප්රේල් මස 13 2020

ආශ්රිත:

වීඩියෝ:

විස්තරය:
මෙම පාඩම පැකේජය ගැන ය dplyr. එහි අපි දත්ත රාමු පෙරීම, අවශ්‍ය තීරු තෝරා ඒවා නැවත නම් කරන්නේ කෙසේදැයි සොයා බලමු.

නල මාර්ග යනු කුමක්ද සහ ඒවා ඔබේ R කේතය වඩාත් කියවිය හැකි බවට පත් කිරීමට උදවු කරන්නේ කෙසේද යන්න ද අපි ඉගෙන ගනිමු.

5 වන පාඩම: R හි වගුවකට ගණනය කළ තීරු එකතු කිරීම

ප්‍රකාශන දිනය: අප්රේල් මස 20 2020

ආශ්රිත:

වීඩියෝ:

විස්තරය:
මෙම වීඩියෝවෙන් අපි පුස්තකාලය සමඟ අපගේ දැන හඳුනා ගැනීම දිගටම කරගෙන යන්නෙමු tidyverse සහ පැකේජය dplyr.
අපි කාර්යයන් පවුල දෙස බලමු mutate(), සහ මේසයට නව ගණනය කළ තීරු එකතු කිරීමට ඒවා භාවිතා කරන්නේ කෙසේදැයි අපි ඉගෙන ගනිමු.

පාඩම 6: R හි දත්ත සමූහගත කිරීම සහ එකතු කිරීම

ප්‍රකාශන දිනය: අප්රේල් මස 27 2020

ආශ්රිත:

වීඩියෝ:

විස්තරය:
මෙම පාඩම දත්ත විශ්ලේෂණය, සමූහගත කිරීම සහ එකතු කිරීමේ ප්‍රධාන මෙහෙයුම් වලින් එකක් සඳහා කැප කෙරේ. පාඩම අතරතුර අපි පැකේජය භාවිතා කරමු dplyr සහ විශේෂාංග group_by() и summarise().

අපි මුළු පවුලම කාර්යයන් දෙස බලමු summarise(), i.e. summarise(), summarise_if() и summarise_at().

පාඩම 7: R හි වගු සිරස් සහ තිරස් සම්බන්ධ කිරීම

ප්‍රකාශන දිනය: 4 මැයි 2020

ආශ්රිත:

වීඩියෝ:

විස්තරය:
වගු වල සිරස් සහ තිරස් සම්බන්ධ කිරීමේ ක්‍රියාකාරකම් තේරුම් ගැනීමට මෙම පාඩම ඔබට උපකාරී වනු ඇත.

සිරස් එකමුතුවක් යනු SQL විමසුම් භාෂාවේ UNION මෙහෙයුමට සමාන වේ.

VLOOKUP ශ්‍රිතයට ස්තුති වන්නට Excel භාවිතා කරන්නන් විසින් තිරස් සම්බන්ධ කිරීම වඩාත් හොඳින් හඳුනයි; SQL හි, එවැනි මෙහෙයුම් සිදු කරනු ලබන්නේ JOIN ක්‍රියාකරු විසිනි.

පාඩම අතරතුර අපි පැකේජ භාවිතා කරන ප්‍රායෝගික ගැටළුවක් විසඳන්නෙමු dplyr, readxl, tidyr и stringr.

අපි සලකා බලනු ලබන ප්රධාන කාර්යයන්:

  • bind_rows() - වගු වල සිරස් සම්බන්ධ කිරීම
  • left_join() - වගු තිරස් සම්බන්ධ කිරීම
  • semi_join() - සම්බන්ධ කිරීමේ වගු ඇතුළුව
  • anti_join() - සුවිශේෂී වගු එකතු කිරීම

පාඩම 8: R හි කවුළු කාර්යයන්

ප්‍රකාශන දිනය: 11 මැයි 2020

ආශ්රිත:

විස්තරය:
ජනේල ශ්‍රිතයන් එක්රැස් කිරීමේ අර්ථයට සමාන වේ; ඒවා ආදානය ලෙස අගයන් මාලාවක් ගෙන ඒවා මත අංක ගණිතමය මෙහෙයුම් සිදු කරයි, නමුත් ප්‍රතිදාන ප්‍රතිඵලයේ පේළි ගණන වෙනස් නොකරන්න.

මෙම නිබන්ධනයේදී අපි පැකේජය දිගටම අධ්‍යයනය කරමු dplyr, සහ කාර්යයන් group_by(), mutate(), මෙන්ම නව cumsum(), lag(), lead() и arrange().

පාඩම 9: R හි භ්‍රමණය වන වගු හෝ විවර්තන වගු වල ප්‍රතිසමයක්

ප්‍රකාශන දිනය: 18 මැයි 2020

ආශ්රිත:

විස්තරය:
බොහෝ Excel භාවිතා කරන්නන් විවර්තන වගු භාවිතා කරයි; මෙය ඔබට අමු දත්ත මාලාවක් තත්පර කිහිපයකින් කියවිය හැකි වාර්තා බවට පත් කළ හැකි පහසු මෙවලමකි.

මෙම නිබන්ධනයේදී අපි R හි වගු කරකවන ආකාරය දෙස බලමු, ඒවා පුළුල් සිට දිගු ආකෘතියට සහ අනෙක් අතට පරිවර්තනය කරන්න.

බොහෝ පාඩම් පැකේජයට කැප කර ඇත tidyr සහ කාර්යයන් pivot_longer() и pivot_wider().

පාඩම 10: R හි JSON ගොනු පූරණය කිරීම සහ ලැයිස්තු වගු බවට පරිවර්තනය කිරීම

ප්‍රකාශන දිනය: 25 මැයි 2020

ආශ්රිත:

විස්තරය:
JSON සහ XML තොරතුරු ගබඩා කිරීම සහ හුවමාරු කිරීම සඳහා අතිශය ජනප්‍රිය ආකෘති වේ, සාමාන්‍යයෙන් ඒවායේ සංයුක්තතාවය නිසා.

නමුත් එවැනි ආකෘති වලින් ඉදිරිපත් කර ඇති දත්ත විශ්ලේෂණය කිරීම අපහසුය, එබැවින් විශ්ලේෂණයට පෙර එය වගු ආකෘතියකට ගෙන ඒම අවශ්ය වේ, එය හරියටම අපි මෙම වීඩියෝවෙන් ඉගෙන ගනු ඇත.

පාඩම පැකේජයට කැප කර ඇත tidyr, පුස්තකාලයේ හරයට ඇතුළත් කර ඇත tidyverse, සහ කාර්යයන් unnest_longer(), unnest_wider() и hoist().

පාඩම 11: qplot() ශ්‍රිතය භාවිතයෙන් ඉක්මනින් සැලසුම් කිරීම

ප්‍රකාශන දිනය: 1 2020 ජුනි

ආශ්රිත:

විස්තරය:
පැකේජය ggplot2 R හි පමණක් නොව වඩාත් ජනප්‍රිය දත්ත දෘශ්‍යකරණ මෙවලම් වලින් එකකි.

මෙම පාඩමේදී අපි ශ්‍රිතය භාවිතයෙන් සරල ප්‍රස්ථාර ගොඩනගන්නේ කෙසේදැයි ඉගෙන ගනිමු qplot(), සහ ඇගේ සියලු තර්ක විශ්ලේෂණය කරමු.

පාඩම 12: ggplot2 පැකේජය භාවිතා කරමින් ස්ථරයෙන් බිම් කොටස් සැලසුම් කිරීම

ප්‍රකාශන දිනය: 8 2020 ජුනි

ආශ්රිත:

විස්තරය:
පාඩම පැකේජයේ සම්පූර්ණ බලය පෙන්නුම් කරයි ggplot2 සහ එහි තැන්පත් කර ඇති ස්ථර වල ප්‍රස්තාර ගොඩනැගීමේ ව්‍යාකරණ.

අපි පැකේජයේ ඇති ප්‍රධාන ජ්‍යාමිතීන් විශ්ලේෂණය කර ප්‍රස්ථාරයක් තැනීම සඳහා ස්ථර යොදන ආකාරය ඉගෙන ගන්නෙමු.

නිගමනය

R භාෂාව වැනි ප්‍රබල දත්ත විශ්ලේෂණ මෙවලමක් ඉගෙනීමේ පළමු පියවර ගැනීමට ඔබට අවශ්‍ය වඩාත්ම අවශ්‍ය තොරතුරු පමණක් ඉස්මතු කිරීමට, පාඨමාලා වැඩසටහන සැකසීමට හැකිතාක් සංක්ෂිප්තව ප්‍රවේශ වීමට මම උත්සාහ කළෙමි.

පාඨමාලාව R භාෂාව භාවිතයෙන් දත්ත විශ්ලේෂණය සඳහා සම්පූර්ණ මාර්ගෝපදේශයක් නොවේ, නමුත් මේ සඳහා අවශ්ය සියලු ශිල්පීය ක්රම තේරුම් ගැනීමට එය ඔබට උපකාර කරනු ඇත.

පාඨමාලා වැඩසටහන සති 12ක් සඳහා නිර්මාණය කර ඇති අතර, සෑම සතියකම සඳුදා දිනවල මම නව පාඩම් සඳහා ප්‍රවේශය විවෘත කරමි, එබැවින් මම නිර්දේශ කරමි දායක වන්න නව පාඩමක් ප්‍රකාශනය අතපසු නොකිරීමට YouTube නාලිකාවේ.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න