නිරෝධායනය හේතුවෙන්, බොහෝ දෙනෙක් දැන් තම කාලයෙන් සිංහ කොටස නිවසේ ගත කරන අතර, මෙම කාලය ප්රයෝජනවත් ලෙස ගත කළ හැකිය.
නිරෝධායනය ආරම්භයේදී, මම මාස කිහිපයකට පෙර ආරම්භ කළ ව්යාපෘති කිහිපයක් අවසන් කිරීමට තීරණය කළෙමි. මෙම ව්යාපෘති වලින් එකක් වූයේ "එක්සෙල් පරිශීලකයින් සඳහා ආර් භාෂාව" වීඩියෝ පාඨමාලාවයි. මෙම පාඨමාලාව සමඟ, මම R වෙත ඇතුල් වීමට ඇති බාධකය අඩු කිරීමට අවශ්ය වූ අතර, රුසියානු භාෂාවෙන් මෙම මාතෘකාව පිළිබඳ පුහුණු ද්රව්යවල පවතින හිඟය තරමක් පිරවීම.
ඔබ සේවය කරන ආයතනයේ දත්ත සමඟ සියලු වැඩ තවමත් Excel හි සිදු කරන්නේ නම්, වඩාත් නවීන සහ ඒ සමඟම සම්පූර්ණයෙන්ම නොමිලේ දත්ත විශ්ලේෂණ මෙවලමක් සමඟ දැන හඳුනා ගැනීමට මම යෝජනා කරමි.
අන්තර්ගතය
ඔබ දත්ත විශ්ලේෂණයට කැමති නම්, ඔබ මගේ ගැන උනන්දු විය හැකිය
යොමු පාඨමාලාව ගැන මෙම පාඨමාලාව කා සඳහාද? පාඨමාලා වැඩසටහන
4.1.පාඩම 1: R භාෂාව සහ RStudio සංවර්ධන පරිසරය ස්ථාපනය කිරීම
4.2.පාඩම 2: R හි මූලික දත්ත ව්යුහයන්
4.3.පාඩම 3: TSV, CSV, Excel ගොනු සහ Google Sheets වෙතින් දත්ත කියවීම
4.4.පාඩම 4: පේළි පෙරීම, තීරු තේරීම සහ නැවත නම් කිරීම, R හි නල මාර්ග
4.5.5 වන පාඩම: R හි වගුවකට ගණනය කළ තීරු එකතු කිරීම
4.6.පාඩම 6: R හි දත්ත සමූහගත කිරීම සහ එකතු කිරීම
4.7.පාඩම 7: R හි වගු සිරස් සහ තිරස් සම්බන්ධ කිරීම
4.8.පාඩම 8: R හි කවුළු කාර්යයන්
4.9.පාඩම 9: R හි භ්රමණය වන වගු හෝ විවර්තන වගු වල ප්රතිසමයක්
4.10.පාඩම 10: R හි JSON ගොනු පූරණය කිරීම සහ ලැයිස්තු වගු බවට පරිවර්තනය කිරීම
4.11.පාඩම 11: qplot() ශ්රිතය භාවිතයෙන් ඉක්මනින් සැලසුම් කිරීම
4.12.පාඩම 12: ggplot2 පැකේජය භාවිතා කරමින් ස්ථරයෙන් බිම් කොටස් සැලසුම් කිරීම නිගමනය
යොමු
පාඨමාලාව ගැන
පාඨමාලාව ගෘහ නිර්මාණ ශිල්පය වටා ව්යුහගත කර ඇත tidyverse
, සහ එහි අඩංගු පැකේජ: readr
, vroom
, dplyr
, tidyr
, ggplot2
. ඇත්ත වශයෙන්ම, R හි සමාන මෙහෙයුම් සිදු කරන වෙනත් හොඳ පැකේජ තිබේ, උදාහරණයක් ලෙස data.table
, නමුත් වාක්ය ඛණ්ඩය tidyverse
බුද්ධිමය, නුපුහුණු පරිශීලකයෙකුට පවා කියවීමට පහසුය, එබැවින් R භාෂාව ඉගෙනීම ආරම්භ කිරීම වඩා හොඳ යැයි මම සිතමි tidyverse
.
පූරණය කිරීමේ සිට නිමි ප්රතිඵලය දෘශ්යමාන කිරීම දක්වා සියලුම දත්ත විශ්ලේෂණ මෙහෙයුම් හරහා පාඨමාලාව ඔබට මග පෙන්වනු ඇත.
R සහ Python නොවන්නේ ඇයි? R යනු ක්රියාකාරී භාෂාවක් නිසා, Excel භාවිතා කරන්නන්ට එයට මාරුවීම පහසු වේ, මන්ද සාම්ප්රදායික වස්තු-නැඹුරු ක්රමලේඛනය ගැන සොයා බැලීම අවශ්ය නොවේ.
මේ මොහොතේ, වීඩියෝ පාඩම් 12 ක් සැලසුම් කර ඇති අතර, ඒවා විනාඩි 5 සිට 20 දක්වා පවතී.
පාඩම් ටිකෙන් ටික විවෘත වනු ඇත. සෑම සඳුදා දිනකම මම මගේ වෙබ් අඩවියේ නව පාඩමකට ප්රවේශය විවෘත කරමි.
මෙම පාඨමාලාව කා සඳහාද?
මාතෘකාවෙන් මෙය පැහැදිලි යැයි මම සිතමි, කෙසේ වෙතත්, මම එය වඩාත් විස්තරාත්මකව විස්තර කරමි.
මෙම පාඨමාලාව ඉලක්ක කර ඇත්තේ මයික්රොසොෆ්ට් එක්සෙල් තම කාර්යයේදී සක්රියව භාවිතා කරන සහ එහි දත්ත සමඟ ඔවුන්ගේ සියලු වැඩ ක්රියාත්මක කරන අයයි. සාමාන්යයෙන්, ඔබ අවම වශයෙන් සතියකට වරක් Microsoft Excel යෙදුම විවෘත කරන්නේ නම්, පාඨමාලාව ඔබට සුදුසු වේ.
පාඨමාලාව සම්පූර්ණ කිරීමට ඔබට ක්රමලේඛන කුසලතා අවශ්ය නොවේ, මන්ද... මෙම පාඨමාලාව ආරම්භකයින් සඳහා ඉලක්ක කර ඇත.
නමුත්, සමහර විට, 4 වන පාඩමෙන් පටන්ගෙන, සක්රීය R භාවිතා කරන්නන් සඳහා ද සිත්ගන්නා කරුණු ඇත, මන්ද ... වැනි පැකේජවල ප්රධාන ක්රියාකාරිත්වය dplyr
и tidyr
තරමක් විස්තරාත්මකව සාකච්ඡා කරනු ඇත.
පාඨමාලා වැඩසටහන
පාඩම 1: R භාෂාව සහ RStudio සංවර්ධන පරිසරය ස්ථාපනය කිරීම
ප්රකාශන දිනය: මාර්තු 23 2020
ආශ්රිත:
වීඩියෝ:
විස්තරය:
අපි අවශ්ය මෘදුකාංග බාගත කර ස්ථාපනය කරන හඳුන්වාදීමේ පාඩමක් සහ RStudio සංවර්ධන පරිසරයේ හැකියාවන් සහ අතුරු මුහුණත කෙටියෙන් විමසා බලමු.
පාඩම 2: R හි මූලික දත්ත ව්යුහයන්
ප්රකාශන දිනය: මාර්තු 30 2020
ආශ්රිත:
වීඩියෝ:
විස්තරය:
මෙම පාඩම R භාෂාවෙන් ලබා ගත හැකි දත්ත ව්යුහයන් මොනවාද යන්න තේරුම් ගැනීමට ඔබට උපකාරී වනු ඇත.අපි දෛශික, දින රාමු සහ ලැයිස්තු පිළිබඳව විස්තරාත්මකව බලමු. ඒවා නිර්මාණය කරන්නේ කෙසේද සහ ඒවායේ තනි අංග වෙත ප්රවේශ වන්නේ කෙසේදැයි ඉගෙන ගනිමු.
පාඩම 3: TSV, CSV, Excel ගොනු සහ Google Sheets වෙතින් දත්ත කියවීම
ප්රකාශන දිනය: අප්රේල් මස 6 2020
ආශ්රිත:
වීඩියෝ:
විස්තරය:
මෙවලම කුමක් වුවත් දත්ත සමඟ වැඩ කිරීම ආරම්භ වන්නේ එහි නිස්සාරණයෙනි. පාඩම අතරතුර පැකේජ භාවිතා වේ vroom
, readxl
, googlesheets4
csv, tsv, Excel ගොනු සහ Google Sheets වෙතින් R පරිසරයට දත්ත පැටවීම සඳහා.
පාඩම 4: පේළි පෙරීම, තීරු තේරීම සහ නැවත නම් කිරීම, R හි නල මාර්ග
ප්රකාශන දිනය: අප්රේල් මස 13 2020
ආශ්රිත:
වීඩියෝ:
විස්තරය:
මෙම පාඩම පැකේජය ගැන ය dplyr
. එහි අපි දත්ත රාමු පෙරීම, අවශ්ය තීරු තෝරා ඒවා නැවත නම් කරන්නේ කෙසේදැයි සොයා බලමු.
නල මාර්ග යනු කුමක්ද සහ ඒවා ඔබේ R කේතය වඩාත් කියවිය හැකි බවට පත් කිරීමට උදවු කරන්නේ කෙසේද යන්න ද අපි ඉගෙන ගනිමු.
5 වන පාඩම: R හි වගුවකට ගණනය කළ තීරු එකතු කිරීම
ප්රකාශන දිනය: අප්රේල් මස 20 2020
ආශ්රිත:
වීඩියෝ:
විස්තරය:
මෙම වීඩියෝවෙන් අපි පුස්තකාලය සමඟ අපගේ දැන හඳුනා ගැනීම දිගටම කරගෙන යන්නෙමු tidyverse
සහ පැකේජය dplyr
.
අපි කාර්යයන් පවුල දෙස බලමු mutate()
, සහ මේසයට නව ගණනය කළ තීරු එකතු කිරීමට ඒවා භාවිතා කරන්නේ කෙසේදැයි අපි ඉගෙන ගනිමු.
පාඩම 6: R හි දත්ත සමූහගත කිරීම සහ එකතු කිරීම
ප්රකාශන දිනය: අප්රේල් මස 27 2020
ආශ්රිත:
වීඩියෝ:
විස්තරය:
මෙම පාඩම දත්ත විශ්ලේෂණය, සමූහගත කිරීම සහ එකතු කිරීමේ ප්රධාන මෙහෙයුම් වලින් එකක් සඳහා කැප කෙරේ. පාඩම අතරතුර අපි පැකේජය භාවිතා කරමු dplyr
සහ විශේෂාංග group_by()
и summarise()
.
අපි මුළු පවුලම කාර්යයන් දෙස බලමු summarise()
, i.e. summarise()
, summarise_if()
и summarise_at()
.
පාඩම 7: R හි වගු සිරස් සහ තිරස් සම්බන්ධ කිරීම
ප්රකාශන දිනය: 4 මැයි 2020
ආශ්රිත:
වීඩියෝ:
විස්තරය:
වගු වල සිරස් සහ තිරස් සම්බන්ධ කිරීමේ ක්රියාකාරකම් තේරුම් ගැනීමට මෙම පාඩම ඔබට උපකාරී වනු ඇත.
සිරස් එකමුතුවක් යනු SQL විමසුම් භාෂාවේ UNION මෙහෙයුමට සමාන වේ.
VLOOKUP ශ්රිතයට ස්තුති වන්නට Excel භාවිතා කරන්නන් විසින් තිරස් සම්බන්ධ කිරීම වඩාත් හොඳින් හඳුනයි; SQL හි, එවැනි මෙහෙයුම් සිදු කරනු ලබන්නේ JOIN ක්රියාකරු විසිනි.
පාඩම අතරතුර අපි පැකේජ භාවිතා කරන ප්රායෝගික ගැටළුවක් විසඳන්නෙමු dplyr
, readxl
, tidyr
и stringr
.
අපි සලකා බලනු ලබන ප්රධාන කාර්යයන්:
bind_rows()
- වගු වල සිරස් සම්බන්ධ කිරීමleft_join()
- වගු තිරස් සම්බන්ධ කිරීමsemi_join()
- සම්බන්ධ කිරීමේ වගු ඇතුළුවanti_join()
- සුවිශේෂී වගු එකතු කිරීම
පාඩම 8: R හි කවුළු කාර්යයන්
ප්රකාශන දිනය: 11 මැයි 2020
ආශ්රිත:
විස්තරය:
ජනේල ශ්රිතයන් එක්රැස් කිරීමේ අර්ථයට සමාන වේ; ඒවා ආදානය ලෙස අගයන් මාලාවක් ගෙන ඒවා මත අංක ගණිතමය මෙහෙයුම් සිදු කරයි, නමුත් ප්රතිදාන ප්රතිඵලයේ පේළි ගණන වෙනස් නොකරන්න.
මෙම නිබන්ධනයේදී අපි පැකේජය දිගටම අධ්යයනය කරමු dplyr
, සහ කාර්යයන් group_by()
, mutate()
, මෙන්ම නව cumsum()
, lag()
, lead()
и arrange()
.
පාඩම 9: R හි භ්රමණය වන වගු හෝ විවර්තන වගු වල ප්රතිසමයක්
ප්රකාශන දිනය: 18 මැයි 2020
ආශ්රිත:
විස්තරය:
බොහෝ Excel භාවිතා කරන්නන් විවර්තන වගු භාවිතා කරයි; මෙය ඔබට අමු දත්ත මාලාවක් තත්පර කිහිපයකින් කියවිය හැකි වාර්තා බවට පත් කළ හැකි පහසු මෙවලමකි.
මෙම නිබන්ධනයේදී අපි R හි වගු කරකවන ආකාරය දෙස බලමු, ඒවා පුළුල් සිට දිගු ආකෘතියට සහ අනෙක් අතට පරිවර්තනය කරන්න.
බොහෝ පාඩම් පැකේජයට කැප කර ඇත tidyr
සහ කාර්යයන් pivot_longer()
и pivot_wider()
.
පාඩම 10: R හි JSON ගොනු පූරණය කිරීම සහ ලැයිස්තු වගු බවට පරිවර්තනය කිරීම
ප්රකාශන දිනය: 25 මැයි 2020
ආශ්රිත:
විස්තරය:
JSON සහ XML තොරතුරු ගබඩා කිරීම සහ හුවමාරු කිරීම සඳහා අතිශය ජනප්රිය ආකෘති වේ, සාමාන්යයෙන් ඒවායේ සංයුක්තතාවය නිසා.
නමුත් එවැනි ආකෘති වලින් ඉදිරිපත් කර ඇති දත්ත විශ්ලේෂණය කිරීම අපහසුය, එබැවින් විශ්ලේෂණයට පෙර එය වගු ආකෘතියකට ගෙන ඒම අවශ්ය වේ, එය හරියටම අපි මෙම වීඩියෝවෙන් ඉගෙන ගනු ඇත.
පාඩම පැකේජයට කැප කර ඇත tidyr
, පුස්තකාලයේ හරයට ඇතුළත් කර ඇත tidyverse
, සහ කාර්යයන් unnest_longer()
, unnest_wider()
и hoist()
.
පාඩම 11: qplot() ශ්රිතය භාවිතයෙන් ඉක්මනින් සැලසුම් කිරීම
ප්රකාශන දිනය: 1 2020 ජුනි
ආශ්රිත:
විස්තරය:
පැකේජය ggplot2
R හි පමණක් නොව වඩාත් ජනප්රිය දත්ත දෘශ්යකරණ මෙවලම් වලින් එකකි.
මෙම පාඩමේදී අපි ශ්රිතය භාවිතයෙන් සරල ප්රස්ථාර ගොඩනගන්නේ කෙසේදැයි ඉගෙන ගනිමු qplot()
, සහ ඇගේ සියලු තර්ක විශ්ලේෂණය කරමු.
පාඩම 12: ggplot2 පැකේජය භාවිතා කරමින් ස්ථරයෙන් බිම් කොටස් සැලසුම් කිරීම
ප්රකාශන දිනය: 8 2020 ජුනි
ආශ්රිත:
විස්තරය:
පාඩම පැකේජයේ සම්පූර්ණ බලය පෙන්නුම් කරයි ggplot2
සහ එහි තැන්පත් කර ඇති ස්ථර වල ප්රස්තාර ගොඩනැගීමේ ව්යාකරණ.
අපි පැකේජයේ ඇති ප්රධාන ජ්යාමිතීන් විශ්ලේෂණය කර ප්රස්ථාරයක් තැනීම සඳහා ස්ථර යොදන ආකාරය ඉගෙන ගන්නෙමු.
නිගමනය
R භාෂාව වැනි ප්රබල දත්ත විශ්ලේෂණ මෙවලමක් ඉගෙනීමේ පළමු පියවර ගැනීමට ඔබට අවශ්ය වඩාත්ම අවශ්ය තොරතුරු පමණක් ඉස්මතු කිරීමට, පාඨමාලා වැඩසටහන සැකසීමට හැකිතාක් සංක්ෂිප්තව ප්රවේශ වීමට මම උත්සාහ කළෙමි.
පාඨමාලාව R භාෂාව භාවිතයෙන් දත්ත විශ්ලේෂණය සඳහා සම්පූර්ණ මාර්ගෝපදේශයක් නොවේ, නමුත් මේ සඳහා අවශ්ය සියලු ශිල්පීය ක්රම තේරුම් ගැනීමට එය ඔබට උපකාර කරනු ඇත.
පාඨමාලා වැඩසටහන සති 12ක් සඳහා නිර්මාණය කර ඇති අතර, සෑම සතියකම සඳුදා දිනවල මම නව පාඩම් සඳහා ප්රවේශය විවෘත කරමි, එබැවින් මම නිර්දේශ කරමි
මූලාශ්රය: www.habr.com