áĄááşááŹáááşááąáŤáşáážá R áááŻáˇáááŻááş Python áááŻáážáŹáá˝áąááźááşá¸ááźááˇáşá ááąááŹáážááˇáşááŻááşááąáŹááşááŹáá˝ááş áááşáááˇáşáĄááŹá áááŻááąáŹááşá¸á áááŻáááŻááźááşáááşááźáŽá¸ áááŻáááŻáĄáááşááźáąáááˇáşáĄááźáąáŹááşá¸áĄááŹáážááˇáşáááşáááşá áááşá¸ááąáŤááşá¸ááťáŹá¸á á˝áŹááąáŹ ááąáŹááşá¸ááŤá¸ááťáŹá¸áážááˇáş ááŽáááŻááŽáᏠáá˝áąá¸áá˝áąá¸áážáŻááťáŹá¸ááᯠáááşáá˝áąáˇááááˇáşáááşá áááŻáˇááąáŹáş ááśáááąáŹááşá¸á á˝áŹááźááˇáşá á¤ááąáŹááşá¸ááŤá¸ááťáŹá¸áážááˇáş áĄááźááşá¸áá˝áŹá¸áážáŻááťáŹá¸áĄáŹá¸ááŻáśá¸áááş áĄáá°á¸áĄááŻáśá¸ááááşááŤá

á¤ááąáŹááşá¸ááŤá¸ááááşáá˝ááşááťááşáážáŹ ááŹááŹá ááŹá¸áážá áşááťááŻá¸ááŻáśá¸á ááąáááşá¸áĄá áŹá¸ááŻáśá¸ áááşááąáˇááťáşááťáŹá¸áá˝ááş áĄááźáąááśááąááŹááŻááşááąáŹááşááźááşá¸áááşá¸áááŹááťáŹá¸ááᯠáážááŻááşá¸áážááşáááşááźá áşáááşá ááźáŽá¸ááąáŹáˇ á áŹáááşáá°áá˝áąááᯠáá°áááŻáˇáááááąá¸áá˛áˇ áĄááŹáá˝áąááᯠááźááşááźááşáááşáááş ááťá˝ááşá¸ááťááşáĄáąáŹááş áá°ááŽááąá¸ááŤá Python áá˝ááşááąá¸ááŹá¸áá°ááťáŹá¸áĄáá˝ááşá R áá˝ááşáá°ááŽááąáŹáĄááŹáááŻáááşáááŻáˇááŻááşááąáŹááşááááşáááŻáážáŹáá˝áąááŤá áážááˇáşáĄááźááşáĄáážááşáážáŹáá˝áąááŤá
ááąáŹááşá¸ááŤá¸áĄáá˝ááşá¸ R áá˝ááş áá°ááźááŻááşáĄááťáŹá¸ááŻáśá¸ áááşááąáˇááťáşááťáŹá¸á syntax ááᯠáááŻááşá¸ááźáŹá¸á
áááşááźáŹááŤáááşá áááşá¸áááŻáˇáááş á
áŹááźááˇáşáááŻááşáá˝ááş ááŤáááşááąáŹ áááşááąáˇááťáşááťáŹá¸ááźá
áşáááş tidyverseáážááˇáşáĄááŻááş data.table. áá°áááŻáˇáá˛áˇ syntax áá˛áˇ áážááŻááşá¸áážááşááŤá pandasPython áá˝ááş ááąáááşá¸áĄá
áŹá¸ááŻáśá¸ ááąááŹáá˝á˛ááźááşá¸á
áááşááźáŹáážáŻ áááşááąáˇááťáşá
áááşá¸ááᯠloading ááž Python áážááˇáş R áááŻáˇááᯠáĄááŻáśá¸ááźáŻá áá˝á˛ááźááşá¸á áááşááźáŹááąáŹáááşá¸áááŻá¸ááŻááşááąáŹááşááťááşááťáŹá¸ ááŻááşááąáŹááşááźááşá¸áĄáá ááąááŹáá˝á˛ááźááşá¸á áááşááźáŹáážáŻáááşá¸ááźáąáŹááşá¸áá áşááŻááŻáśá¸ááᯠáá áşáááˇáşááźáŽá¸áá áşáááˇáş ááŻááşááąáŹááşáá˝áŹá¸ááŤáááşá
áĄááźáąáŹááşá¸áĄááŹ
áááˇáşáá˝ááşá¸á ááşá¸á áŹá¸ááŹá¸áááˇáş áááşááąáˇááťáşááťáŹá¸áá˛ááž áá áşááŻáá˝ááş ááąááŹááŻááşááąáŹááşááźááşá¸ ááŻááşááąáŹááşááťááşááᯠááąáˇáá˝áŹá¸ááŤá á¤ááąáŹááşá¸ááŤá¸ááᯠááąáŹááşááťááşá áŹáá˝ááşáĄááźá áş áĄááŻáśá¸ááźáŻáááŻááşááŤáááşá

1.1 á
1.2 á
1.3 á
1.4 á
1.5 á
1.6 á
2.1 á
2.2 á
2.3 á
ááąááŹáá˝á˛ááźááşá¸á áááşááźáŹááźááşá¸ááᯠá áááşáááşá áŹá¸ááŤá ááťá˝ááşáŻááşáĄáŹá¸ áážáŹáá˝áąáááŻááşááŤáááşá и ááťááşáááşááťáŹá¸á áĄááźáąáŹááşá¸áĄááŹáĄááťáŹá¸á áŻáááş R ááŹááŹá ááŹá¸áĄáá˝ááş áááşáá˝ááşáááşá
R áážááˇáş Python áĄááźáŹá¸ áĄááá syntax áá˝áŹááźáŹá¸ááťááşááťáŹá¸
Python ááž R áááŻáˇááźáąáŹááşá¸áááş áááŻáááŻáá˝ááşáá°á áąáááşá áááŻáˇáááŻááş áĄááźááşáĄáážááşáĄáŹá¸ááźááˇáşá áááşáĄáŹááŻáśá ááŻááşáááşáááŻáĄááşáááˇáş áĄááááĄááťááşáĄááťááŻáˇááᯠááťá˝ááşáŻááşááźáąáŹááźááŤáááşá
Package Functions ááťáŹá¸ááᯠáááşááąáŹááşááźááˇáşáážáŻááźááşá¸á
áááşááąáˇááťáşáá
áşááŻááᯠR áá˝ááşáááˇáşáá˝ááşá¸ááźáŽá¸áááşáážááˇáş áááşá¸áááŻááşááąáŹááşááťááşááťáŹá¸ááᯠáááşááąáŹááşááźááˇáşáážáŻáááş áááşááąáˇááťáşáĄáááşááᯠáááşáááşáážááşáááş ááááŻáĄááşááŤá ááá
ášá
áĄááťáŹá¸á
áŻáá˝ááş áááşá¸áááş R áá˝ááşááŹáááşáááŻááşááąáŹáşáááşá¸ áááşááśáááŻááşáááşá áááˇáşááŻááşáážá áááşá¸áááŻááşááąáŹááşááťááşááťáŹá¸áá˛ááž áá
áşááŻááᯠáááŻáĄááşááŤá áááşááąáˇááťáşááᯠáááşáá˝ááşá¸áááş ááááŻáĄááşááąáŹáşáááşá¸ áááşááąáˇááťáşáĄáááşáážááˇáş ááŻááşááąáŹááşááťááşáĄáááşááᯠáááşáážááşááźááşá¸ááźááˇáş áááşá¸ááᯠááąáŤáşááŤá R áážá áááşááąáˇááťáşáážááˇáş ááŻááşááąáŹááşááťááşáĄáááşááťáŹá¸ááźáŹá¸ ááźáŹá¸ááŹá¸ááťááşáážáŹ ááąáŹáşááśáážá
áşáááşááźá
áşáááşá package_name::function_name().
áááˇáşááťááşáááşáĄááąáážááˇáş Python áá˝ááş áááşá¸ááĄáááşááᯠááźááşááŹá¸á
á˝áŹáááşáážááşááźááşá¸ááźááˇáş áááşááąáˇááşáťáá
áşááŻá ááŻááşááąáŹááşááťááşááťáŹá¸ááᯠááąáŤáşáááş ááášááááşáᯠáá°áááŤáááşá áááşááąáˇááťáşáá
áşááŻááᯠááąáŤááşá¸ááŻááşááŻááşááąáŹáĄááŤá áááşá¸ááᯠáĄááťáŹá¸áĄáŹá¸ááźááˇáş áĄáááŻááąáŹááşáĄáááşááąá¸ááąáˇáážááááşá áĽáááŹá pandas áĄááťáŹá¸áĄáŹá¸ááźááˇáş áááąáŹááşáĄáááşááᯠáĄááŻáśá¸ááźáŻááźáááşá pd. áááşááąáˇááťáşááŻááşááąáŹááşááťááşááᯠáĄá
ááşáá
áşááŻáážáá
áşáááˇáş áááşááąáŹááşáááşá package_name.function_name().
áááş
R áá˝ááşá áĄááŹááášááŻáá
áşááŻáĄáŹá¸ áááşáááŻá¸áá
áşááŻáááşáážááşáááş ááźážáŹá¸áááŻáĄááŻáśá¸ááźáŻááźááşá¸áááş ááŹááŹááşááźá
áşáááşá obj_name <- valueáá°ááŽááąáŹ áááşášááąááá
áşááŻáĄáŹá¸ áá˝ááˇáşááźáŻááŹá¸ááąáŹáşáááşá¸á áá°ááŽááąáŹáááşášááąá R áá˝ááş áá°ááŽáááˇáşáááşášááąáááᯠáááşáááŻá¸ááťáŹá¸ááźááşáááşá¸áááş áĄááááĄáŹá¸ááźááˇáş áĄááŻáśá¸ááźáŻáááşá
Python áá˝ááşá assignment ááᯠáá°ááŽáááˇáşááášáááŹáá
áşááŻááźááˇáş ááŽá¸áááˇáşááŻááşááąáŹááşáááşá obj_name = value.
áá˝ážááşá¸ááááşá¸
á¤ááąááŹáá˝ááşáááşá¸ ááááŹáááşáážáŹá¸ááąáŹ ááźáŹá¸ááŹá¸ááťááşááťáŹá¸á á˝áŹáážááááşá R áá˝ááşá indexing áááş áá áşááŻáážá áááşááźáŽá¸ áááŹááşáĄáááŻááşá¸áĄááźáŹá¸áážá áááşáážááşááŹá¸ááąáŹááźááşá ááşááťáŹá¸áĄáŹá¸ááŻáśá¸ááŤáááşáááşá
Python áá˝ááşá áá˝ážááşá¸ááááşá¸áááş ááŻááážá
áááşááźáŽá¸ áá˝áąá¸ááťááşááŹá¸ááąáŹáĄáá˝áŹáĄááąá¸áá˝ááş áĄáá˝ážááşá¸áá˝ááşááąáŹáşááźááŹá¸ááąáŹááąáŹááşááŻáśá¸ááźááşá
ááşáááŤáááşááŤá ááŤááźáąáŹááˇáş ááŽáááŻááşá¸ááŻááşááŤá x[i:j] Python áá˝ááş j element áááŤáááşááŤá
R áĄáážááşáĄááŹá¸áá˝ááş áĄááŻááşááášáááŹáá˝ážááşá¸ááááşá¸ áá˝á˛ááźáŹá¸áážáŻááťáŹá¸áááşá¸áážááááşá x[-1] ááąáŹááşááŻáśá¸áá
áşááŻáážáá˝á˛á vector áááźááşá
ááşáĄáŹá¸ááŻáśá¸áááŻááźááşááąá¸ááááˇáşáááşá Python áá˝ááş áĄááŹá¸áá°áĄáážááşáĄááŹá¸áááş ááąáŹááşááŻáśá¸ááźááşá
ááşáááŻáᏠááźááşááąá¸ááááˇáşáááşá
áááşá¸áááşá¸ááťáŹá¸áážááˇáş OOP
R áááş OOP áááŻáááşá¸ááááŻááşáááŻááşáááşá¸áááşá¸ááźááˇáşáĄááąáŹááşáĄáááşááąáŹáşáááşá á¤áĄááźáąáŹááşá¸áááŻááąáŹááşá¸ááŤá¸áá˝ááşááťá˝ááşááąáŹáşááąá¸áá˛áˇáááşá . ááąáá°ááťáĄáŹá¸ááźááˇáş R áááş functional language ááźá
áşááźáŽá¸ áááşá¸áá˝ááşáážáááąáŹ áĄááŹáĄáŹá¸ááŻáśá¸áááş functions ááťáŹá¸ááąáŤáşáá˝ááş áááşááąáŹááşááŹá¸áááşá áááŻáˇááźáąáŹááˇáş áĽáááŹáĄáŹá¸ááźááˇáş Excel áĄááŻáśá¸ááźáŻáá°ááťáŹá¸áĄáá˝ááşá áá˝áŹá¸ááŤá tydiverse áááşáááŻáááŻáá˝ááşáá°ááááˇáşáááşá pandas. ááŤâááąáá˛áˇ ááŤá ááťá˝ááşââááąáŹáˇáşâáá˛áˇ ááŻáášáááĄááźááşâááźá
áşâáááŻááşâáááşâá
áááŻáááŻááźáąáŹááááş R áážáŹáážááá˛áˇ áĄááŹááášááŻáá˝áąáážáŹ áááşá¸áááşá¸áá˝áą ááážááá°á¸ (ááťá˝ááşáŻááşáááŻáˇ S3 áĄáááşá¸áá˝áąáĄááźáąáŹááşá¸ ááźáąáŹáááşá ááŤááąáááˇáş áĄááťáŹá¸ááźáŽá¸áááşá¸áá˛áˇ áááźáŹá¸ OOP áĄááąáŹááşáĄáááşááąáŹáşáážáŻáá˝áą áážáááŤáááş)á Object á class ááąáŤáşáá°áááşá áááşá¸áááŻáˇááᯠáá˝á˛ááźáŹá¸á á˝áŹ á áŽááśááąáŹááşáá˝ááşááąá¸ááąáŹ ááąááŻááťááŻááşááąáŹááşáááˇáşááŻááşááąáŹááşááťááşááťáŹá¸áᏠáážáááŤáááşá
áááŻááşáááŻááşá¸ááťáŹá¸
ááŹáááşá ááźáąáŹááŹá¸áᏠpandas ááŻáśá¸ááŻáśá¸ ááážááşááąáááˇáş áĄáááášááŤááşááᯠáážááşá¸ááźáááŻáˇ ááźááŻá¸á
áŹá¸ááŤáˇáááşá
áĄáááşáĄáááş áá˝ááşááťááşáážáŻááťáŹá¸ááᯠááááşá¸áááşá¸áááşáážááˇáş ááŻááşáááşá¸áá˝ááşáĄáá˝ááşá¸ ááááŻáĄááşááąáŹ áĄááŹááťáŹá¸ áááŻááşááŻááşá áąáááşá áááŻááşáááŻááşá¸áá áşááťááŻá¸ááᯠáááş áĄááŻáśá¸ááźáŻáááŻááşáááşá áĄá˛ááŤáá˝áąá ááŻááşááąáŹááşááťááşáá áşááŻááž ááąáŹááşáá áşááŻáááŻáˇ áá˝ááşááťááşáážáŻáá áşááŻáááááşááᯠááźááşáá˝áŹá¸áᏠáĄáááşáĄáááşááááşááťáŹá¸ááᯠáááááşá¸áááşá¸ááŤáážááˇáşá
ááŽá¸ááźáŹá¸áĄááŹááášááŻááťáŹá¸áá˝ááş ááťá˝ááşáŻááşáááŻáˇ áĄáááşáĄáááşáá˝ááşááťááşáážáŻááťáŹá¸ááᯠááááşá¸áááşá¸ááŹá¸áááˇáş áĄáąáŹááşááŤááŻááşááá°ááŹááᯠááźááˇáşááźááŤá ááŻáˇá
temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )ááťá˝ááşáŻááşáááŻáˇáááş ááŻááşááąáŹááşááťááş 3 ááŻááᯠáááşáááŻááşááŻááşááąáŹááşáá˛áˇááźáŽá¸ áá áşááŻá áŽáááááşááᯠááŽá¸ááźáŹá¸áĄááŹááášááŻáá áşááŻáá˝ááş ááááşá¸áááşá¸áá˛áˇáááşá ááŤááąáááˇáş ááááşááąáŹáˇá ááŽááźáŹá¸ááśáĄááŹááášááŻáá˝áąááᯠááťá˝ááşááąáŹáşáááŻáˇ ááááŻáĄááşááŤáá°á¸á
áááŻáˇáááŻááş áááŻáááŻá¸ááąáŹáşáááşá¸ Excel áĄááŻáśá¸ááźáŻáá°ááťáŹá¸áážááˇáş áááŻáááşá¸áážáŽá¸áááşá
obj <- func3(func2(func1()))á¤ááá ášá áá˝ááşá ááťá˝ááşáŻááşáááŻáˇáááş áĄáááşáĄáááşáá˝ááşááťááşáážáŻááááşááťáŹá¸ááᯠáááááşá¸áááşá¸ááŹá¸ááąáŹáşáááşá¸ nested ááŻááşááąáŹááşááťááşááťáŹá¸ááźááˇáş ááŻááşáááşááźááşá¸áááş áĄáá˝ááşáĄáááşáááźáąááŤá
R áá˝ááş ááąááŹááŻááşááąáŹááşááźááşá¸áĄáá˝ááş ááťááşá¸áááşáááşá¸ááťáŹá¸á á˝áŹááᯠááťá˝ááşáŻááşáááŻáˇááźááˇáşáážáŻáááşááźá áşááźáŽá¸ áááşá¸áááŻáˇáááş ááŻáśá áśáĄááťááŻá¸ááťááŻá¸ááźááˇáş áĄááŹá¸áá°ááŻááşááąáŹááşáážáŻááťáŹá¸ááᯠááŻááşááąáŹááşááŤáááşá
á
áŹááźááˇáşáááŻááşááťáŹá¸áá˝ááş áááŻááşáááŻááşá¸ááťáŹá¸ tidyverse áĄáąáŹáşáááąááŹáážáĄááąáŹááşáĄáááşááąáŹáşáááşá %>%.
obj <- func1() %>%
func2() %>%
func3()áááŻáˇááźáąáŹááˇáş ááťá˝ááşáŻááşáááŻáˇáááş áĄááŻááşáááááşááᯠáá°áááşá func1() áááşá¸ááᯠááááĄááźááşá¸áĄááŻáśáĄááźá
áş ááťáąáŹáşááźááşááŤá func2()áááŻáˇááąáŹááş ááťá˝ááşáŻááşáááŻáˇáááş á¤áá˝ááşááťááşáážáŻáááááşááᯠááááĄááźááşá¸áĄááŻáśáĄááźá
áş ááťáąáŹáşááźááşáááşá func3(). áĄááŻáśá¸áá˝ááşá ááťá˝ááşáŻááşáááŻáˇáááş áĄááŹááášááŻáá˝ááş ááŻááşááąáŹááşáá˛áˇááąáŹ áá˝ááşááťááşáážáŻááťáŹá¸ááᯠááąá¸ááťááŤá obj <-.
áĄáááşááąáŹáşááźá፠áĄáŹá¸ááŻáśá¸ááᯠᤠmeme ááž á
ááŹá¸ááŻáśá¸ááťáŹá¸áááş ááŹáá˝ááşá
á˝áŹ áááŻááşááąáŹáşááŹá¸ááŤáááşá

Đ data.table ááźááŻá¸ááťáŹá¸ááᯠáĄááŹá¸áá°áááşá¸ááźááˇáş áĄááŻáśá¸ááźáŻááźáááşá
newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]á ááŻáááşá¸áá˝ááşá¸áá áşááŻá áŽáá˝ááş ááááşááŻááşááąáŹááşáážáŻáááááşááᯠáááşáĄááŻáśá¸ááźáŻáááŻááşáááşá
Đ pandas áááŻáááŻáˇááąáŹ ááŻááşááąáŹááşááťááşááťáŹá¸ááᯠáĄá
ááşááźááˇáş áá˝á˛ááźáŹá¸ááŹá¸áááşá
obj = df.fun1().fun2().fun3()áĄá˛ááŤáá˝áąá ááŤáááŻáˇá
áŹá¸áá˝á˛áááŻáá° df áá°áááááşá¸áááşá¸áááŻáĄááŻáśá¸ááźáŻááŤá fun1()áááŻáˇááąáŹááş ááážáááŹááąáŹ ááááşáĄáá˝ááş áááşá¸áááşá¸ááᯠááťá˝ááşáŻááşáááŻáˇ ááťááˇáşááŻáśá¸áááşá fun2()ááźáŽá¸ááąáŹááş fun3(). áááŹáá˛áˇááááşááᯠáĄááŹááášááŻáá
áşááŻáá˛áážáŹ ááááşá¸áááşá¸ááŹá¸ááŤáááşá Obj .
ááąááŹáá˝á˛áˇá ááşá¸ááŻáśááťáŹá¸
R áážááˇáş Python áá˝ááş ááąááŹáááşááąáŹááşááŻáśááťáŹá¸áááş áááşáá°ááąáŹáşáááşá¸ ááŹáááşáĄááťááŻá¸ááťááŻá¸áážááááşá
ááąáŤáşááźááťááş
R áá˝ááşáĄáááş
Python/pandas áá˝ááş áĄáááş
áááŹá¸áá˝á˛áˇá
ááşá¸ááŻáś
data.frameá data.tableá tibble
ááąááŹááąáŹááş
áá
áşáááşááźááşáááşáááŻá¸ááťáŹá¸á
áŹáááşá¸
Vector
áááşááŤááťáŹá¸áá˝ááş á
áŽá¸ááŽá¸ááťáŹá¸ áááŻáˇáááŻááş Python á
á
áşá
á
áşáá˝ááş á
áŹáááşá¸áá˝ááşá¸ááŤá
Multi-level non-tabular áá˝á˛áˇá
ááşá¸ááŻáś
á
áŹáááşá¸
áĄááááŹááş (dict)
áĄáąáŹááşáá˝ááşááąáŹáşááźááŹá¸ááąáŹ syntax ááĄááźáŹá¸áĄááşášááŤáááşááťáŹá¸áážááˇáşáá˝á˛ááźáŹá¸ááťááşááťáŹá¸áááŻááźááˇáşáážáŻááŤáááşá
ááťá˝ááşáŻááşáááŻáˇáĄááŻáśá¸ááźáŻáááˇáş áááşááąáˇááťáşááťáŹá¸áážááˇáşáááşáááşááąáŹ á ááŹá¸ááŻáśá¸áĄááťááŻáˇ
ááááŚá¸á á˝áŹ á¤ááąáŹááşá¸ááŤá¸áá˝ááş áááşáááşá¸áážáŽá¸ááŹáááˇáş package ááťáŹá¸áĄááźáąáŹááşá¸ áĄáááşá¸áááşááźáąáŹááźááŤáááşá
áááşáááşááąáŹ
áááŹá¸áááşáááşááşáááŻááş:
á
áŹááźááˇáşáááŻááş tidyverse RStudio áážáĄááźáŽá¸áááşá¸ááŻááąáááááášááśáááŹáážááş Hedley Wickham áážááąá¸ááŹá¸áá˛áˇáááş tidyverse ááąááŹá
áŽááśááąáŹááşáá˝ááşáážáŻááᯠáááŻá¸áážááşá¸áá˝ááşáá°á
áąáááˇáş áĄáááşááźáŽá¸ááąáŹááşááąáŹ áááşááąáˇááťáşááťáŹá¸ááŤáááşááźáŽá¸ áááşá¸áááŻáˇáá˛ááž 5 ááŻáááş CRAN áááŻáážáąáŹááşáážáŻááž ááááşáááşá¸ááąáŤááşá¸ááŻááş 10 ááŻáá˝ááş ááŤáááşáááşá
á
áŹááźááˇáşáááŻááşá áĄááááĄááťááşáážáŹ áĄáąáŹááşá፠áĄááŻááşááťáŹá¸ ááŤáááşáááş- ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats. á¤áááşááąáˇááťáşáá
áşááŻá
áŽáááş ááŽá¸ááźáŹá¸ááźáżááŹáá
áşááŻááᯠááźáąáážááşá¸áááş áááşáá˝ááşáááşá áĽáááŹáĄáŹá¸ááźááşáˇ dplyr data manipulation áĄáá˝ááş áááşááŽá¸ááŹá¸áá˛áˇá tidyr data áá˝áąááᯠáááşáááşáá˛áˇááŻáśá
áśááźá
áşáĄáąáŹááşá stringr strings ááťáŹá¸áážááˇáşáĄááŻááşááŻááşááźááşá¸áááŻáááŻá¸áážááşá¸á
áąáááşá ggplot2 áá°ááŻáśá¸áĄááťáŹá¸ááŻáśá¸ data visualization tools ááťáŹá¸áá˛ááž áá
áşááŻááźá
áşáááşá
áĄáŹá¸ááŹááťááş tidyverse SQL query language áá˛áˇ ááŻáśá
áśááťááŻá¸á
áŻáśáá˛áˇ áááşáá°áá˛áˇ syntax áᏠáááŻá¸áážááşá¸ááźáŽá¸ áááşááá˝ááşáá°ááŤáááşá
ááąááŹ
áááŹá¸áááşáááşááşáááŻááş:
á
áŹááąá¸áá° data.table H2O.ai ááž Matt Dole ááźá
áşáááşá
á áŹááźááˇáşáááŻááşááᯠáááá ááŻáážá áşáá˝ááş á áááşááŻááşááąáá˛áˇáááşá
áááşááąáˇááťáş syntax áááş áá˝ááşáá˛áˇáááŻáˇ áĄáááşáááźáąááŤá tidyverse R áá˝ááş ááášááááşááąááŹááąáŹááşááťáŹá¸ááᯠáááŻáááŻáĄáážááşáá
áąááąáŹáşáááşá¸ áá
áşááťáááşáááşá¸áá˝ááş ááŻááşááąáŹááşáááŻááşá
á˝ááşá¸áážáŹ ááááááŹáᏠááťá˛áˇáá˝ááşááŹáááşá
á¤áááşááąáˇááťáşáážá áááŹá¸ááŤááąáŹ ááźááşáážááşáážáŻáĄáŹá¸ááŻáśá¸ááᯠá
ááŻáááşá¸áá˝ááşá¸á
áá˝ááşááťáŹá¸ááźááˇáş ááąáŹáşááźááŹá¸ááźáŽá¸á áááşááŹááŹááźááşáááŻááŤáá data.table SQL áá˝ááşá áááşáááşá¤áá˛áˇáááŻáˇááąáŹáĄááŹáá
áşááŻáááŻááážááááşá data.table[ WHERE, SELECT, GROUP BY ]
á¤áááşááąáˇááťáşá áĄáŹá¸ááŹááťááşáážáŹ ááąááŹáĄááťáŹá¸áĄááźáŹá¸ááᯠáĄáážáááşáĄááŻááşááźááˇáş ááŻááşááąáŹááşááźááşá¸ ááźá áşáááşá
áááşááŤ
áááŹá¸áááşáááşááşáááŻááş:
á áŹááźááˇáşáááŻááşááĄáááşáááş áááşááąáŤááşá¸á áŻáśáážáá˝á˛áˇá ááşá¸ááŹá¸ááąáŹ áĄááťááşáĄáááşáĄá áŻáśáááŻááşááťáŹá¸ááᯠááąáŹáşááźáááşáĄáá˝ááş áĄááŻáśá¸ááźáŻáááˇáş econometric ááąáŤááŹá "panel data" ááž áááşá¸áááşááŹáááşá
á
áŹááąá¸áá° pandas áĄááąáááááş Wes McKinney ááŤá
Python áá˝ááşááąááŹáá˝á˛ááźááşá¸á
áááşááźáŹááźááşá¸áážááˇáşáááşáááşááŹááąáŹáĄááŤ, áá°ááŽáááşá pandas ááážá ááąááŹááťáŹá¸ááᯠáááşáááˇáşáĄáááşá¸áĄááźá
áşááž ááąááŹáááşááźááşá¸ááž áááşá¸ááᯠááźááşááąáŹááşááźááşá¸áĄáá ááąááŹááźááˇáş áááşáááˇáşáĄááŹáážááˇáşáááᯠáááŻááşáá˝ááşááŻááşááąáŹááşáááş áá˝ááˇáşááźáŻáááˇáş áĄáá˝ááşáááşá
áŻáśááŻáśá¸áĄáááˇáşááźááˇáş áááşááąáˇááťáşáá
áşááŻááźá
áşáááşá
áĄáááŻáááşááąáˇááşáťááťáŹá¸ áááˇáşáá˝ááşá¸ááźááşá¸á
á¤ááąáŹááşá¸ááŤá¸áá˝ááş áá˝áąá¸áá˝áąá¸ááŹá¸ááąáŹ áááşááąáˇááťáşááťáŹá¸áááş áĄááźáąááś R áážááˇáş Python ááźááˇáşááąáážáŻááťáŹá¸áá˝ááş áááŤáááşááŤá áááááąá¸ááťááşááąá¸áá
áşááŻáážáááąáŹáşáááşá¸á áááşáááş Anaconda ááźááˇáşááźá°á¸áážáŻááᯠáááˇáşáá˝ááşá¸ááŤá áááşááśáááˇáşáá˝ááşá¸ááŤá pandas ááááŻáĄááşááŤá
R áá˝ááş áááşááąáˇááşáťááťáŹá¸ áááˇáşáá˝ááşá¸ááźááşá¸á
áĄáááşá áááşáááş RStudio áá˝áśáˇááźááŻá¸áááŻá¸áááşáážáŻáááşáááşá¸ááťááşááᯠáĄáááşá¸ááŻáśá¸áá
áşááźáááşáá˝ááˇáşááŹá¸ááŤá R áá˝ááş áááŻáĄááşááąáŹáááşááąáˇááťáşááᯠáááˇáşáá˝ááşá¸áááşá¸ááᯠáááşááááźáŽá¸ááźá
áşáááŻááşááŤáááşá áááşááąáˇááťáşááťáŹá¸ááᯠáááˇáşáá˝ááşá¸áááşá á
áśáĄááááˇáşááᯠáĄááŻáśá¸ááźáŻááŤá install.packages() áááşá¸ááᯠR áááŻááşáááŻááş áááŻááşáááŻááşááŻááşááąáŹááşááźááşá¸ááźááˇáş
# ŃŃŃанОвка пакоŃОв
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")áááşáááşááźáŽá¸ááąáŹááşá áááşááąáˇááťáşááťáŹá¸ááᯠááťáááşáááşááŹá¸áááş áááŻáĄááşááźáŽá¸ ááá
ášá
áĄááťáŹá¸á
áŻáá˝ááş command áááŻáĄááŻáśá¸ááźáŻáááşá library().
# пОдкНŃŃонио иНи иПпОŃŃ ĐżĐ°ĐşĐľŃОв в ŃайОŃоо ОкŃŃМонио
library(vroom)
library(readr)
library(dplyr)
library(data.table)Python áá˝ááş Packages ááᯠáááˇáşáá˝ááşá¸ááźááşá¸á
ááŽááąáŹáˇ Python áĄá
á
áşááᯠinstall ááŻááşááŹá¸áááşá pandas áááşá¸áááŻáááşáááŻááşáááŻááşáááˇáşáá˝ááşá¸áááşáááŻáĄááşáááşá áááˇáşáááşáááşáážáŻá
áá
áşááąáŤáşáá°áááşá áá˝ááşáááşá¸áááŻááşá¸áá
áşáᯠáááŻáˇáááŻááş terminal áááŻáá˝ááˇáşááźáŽá¸ áĄáąáŹááşá፠command áááŻáááŻááşáááˇáşááŤá
pip install pandasáááŻáˇááąáŹááşááťá˝ááşáŻááşáááŻáˇáááş Python áááŻáˇááźááşááŹááźáŽá¸ command ááźááˇáşáááˇáşáá˝ááşá¸ááŹá¸ááąáŹ package áááŻáááşáá˝ááşá¸ááŤá import.
import pandas as pdááąááŹááᯠáááşááąáááşá
ááąááŹáá°á¸ááąáŹáşááźááşá¸áááş ááąááŹáá˝á˛ááźááşá¸á áááşááźáŹáážáŻáá˝ááş áĄááąá¸ááźáŽá¸ááŻáśá¸ áĄáááˇáşáá áşááŻááźá áşáááşá ááášááážáááŤá Python áážááˇáş R áážá áşááťááŻá¸ááŻáśá¸áááş áááˇáşáĄáŹá¸ áááşáááˇáşáĄáááşá¸áĄááźá áşááťáŹá¸áážáááᯠááąááŹááá°áááş ááťááşááźááˇáşááąáŹáĄáá˝ááˇáşáĄááąá¸ááťáŹá¸ ááąá¸ááąáŹááşáááş- ááźááşáá˝ááşá¸áááŻááşááťáŹá¸á áĄááşááŹáááşáážáááŻááşááťáŹá¸á áááşáááŻááşááťáŹá¸á ááąááŹááąáˇá áşáĄááťááŻá¸áĄá áŹá¸áĄáŹá¸ááŻáśá¸á

ááąáŹááşá¸ááŤá¸áá áşááťážáąáŹááşááŻáśá¸ ááťá˝ááşáŻááşáááŻáˇáááş ááťáŹá¸á á˝áŹááąáŹááąááŹáĄáá˝á˛ááťáŹá¸ááᯠáĄááŻáśá¸ááźáŻááŤáááş-
- Google Analytics ááž ááąáŤááşá¸ááŻááşáážá áşááŻá
- áááŻááşáááşá¸áá áşáááŽá¸áááşááąááŹáĄáá˝á˛á
ááąááŹáĄáŹá¸ááŻáśá¸áááş ááťá˝ááşáŻááşáá˝ááşáážááááşá csv áážááˇáş tsv áááŻááşááťáŹá¸ááŻáśá áśááźááˇáşá áá°áááŻáˇááᯠáááşáááą ááąáŹááşá¸áááŻááá˛á
ááąááŹááᯠR- tidyverseá vroomá readr áá˝ááş áááşááąáááşá
ááąááŹááᯠáá
áşááťá
áşáááŻááşáááŻáˇ áááşáááş tidyverse áááşááąáˇááťáş áážá
áşáᯠáážááááş vroom, readr. vroom áááŻáááŻááąááşááŽááąáŹáşáááşá¸ áĄááŹáááşáá˝ááş áááşááąáˇááşáťááťáŹá¸ááᯠááąáŤááşá¸á
ááşáááŻááşáááşááźá
áşáááşá
áážáááŻá¸ááŹá¸ vroom.
vroom vs á áŹáááşáá°
áá˝ááşááźáąáŹááşááźááşá¸áá°áááş áĄáááşáááşá¸vroomáááŻáááŻáááşáreadr? áááŻáĄááťáááşáá˝ááş ááťá˝ááşáŻááşáááŻáˇáááş áááşááąáˇááťáşáážá áşááŻááᯠááŽá¸ááźáŹá¸á ᎠááźáąáŹááşá¸áá˛áá˝ááˇáşááźáŻáááş á áŽá ááşááąááąáŹáşáááşá¸ ááąáŹááşáá˝ááş áááşááąáˇááťáşááťáŹá¸ááᯠááąáŤááşá¸á ááşá¸áááŻááşáá˝ááşáážááááşá vroom áááťááşá¸ááááąáŹá áŹáááşááźááşá¸áĄáá˝ááş áĄáŹá¸áááşá¸ááťááşáá áşááŻáážáŹ ááąááŹááźáżááŹáĄááťááŻáˇááᯠáážáąáˇáá˝ááşáĄá áŽáááşááśááźááşá¸áááźáŻáááŻááşááąáŹááźáąáŹááˇáş áááşá¸áááŻáˇááᯠááąáŤááşá¸á ááşá¸áááş áĄááąáŹááşá¸ááŻáśá¸áááşá¸ááᯠá ááşá¸á áŹá¸áááş áááŻáĄááşááŤáááşávroom vs á áŹáááşáá°
áá˝ááşááźáąáŹááşááźááşá¸áá°áááş áĄáááşáááşá¸ávroomáĄáá˝ááşreadr? ááąáŹááąáŹáááşáá˝ááş áááşááąáˇááťáşáážá áşááŻááŻáśá¸ááᯠááŽá¸ááźáŹá¸á ᎠááŽáá˝ááşáááş á áŽá ááşááŹá¸ááąáŹáşáááşá¸ áááşá¸áááŻáˇááᯠáĄááŹáááşáá˝ááş ááąáŤááşá¸á ááşáááŻááşáááşááźá áşáááşá á áŹáááşááťááşá¸ááźááşá¸á áĄáŹá¸áááşá¸ááťááşááťáŹá¸áá˛ááž áá áşááŻvroomááąááŹáážááˇáşáááşáááşááąáŹ áĄááťááŻáˇááąáŹááźáżááŹááťáŹá¸ááᯠááźááŻáááşáĄá áŽáááşááśááźááşá¸áááźáŻáááŻááşááąáŹááźáąáŹááˇáş áááşá¸áááŻáˇááᯠááąáŤááşá¸á ááşáááş áĄááąáŹááşá¸ááŻáśá¸ááᯠáááşá ááşá¸á áŹá¸áááş áááŻáĄááşááŤáááşá
á¤ááąáŹááşá¸ááŤá¸áá˝ááş ááťá˝ááşáŻááşáááŻáˇáááş data loading packages áážá áşááŻááŻáśá¸ááᯠááźááˇáşááŤáááşá
R: vroom áááşááąáˇááťáşáá˝ááş ááąááŹááᯠáááşááąáááşá
# install.packages("vroom")
library(vroom)
# ЧŃонио даннŃŃ
## vroom
ga_nov <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")ááąááŹááᯠR: readr áá˝ááş áááşááąáááşá
# install.packages("readr")
library(readr)
# ЧŃонио даннŃŃ
## readr
ga_nov <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")áĄááŻááşáá˛áážáŹ vroomcsv / tsv ááąááŹááąáŹáşáááş áááşáááŻáˇáááşáážáá
áąááŹáá° áá°ááŽááąáŹáĄáááşá ááŻááşááąáŹááşáážáŻááźááˇáş áááşááźááşá¸ááᯠááŻááşááąáŹááşáááş vroom()áĄááŻááşáá˛áážáŹ readr ááąáŹáşáááşáá
áşááŻá
áŽáĄáá˝ááş ááá°ááŽááąáŹááŻááşááąáŹááşááťááşááᯠááťá˝ááşáŻááşáááŻáˇáĄááŻáśá¸ááźáŻáááşá read_tsv() и read_csv().
ááąááŹááᯠR: data.table áá˝ááş áááşááąáááşá
Đ data.table ááąááŹáááşáááş function áá
áşááŻáážááááşá fread().
R: data.table áááşááąáˇááťáşáá˝ááş ááąááŹááᯠáááşááąáááşá
# install.packages("data.table")
library(data.table)
## data.table
ga_nov <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")Python- pandas áá˝ááş ááąááŹááᯠáá˝ááˇáşááąáááşá
R package ááťáŹá¸áážááˇáş áážááŻááşá¸áážááşááŤáá á¤áĄááźáąáĄááąáá˝ááş syntax áááş áĄááŽá¸á
ááşááŻáśá¸ááźá
áşáááşá pandas áá˝á
áťááááťáˇáááť readr, ááŹááźá
áşáááŻáˇáá˛áááŻááąáŹáˇ pandas áááşáááˇáşááąááŹáážáááᯠááąááŹááąáŹááşá¸ááśáááŻááşááźáŽá¸ á¤áááşááąáˇááťáşáá˝ááş ááŻááşááąáŹááşááťááşááťáŹá¸ ááááŹá¸á
áŻáá
áşá
áŻááŻáśá¸ ááŤáážáááŤáááşá read_*().
read_csv()read_excel()read_sql()read_json()read_html()
áážááˇáş ááąáŹáşáááşáĄááťááŻá¸ááťááŻá¸ááž áĄááťááşáĄáááşááťáŹá¸ááᯠáááşáááş ááŽáááŻááşá¸ááŻááşááŹá¸ááąáŹ áĄááźáŹá¸ááŻááşááąáŹááşááťááşááťáŹá¸á
á˝áŹá ááŤááąáááˇáş ááťá˝ááşááąáŹáşáááŻáˇáá˛áˇ áááşáá˝ááşááťááşáá˝áąáĄáá˝ááş ááŻáśááąáŹááşááŤáááşá read_table() áááŻáˇáááŻááş read_csv() áĄááźááşá¸áĄááŻáśááᯠáĄááŻáśá¸ááźáŻ á
ááşáááşáᏠááąáŹáşááśááźáŹá¸ááŹá¸ááťááşááᯠáááşáážááşáááşá
Python- pandas áá˝ááş ááąááŹááᯠáá˝ááˇáşááąáááşá
import pandas as pd
ga_nov = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")ááąááŹááąáŹááşááťáŹá¸ áááşááŽá¸ááźááşá¸á
á áŹá¸áá˝á˛ áááŻááşáááşá¸áá áşááťá˝ááşááąáŹáşáááşááŹá¸áá˛áˇ áĄáá˝ááşáá áşááŻáážááááşá ááááşáááŽá¸áááşá ááťáŹá¸ááá˝á˛ááźáŹá¸áážáŻááᯠááááşá¸áááşá¸ááąá¸áááˇáşá
áááŻáˇááąáŹáş áááŽá¸áááş ááťáŹá¸áá áááŻááşáᏠáĄááťááşáĄáááş ááťáŹá¸ááᯠáááŻááᯠáĄáááşááźáąá á˝áŹ áááşááźáááŻááşá áąáááşá áááşáááş ááťáŹá¸á ááŻááşáááş áĄáááşááᯠáĄááŻáśá¸ááźáŻáááˇáşáááşá
ááŤáááŻááŻááşáááŻáˇá ááąáŹáşááś 2 ááąáŹáşááś (ááŻááşáážááˇáş ááťáŹá¸ááĄáááş) áážááˇáş áĄáááşá¸ 2 ááŻááŹáážááááˇáş áááŹá¸ááąá¸áá áşááŻááᯠáááşááŽá¸ááŤáááşá
R- tidyverseá dplyr áá˝ááş ááąááŹááąáŹááşáá áşáᯠáááşááŽá¸ááźááşá¸á
áĄáąáŹááşááąáŹáşááźá፠ááŻááşááá°ááŹáá˝ááşá ááťá˝ááşáŻááşáááŻáˇáááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻá áááŻááťááşááąáŹááąááŹááąáŹááşááᯠáááşááŽá¸ááŤáááşá tibble() .
R: dplyr áá˝ááş ááąááŹááąáŹááşáá áşáᯠáááşááŽá¸ááźááşá¸á
## dplyr
### ŃОСдаŃĐź ŃĐżŃавОŃник
gender <- tibble(id = c(1, 2),
gender = c("female", "male"))R: data.table áá˝ááş ááąááŹááąáŹááşáá áşáᯠáááşááŽá¸ááźááşá¸á
R: data.table áá˝ááş ááąááŹááąáŹááşáá áşáᯠáááşááŽá¸ááźááşá¸á
## data.table
### ŃОСдаŃĐź ŃĐżŃавОŃник
gender <- data.table(id = c(1, 2),
gender = c("female", "male"))
Python- pandas áá˝ááş ááąááŹááąáŹááşáá áşáᯠáááşááŽá¸ááźááşá¸á
Đ pandas áááááşááťáŹá¸áááşááŽá¸ááźááşá¸ááᯠáĄáááˇáşááťáŹá¸á
á˝áŹááźááˇáş ááŻááşááąáŹááşááźáŽá¸á ááááŚá¸á
á˝áŹ ááťá˝ááşáŻááşáááŻáˇáááş áĄááááŹááşáá
áşááŻááᯠáááşááŽá¸ááźáŽá¸ááąáŹááş áĄááááŹááşááᯠááąááŹááąáŹááşáĄááźá
áşáááŻáˇ ááźáąáŹááşá¸áá˛ááŤáááşá
Python- pandas áá˝ááş ááąááŹááąáŹááşáá áşáᯠáááşááŽá¸ááźááşá¸á
# ŃОСдаŃĐź даŃа ŃŃоКП
gender_dict = {'id': [1, 2],
'gender': ["female", "male"]}
# ĐżŃоОйŃаСŃоП ŃНОваŃŃ Đ˛ даŃаŃŃоКП
gender = pd.DataFrame.from_dict(gender_dict)ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
áááşáá˝á˛ááŻááşááąáŹ áááŹá¸ááťáŹá¸áá˝ááş ááąááŹááąáŹáşááś ááŤáááş áááŻáˇáááŻááş ááŹáážááˇáşááťáŽ ááŤáááşáááŻááşáááşá áááŻáˇááąáŹáş áá˝á˛ááźááşá¸á áááşááźáŹáážáŻááᯠááŻááşááąáŹááşáááş á ááşá¸áááşá¸áĄáááŻááşá¸á áááşáááş áĄáááşá¸áĄááźá áşáááŹá¸áá˝ááş ááážááááŻááşááąáŹ ááąáŹáşááśááťáŹá¸áĄáŹá¸ááŻáśá¸ááᯠááááŻáĄááşááŤá

áááŻáˇááźáąáŹááˇáşá áĄáááşá¸áĄááźá áşáááŹá¸ááźááˇáş áááşááŻááşááąáŹááşáááˇáş áááááŻáśá¸ááŻááşááąáŹááşáážáŻáá áşááŻáážáŹ ááááŻáĄááşááąáŹ áĄááťááşáĄáááşááťáŹá¸ááᯠáážááşá¸áááşá¸áááşáážááˇáş á¤áĄááťááşáĄáááşááá°ááŹá¸áááˇáş áááşáááŻááŽááᯠáážááşá¸ááŻááşáááşááźá áşáááşá
R- tidyverseá dplyr áá˝ááş ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
syntax dplyr SQL query language áážááˇáş áĄáá˝ááşáááşáá°áááşá áááşá¸áážááˇáş áááşá¸áážáŽá¸ááŤá á¤áááşááąáˇááşáťááᯠááťááşááźááşá
á˝áŹ ááťá˝ááşá¸ááťááşááááˇáşáááşá
ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşáááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻááŤá select().
áĄáąáŹááşááŤáááşá¸áááşá¸ááťáŹá¸ááźááˇáş ááąáŹáşááśááťáŹá¸ááᯠáááşáá˝áąá¸ááťááşáááŻááşáááˇáş ááŻááşááá°ááŹááťáŹá¸ ááźá áşááŤáááş-
- áááŻáĄááşááąáŹááąáŹáşááśááťáŹá¸ááĄáááşááťáŹá¸áááŻá áŹáááşá¸ááźáŻá áŻááźááşá¸á
- ááŻáśáážááşáĄááŻáśá¸áĄáážáŻááşá¸ááťáŹá¸ááźááˇáş ááąáŹáşááśáĄáááşááťáŹá¸ááᯠáááŻá¸ááŹá¸ááŤá
- ááąáŹáşááśáá˝ááşááŤáážáááąáŹ áĄááťááşáĄáááşá ááąááŹáĄááťááŻá¸áĄá áŹá¸ áááŻáˇáááŻááş áĄááźáŹá¸áááŻááşáááŻááşáážáŻáá áşááŻááŻááźááˇáş
R: dplyr áá˝ááş ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
# ĐŃĐąĐžŃ Đ˝ŃМнŃŃ
ŃŃОНйŃОв
## dplyr
### вŃĐąŃаŃŃ ĐżĐž Đ˝Đ°ĐˇĐ˛Đ°Đ˝Đ¸Ń ŃŃОНйŃОв
select(ga_nov, date, source, sessions)
### иŃкНŃŃŃ ĐżĐž Đ˝Đ°ĐˇĐ˛Đ°Đ˝Đ¸Ń ŃŃОНйŃОв
select(ga_nov, -medium, -bounces)
### вŃĐąŃаŃŃ ĐżĐž ŃогŃĐťŃŃĐ˝ĐžĐźŃ Đ˛ŃŃаМониŃ, ŃŃОйŃŃ Đ¸ĐźĐľĐ˝Đ° кОŃĐžŃŃŃ
СаканŃиваŃŃŃŃ Đ˝Đ° s
select(ga_nov, matches("s$"))
### вŃĐąŃаŃŃ ĐżĐž ŃŃНОвиŃ, вŃйиŃаоП ŃОНŃкО ŃоНОŃиŃНоннŃĐľ ŃŃОНйŃŃ
select_if(ga_nov, is.integer)R- data.table áážá ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
á
á
áşáááşááąá¸ááťáŹá¸áá˝ááşáááşá¸ áĄááŹá¸áá°áááş data.table áĄáááşá¸áááş áá˝á˛ááźáŹá¸á
á˝áŹ ááŻááşááąáŹááşááźáááşá ááąáŹááşá¸ááŤá¸áĄá
áá˝ááş ááťá˝ááşáŻááşáááş á
ááŻáááşá¸áá˝ááşá¸á
áá˝ááşááťáŹá¸áĄáá˝ááşá¸ áááşáááˇáş áĄááźáąáŹááşá¸ááźááťááşááťáŹá¸ áážáááąáááşááᯠááąáŹáşááźááťááş ááąá¸ááŹá¸áááşá data.table.
DT[i,j,by]
áááşáážáŹ:
i - áááşáážáŹáá˛á i.e. áĄáááşá¸áááŻááş á
á
áşááŻááşááźááşá¸á
j - select|update|do, i.e. ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźáŽá¸ áááşá¸áááŻáˇááᯠááźáąáŹááşá¸áá˛ááźááşá¸á
by - ááąááŹáĄáŻááşá
áŻáá˝á˛áˇááźááşá¸á
R- data.table áážá ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
## data.table
### вŃĐąŃаŃŃ ĐżĐž Đ˝Đ°ĐˇĐ˛Đ°Đ˝Đ¸Ń ŃŃОНйŃОв
ga_nov[ , .(date, source, sessions) ]
### иŃкНŃŃŃ ĐżĐž Đ˝Đ°ĐˇĐ˛Đ°Đ˝Đ¸Ń ŃŃОНйŃОв
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### вŃĐąŃаŃŃ ĐżĐž ŃогŃĐťŃŃĐ˝ĐžĐźŃ Đ˛ŃŃаМониŃ
ga_nov[, .SD, .SDcols = patterns("s$")]Variable .SD ááąáŹáşááśááťáŹá¸áĄáŹá¸ááŻáśá¸ááᯠáááşááąáŹááşááźááˇáşáážáŻáááŻááşá
áąááŤáááşá .SDcols ááŻáśáážááşáĄááŻáśá¸áĄáážáŻááşá¸ááťáŹá¸áááŻáĄááŻáśá¸ááźáŻá áááŻáĄááşááąáŹááąáŹáşááśááťáŹá¸ááᯠá
á
áşááŻááşááźááşá¸ áááŻáˇáááŻááş áááşáááŻáĄááşááąáŹááąáŹáşááśááťáŹá¸ááĄáááşááťáŹá¸ááᯠá
á
áşááŻááşáááş áĄááźáŹá¸ááŻááşááąáŹááşááťááşááťáŹá¸á
Pythoná áááşááŤááťáŹá¸áážá ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
áĄáááşááźááˇáş ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşáááş pandas áá°áááŻáˇáá˛áˇ ááŹáááşá
áŹáááşá¸ááᯠááąá¸ááŻáśáá˛áˇ ááŻáśááąáŹááşááŤáááşá ááŻáśáážááşáĄááŻáśá¸áĄáážáŻááşá¸ááťáŹá¸ááᯠáĄááŻáśá¸ááźáŻá ááąáŹáşááśááťáŹá¸ááᯠáĄáááşááźááˇáş áá˝áąá¸ááťááşááźááşá¸ áááŻáˇáááŻááş áááşááŻááşáááşá áááşáááş ááŻááşááąáŹááşááťááşááťáŹá¸ááᯠáĄááŻáśá¸ááźáŻáááş áááŻáĄááşáááşá drop() и filter(), áážááˇáşáááşááźáą áááşáááŻá¸=ááĄáááşá¸ááťáŹá¸áááş ááąáŹáşááśááťáŹá¸ááᯠááŻááşááąáŹááşáááş áááŻáĄááşááźáąáŹááşá¸ áááşáá˝ážááşááźááąáŹá
ááąááŹáĄááťááŻá¸áĄá
áŹá¸áĄáááŻááş áĄáá˝ááşáá
áşááŻááᯠáá˝áąá¸ááťááşáááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻááŤá select_dtypes(), áážááˇáş ááźááşá¸ááŻáśááźááşá¸áááŻáˇ ááŤáááş áááŻáˇáááŻááş ááŻááşáááş áááşáá˝áąá¸ááťááşáááşáááŻáĄááşáááˇáş áĄáá˝ááşááťáŹá¸áážááˇáş áááşáááŻááşáááˇáş ááąááŹáĄááťááŻá¸áĄá
áŹá¸ááťáŹá¸á
áŹáááşá¸ááᯠááąá¸áááŻáˇááŤá
Python- pandas áážá ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
# ĐŃĐąĐžŃ ĐżĐžĐťĐľĐš пО наСваниŃ
ga_nov[['date', 'source', 'sessions']]
# ĐŃкНŃŃиŃŃ ĐżĐž наСваниŃ
ga_nov.drop(['medium', 'bounces'], axis=1)
# ĐŃĐąŃаŃŃ ĐżĐž ŃогŃĐťŃŃĐ˝ĐžĐźŃ Đ˛ŃŃаМониŃ
ga_nov.filter(regex="s$", axis=1)
# ĐŃĐąŃаŃŃ ŃиŃНОвŃĐľ пОНŃ
ga_nov.select_dtypes(include=['number'])
# ĐŃĐąŃаŃŃ ŃокŃŃОвŃĐľ пОНŃ
ga_nov.select_dtypes(include=['object'])áááşá¸á áŽá á áşááźááşá¸á
áĽáááŹáĄáŹá¸ááźááˇáşá áĄáááşá¸áĄááźá áşáááŹá¸áá˝ááş ááąááŹáážá áşááąáŤááşá¸ááťáŹá¸á á˝áŹ ááŤáááşáááŻááşááąáŹáşáááşá¸ áááşáááş ááźáŽá¸áá˛áˇááąáŹáááᯠáá˝á˛ááźááşá¸á áááşááźáŹáááşáᏠáááŻáĄááşáááşá áá áşáááşá áĄáááŻáááŻááşá¸ááťáŹá¸áááş ááąááŹááŻááşááąáŹááşááźááşá¸ááŻááşáááşá¸á ááşááᯠáážáąá¸áá˝áąá¸á áąááźáŽá¸ PC áááşáááŻááŽááᯠááááşáááŻáˇá áąáááşá

R- tydyverseá dplyr áá˝ááş áĄáááşá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
Đ dplyr áĄáááşá¸ááťáŹá¸ááᯠá
á
áşááŻááşáááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻáááşá filter(). áááşá¸áááş ááááĄááźááşá¸áĄááŻáśáĄááźá
áş ááąááŹááąáŹááşáá
áşááŻáá°áááşá áááŻáˇááąáŹááş á
á
áşááŻááşáážáŻáĄááźáąáĄááąááťáŹá¸ááᯠá
áŹáááşá¸ááźáŻá
áŻááŤá
áááŹá¸áá áşááŻáĄáŹá¸ á á áşááŻááşáááş ááŻáášááááąááĄááŻáśá¸áĄáážáŻááşá¸ááťáŹá¸ááᯠááąá¸ááŹá¸áááˇáşáĄááŤá á¤ááá ášá áá˝ááşá áááŻá¸ááŹá¸ááźááşá¸ááážááᲠááąáŹáşááśáĄáááşááťáŹá¸áážááˇáş áááŹá¸áĄáááşááᯠáááźáąááźáŹáᲠáááşáážááşááŤá
á á áşááŻááşáááş ááŻáášááááąááĄááŻáśá¸áĄáážáŻááşá¸ááťáŹá¸á á˝áŹááᯠáĄááŻáśá¸ááźáŻááąáŹáĄááŤá áĄáąáŹááşááŤáĄáąáŹáşáááąááŹááťáŹá¸ááᯠáĄááŻáśá¸ááźáŻááŤá
- & áááŻáˇáááŻááş ááąáŹáşáᏠ- ááŻáášáááááşááąáŹ AND
- | - ááŻáášáá OR
R: dplyr áá˝ááş áĄáááşá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
# ŃиНŃŃŃаŃĐ¸Ń ŃŃŃОк
## dplyr
### ŃиНŃŃŃаŃĐ¸Ń ŃŃŃОк пО ĐžĐ´Đ˝ĐžĐźŃ ŃŃНОвиŃ
filter(ga_nov, source == "google")
### ŃиНŃŃŃ ĐżĐž двŃĐź ŃŃНОвиŃĐź ŃОодинŃннŃĐź НОгиŃĐľŃкиП и
filter(ga_nov, source == "google" & sessions >= 10)
### ŃиНŃŃŃ ĐżĐž двŃĐź ŃŃНОвиŃĐź ŃОодинŃннŃĐź НОгиŃĐľŃкиП иНи
filter(ga_nov, source == "google" | sessions >= 10)R- data.table áá˝ááş áĄáááşá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
áĄáááşáážáŹ ááąá¸áá˛áˇááááŻáá˛á data.table ááąááŹáá°á¸ááźáąáŹááşá¸ááźááşá¸áááŻááşáᏠáĄááŹá¸áĄáááŻááᯠá
ááŻáááşá¸áá˝ááşá¸á
áá˝ááşááťáŹá¸áá˝ááş áááˇáşáá˝ááşá¸ááŹá¸áááşá
DT[i,j,by]
áááşáážáŹ:
i - áááşáážáŹáá˛á i.e. áĄáááşá¸áááŻááş á
á
áşááŻááşááźááşá¸á
j - select|update|do, i.e. ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźáŽá¸ áááşá¸áááŻáˇááᯠááźáąáŹááşá¸áá˛ááźááşá¸á
by - ááąááŹáĄáŻááşá
áŻáá˝á˛áˇááźááşá¸á
áĄáááşá¸ááťáŹá¸ááᯠá á áşááŻááşáááş áĄááźáąáŹááşá¸ááźááťááşááᯠáĄááŻáśá¸ááźáŻáááşá iá ááŻáááşá¸áá˝ááşá¸á áĽáşáá˝ááş áááááąááŹááŤáážááááşá
ááąáŹáşááśááťáŹá¸ááᯠáááŻá¸ááŹá¸áážááşááťáŹá¸áááŤáᲠáááŹá¸áĄáááşááááşáážááşáᲠááŻáášáááážáááąáŹáĄááŻáśá¸áĄáážáŻááşá¸ááťáŹá¸áá˝ááş áááşááąáŹááşááźááˇáşáážáŻáááşá
ááŻáášááááąááĄááŻáśá¸áĄáážáŻááşá¸ááťáŹá¸áááş áá˝ááşáá˛áˇáááŻáˇáááş áá
áşááŻáážááˇáşáá
áşáᯠáááşá
ááşááąáááşá dplyr & áážááˇáş | áĄáąáŹáşáááąááŹááťáŹá¸áážááááˇáşá
R- data.table áá˝ááş áĄáááşá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
## data.table
### ŃиНŃŃŃаŃĐ¸Ń ŃŃŃОк пО ĐžĐ´Đ˝ĐžĐźŃ ŃŃНОвиŃ
ga_nov[source == "google"]
### ŃиНŃŃŃ ĐżĐž двŃĐź ŃŃНОвиŃĐź ŃОодинŃннŃĐź НОгиŃĐľŃкиП и
ga_nov[source == "google" & sessions >= 10]
### ŃиНŃŃŃ ĐżĐž двŃĐź ŃŃНОвиŃĐź ŃОодинŃннŃĐź НОгиŃĐľŃкиП иНи
ga_nov[source == "google" | sessions >= 10]Python- pandas áážá ááźááŻá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
áĄáááşá¸áĄáááŻááş á
á
áşááŻááşááŤá pandas filtering áá˛áˇ áááşáá°ááŤáááşá data.tableáážááˇáş á
ááŻáááşá¸áá˝ááşá¸á
áĽáşááťáŹá¸ááźááˇáş ááźáŻááŻááşáááşá
á¤ááá
ášá
áá˝ááşá ááąááŹááąáŹááşáĄáááşááᯠáá˝ážááşááźááźááşá¸ááźááˇáş ááąáŹáşááśááťáŹá¸áááŻáˇáááşááąáŹááşáá˝ááˇáşááᯠááąáŹáşááśáĄáááşááᯠá
ááŻáááşá¸áá˝ááşá¸á
áá˝ááşááťáŹá¸áá˝ááş áááŻá¸ááŹá¸áĄáážááşáĄááŹá¸áĄááźá
áş áá˝ážááşááźáááŻááşáááş (ááá°áᏠdf['col_name']) áááŻáˇáááŻááş (ááŹáááźáŽá¸ááąáŹááşáááŻá¸ááŹá¸ááźááşá¸ááážááá˛áááá°áᏠdf.col_name).
áĄááźáąáĄááąááťáŹá¸á
á˝áŹááźááˇáş ááąááŹááąáŹááşáá
áşááŻááᯠá
á
áşááŻááşáááş áááŻáĄááşááŤáá áĄááźáąáĄááąáá
áşááŻá
áŽááᯠáá˝ááşá¸á
áĽáşáá˝ááş áááˇáşáá˝ááşá¸áááŤáááşá ááŻáášáááĄááźáąáĄááąááťáŹá¸áááş áĄáąáŹáşáááąááŹááťáŹá¸ááž áá
áşááŻáážááˇáşáá
áşáᯠááťáááşáááşááŹá¸áááşá & и |.
Python- pandas áážá ááźááŻá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
# ФиНŃŃŃаŃĐ¸Ń ŃŃŃОк ŃайНиŃŃ
### ŃиНŃŃŃаŃĐ¸Ń ŃŃŃОк пО ĐžĐ´Đ˝ĐžĐźŃ ŃŃНОвиŃ
ga_nov[ ga_nov['source'] == "google" ]
### ŃиНŃŃŃ ĐżĐž двŃĐź ŃŃНОвиŃĐź ŃОодинŃннŃĐź НОгиŃĐľŃкиП и
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### ŃиНŃŃŃ ĐżĐž двŃĐź ŃŃНОвиŃĐź ŃОодинŃннŃĐź НОгиŃĐľŃкиП иНи
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]áĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąááŹá áŻááąáŤááşá¸ááźááşá¸á
ááąááŹáá˝á˛ááźááşá¸á áááşááźáŹáážáŻáá˝ááş áĄááŻáśá¸áĄááťáŹá¸ááŻáśá¸ááŻááşááąáŹááşáážáŻáá áşááŻáážáŹ áĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąáŤááşá¸á ááşá¸ááźááşá¸ ááźá áşáááşá

á¤ááŻááşáááşá¸ááąáŹááşááŹááťáŹá¸ááᯠááŻááşááąáŹááşáááşáĄáá˝ááş syntax áááş ááťá˝ááşáŻááşáááŻáˇááŻáśá¸áááşáááˇáş áááşááąáˇááşáťáĄáŹá¸ááŻáśá¸áá˝ááş ááźááˇáşááťá˛ááąááŤáááşá
á¤ááá ášá áá˝ááşá ááťá˝ááşáŻááşáááŻáˇáááş ááá°ááŹáĄááźá áş dataframe áááŻáá°ááŤáááşá áááŻááşáááşá¸áá áşá cabin class ááąáŤáşáá°áááşá áááşáážááşáĄááąáĄáá˝ááşáážááˇáş ááťááşá¸ááťážááŻááşááťá ááááşááᯠáá˝ááşááťááşááŤá
R- tidyverseá dplyr áá˝ááş ááąááŹááťáŹá¸ááᯠáĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąáŤááşá¸á ááşá¸ááźááşá¸á
Đ dplyr ááŻááşááąáŹááşááťááşááᯠáĄáŻááşá
áŻáá˝á˛áˇáááşáĄáá˝ááş áĄááŻáśá¸ááźáŻáááşá group_by()áážááˇáş á
áŻá
ááşá¸áážáŻ summarise(). ááááşááąáŹáˇ, dplyr ááŻááşááąáŹááşááťááş ááááŹá¸á
áŻáá
áşá
áŻááŻáśá¸áážáááŤáááşá summarise_*()áááŻáˇááąáŹáş á¤ááąáŹááşá¸ááŤá¸á áááşáá˝ááşááťááşáážáŹ áĄááźáąááśáĄááŹá¸áĄáááŻááᯠáážááŻááşá¸áážááşáááşááźá
áşáááşá áááŻáˇááźáąáŹááˇáş ááťá˝ááşáŻááşáááŻáˇáááş áááŻáá˛áˇáááŻáˇááąáŹ ááąáŹáááşáá˛áááŻáˇ ááá˝áŹá¸ááŤá
áĄááźáąááśá áŻááąáŤááşá¸ááŻááşááąáŹááşááťááşááťáŹá¸
sum()- áĄáážá áşááťáŻááşmin()/max()- áĄáááşá¸ááŻáśá¸áážááˇáşáĄááźááˇáşááŻáśá¸áááşáááŻá¸mean()- ááťááşá¸ááťážmedian()- ááťááşá¸ááťážlength()- áááŹá
R: dplyr áá˝ááş áĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąáŤááşá¸á ááşá¸ááźááşá¸á
## dplyr
### ĐłŃŃппиŃОвка и агŃогаŃĐ¸Ń ŃŃŃОк
group_by(titanic, Pclass) %>%
summarise(passangers = length(PassengerId),
avg_price = mean(Fare))ááŻááşááąáŹááşáááş group_by() ááááĄááźááşá¸áĄááŻáśáĄááźá
áş áááŹá¸ááᯠááťáąáŹáşááźááşáá˛áˇáááşá áááŻááşáááşá¸áá
áşááźáŽá¸ááąáŹáˇ áĄáá˝ááşáááŻáá˝ážááşááźáááşá Pclassááťá˝ááşáŻááşáááŻáˇáá
áŹá¸áá˝á˛ááᯠáĄáŻááşá
áŻáá˝á˛áˇááŤáááşá áĄáąáŹáşáááąááŹáĄááŻáśá¸ááźáŻá á¤ááŻááşááąáŹááşááťááşáááááş %>% function áááŻáˇ ááááĄááźááşá¸áĄááŻáśáĄááźá
áş ááťáąáŹáşáá˝áŹá¸áááşá summarise()áážááˇáş ááąáŹááşáááş áĄáá˝ááş 2 áᯠáááşáááˇáşáááş- áááŽá¸áááşááťáŹá¸ и avg_á
áťáąá¸áážáŻááşá¸. ááááŚá¸ááŻáśá¸ function ááᯠáĄááŻáśá¸ááźáŻ length() áááşáážááşáĄááąáĄáá˝ááşááᯠáá˝ááşááťááşááźáŽá¸ ááŻááááá˝ááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻáááşá mean() ááťááşá¸ááťážáááşáážááşá
áťáąá¸áážáŻááşá¸áááŻáááşááśááážááá˛áˇáááşá
R: data.table áá˝ááş ááąááŹááťáŹá¸ááᯠáĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąáŤááşá¸á ááşá¸ááźááşá¸á
Đ data.table áĄááźááşá¸áĄááŻáśááᯠááąáŤááşá¸á
ááşá¸áááşáĄáá˝ááş áĄááŻáśá¸ááźáŻáááşá j áááşá¸áááş á
ááŻáááşá¸áá˝ááşá¸áá˝ááşá¸ááťáŹá¸áážááˇáş áĄáŻááşá
áŻáá˝á˛áˇáážáŻáĄáá˝ááş ááŻáááááąááŹáážááááşá by áááŻáˇáááŻááş keybyááááááŹáá°á¸áááŹá¸áá˛áˇá
á¤ááá
ášá
áá˝ááş á
áŻá
ááşá¸áážáŻááŻááşááąáŹááşááťááşááťáŹá¸á
áŹáááşá¸áááş áá˝ááşááąáŹáşááźááŹá¸áááˇáşáĄááŹáážááˇáş áá°ááŽááŤáááşá dplyr, ááŹááźá
áşáááŻáˇáá˛áááŻááąáŹáˇ áááşá¸áááŻáˇáááş áĄááźáąááś R syntax ááž ááŻááşááąáŹááşááťááşááťáŹá¸ááźá
áşáááşá
R: data.table áá˝ááş áĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąáŤááşá¸á ááşá¸ááźááşá¸á
## data.table
### ŃиНŃŃŃаŃĐ¸Ń ŃŃŃОк пО ĐžĐ´Đ˝ĐžĐźŃ ŃŃНОвиŃ
titanic[, .(passangers = length(PassengerId),
avg_price = mean(Fare)),
by = Pclass]Python- pandas áá˝ááş ááąááŹááťáŹá¸ááᯠáĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąáŤááşá¸á ááşá¸ááźááşá¸á
áĄáŻááşá
áŻáá˝á˛áˇááźááşá¸á pandas áĄááŹá¸áá° dplyrááŤááąáááˇáş á
áŻá
ááşá¸áážáŻáᏠááá°ááŤáá°á¸á dplyr ááá˝ááˇáşá፠data.table.
áĄáŻááşá
áŻáá˝á˛áˇáááş áááşá¸áááşá¸ááᯠáĄááŻáśá¸ááźáŻááŤá groupby()ááąááŹááąáŹááşááᯠáĄáŻááşá
áŻáá˝á˛áˇáááˇáş ááąáŹáşááśá
áŹáááşá¸ááᯠáááşááźááşáááşá¸áááş áááŻáĄááşáááşá
ááąáŤááşá¸á
ááşá¸áááşáĄáá˝ááş áááşáááşá¸áááşá¸ááᯠáĄááŻáśá¸ááźáŻáááŻááşáááşá agg()áĄááááŹááşááᯠáááşááśáááşá áĄááááŹááşááąáŹáˇááťáŹá¸áááş á
áŻá
ááşá¸áážáŻááŻááşááąáŹááşááťááşááťáŹá¸ááᯠáááşáĄááŻáśá¸ááźáŻáááˇáş ááąáŹáşááśááťáŹá¸ááźá
áşááźáŽá¸ áááşáááŻá¸ááťáŹá¸áááş á
áŻá
ááşá¸áážáŻááŻááşááąáŹááşááťááşááťáŹá¸á áĄáááşááťáŹá¸ááźá
áşáááşá
á áŻá ááşá¸áážáŻááŻááşááąáŹááşááťááşááťáŹá¸-
sum()- áĄáážá áşááťáŻááşmin()/max()- áĄáááşá¸ááŻáśá¸áážááˇáşáĄááźááˇáşááŻáśá¸áááşáááŻá¸mean()- ááťááşá¸ááťážmedian()- ááťááşá¸ááťážcount()- áááŹá
ááŻááşááąáŹááşááťááş reset_index() áĄáąáŹááşááąáŹáşááźá፠áĽáááŹáá˝ááş áááşá¸ááᯠnested áĄáá˝ážááşá¸ááťáŹá¸ááᯠááźááşáááşáááşáážááşáááş áĄááŻáśá¸ááźáŻáááşá pandas ááąááŹááąáŤááşá¸á
ááşá¸ááźáŽá¸ááąáŹááş ááŻáśááąááźá
áşáááşá
áĄááááşá¸áĄáážááş ááąáŹááşáá
áşááźáąáŹááşá¸ááᯠáá˝ážáąáˇáááŻááşááááşá
Python - áááşááŤááťáŹá¸áá˝ááş áĄáŻááşá áŻáá˝á˛áˇááźááşá¸áážááˇáş á áŻá ááşá¸ááźááşá¸á
# ĐłŃŃппиŃОвка и агŃогаŃĐ¸Ń Đ´Đ°Đ˝Đ˝ŃŃ
titanic.groupby(["Pclass"]).
agg({'PassengerId': 'count', 'Fare': 'mean'}).
reset_index()áááŹá¸ááťáŹá¸áááąáŤááşáááŻááşááťáááşáááşáážáŻ
áá°ááŽááąáŹáá˝á˛áˇá ááşá¸ááŻáśá áááŹá¸áážá áşáᯠáááŻáˇáááŻááş áááŻáˇáááşáááŻááąáŹ áááŹá¸ááťáŹá¸áá˝ááş áááşááŤáááşáááˇáş ááŻááşááąáŹááşáážáŻáá áşááŻá ááťá˝ááşáŻááşáááŻáˇáááşááŹá¸ááąáŹááąááŹáá˝ááş áááŹá¸ááťáŹá¸ááŤáážááááşá ga_nov и ga_dec. á¤áááŹá¸ááťáŹá¸áááş áá˝á˛áˇá ááşá¸ááŻáśáá˝ááş áá°ááŽááźáááşá áĽáááŹá áá°ááŽááąáŹááąáŹáşááśááťáŹá¸áážááˇáş á¤ááąáŹáşááśááťáŹá¸áá˝ááş ááąááŹáĄááťááŻá¸áĄá áŹá¸ááťáŹá¸áážááááşá

áááşá¸áááş áááŻáááşááŹááážááˇáş ááŽáááşááŹáááťáŹá¸áĄáá˝ááş Google Analytics ááž áĄááşááŻááşáááşááźááşá¸ááźá áşááźáŽá¸ á¤ááášááá˝ááş á¤ááąááŹááᯠáááŹá¸áá áşááŻáĄááźá áş ááąáŤááşá¸á ááşááŤáááşá
R- tidyverseá dplyr áá˝ááş áááŹá¸ááťáŹá¸ááᯠááąáŤááşáááŻááşááťáááşáááşááźááşá¸á
Đ dplyr ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻá áááŹá¸ á ááŻááᯠáá
áşááŻáááşá¸áĄááźá
áş ááąáŤááşá¸á
ááşáááŻááşáááşá bind_rows()áĄááźááşá¸áĄááŻáśááťáŹá¸áĄááźá
áş á
áŹá¸áá˝á˛ááťáŹá¸ááźááşáá˝áŹá¸ááźááşá¸á
R: dplyr áá˝ááş áĄáááşá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
# ĐĐľŃŃикаНŃнОо ОйŃодинонио ŃайНиŃ
## dplyr
bind_rows(ga_nov, ga_dec)R- data.table áá˝ááş áááŹá¸ááťáŹá¸ááᯠááąáŤááşáááŻááşááťáááşáááşááźááşá¸á
ááŹááž ááážáŻááşáá˝áąá¸ááŤáá°á¸á ááŻáśá¸ááźááˇáşááĄáąáŹááş rbind().
R- data.table áá˝ááş áĄáááşá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
## data.table
rbind(ga_nov, ga_dec)Python- pandas áá˝ááş ááąáŤááşáááŻááş áááŹá¸ááťáŹá¸ ááťáááşáááşááźááşá¸á
Đ pandas áááŹá¸ááťáŹá¸ááᯠááťáááşáááşáááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻáááşá concat()áááşá¸áááŻáˇááᯠááąáŤááşá¸á
ááşáááş ááąáŹááşááťáŹá¸á
áŹáááşá¸ááᯠáááşááźááşáááşá¸áááş áááŻáĄááşáááşá
Python- pandas áážá ááźááŻá¸ááťáŹá¸ááᯠá á áşááŻááşááźááşá¸á
# воŃŃикаНŃнОо ОйŃодинонио ŃайНиŃ
pd.concat([ga_nov, ga_dec])áááŹá¸ááťáŹá¸á áĄááťáŹá¸áááŻááş ááťáááşáááşáážáŻ
ááŻááááážááąáŹáşááśááťáŹá¸ááᯠááąáŹáˇááźááˇáşááááááŹá¸áááŻáˇáááˇáşáááˇáşááŻááşááąáŹááşáážáŻáá áşááŻá áááşáá˝ážááşá¸ááąááŹáĄááťááŻáˇ (áĽáááŹá ááŻááşááŻááşáá áşááŻá ááŻááşááťá ááááş) ááźááˇáş áĄááťááşáĄáááşáááŹá¸ (áĽáááŹá áĄááąáŹááşá¸ááąááŹááŤááąáŹ áááŹá¸) ááᯠááźááˇáşáááşá¸áááˇáşáĄá፠áááşá¸ááᯠáááźáŹáá áĄááŻáśá¸ááźáŻááąáˇáážááááşá

Join áĄááťááŻá¸áĄá áŹá¸ááťáŹá¸á á˝áŹáážáááŤáááş-

áĄáááşá áááşááŹá¸áá˛áˇ áááŹá¸áá˛áážáŹ áááŻááşáááşá¸áá áş ááťá˝ááşáŻááşáááŻáˇáá˝ááş ááąáŹáşááśáá áşááŻáážááááşá ááááşáááŽá¸áááşá ááááşááŻááşáážááˇáş áááŻááşááŽááąáŹá
1 - áĄááťááŻá¸áááŽá¸
2 - ááąáŹááşáťáŹá¸
áááŻáˇáĄááźááşá ááťá˝ááşáŻááşáááŻáˇáááş áááŹá¸áá áşááŻâáááŻá¸ááŹá¸ááąáŹá áŹáĄáŻááşááᯠáááşááŽá¸ááŹá¸áááşá ááťáŹá¸, á. áááŽá¸áááşááťáŹá¸á ááťáŹá¸ááááŻááşáᏠáĄááťááşáĄáááşááťáŹá¸ááᯠáááŻáááŻáĄáááşááźáąá á˝áŹ áááşááźáááŻááşá áąáááşáĄáá˝ááş áááşá¸áá˝ážááşááž ááťáŹá¸áá áĄáááşááᯠáááˇáşáá˝ááşá¸áááş áááŻáĄááşááŤáááşá ááťáŹá¸, á á áŹá¸áá˝á˛ááŽáááŻáˇ áááŻááşáááşá¸áá áş.
áĄááťáŹá¸áááŻááşáááŹá¸áááş R- tidyverseá dplyr áá˝ááşááŤáááşááŤáááşá
Đ dplyr áĄááťáŹá¸áááŻááşááťáááşáááşááźááşá¸áĄáá˝ááş ááŻááşááąáŹááşááťááşááťáŹá¸ ááááŹá¸á
áŻáá
áşá
áŻááŻáśá¸ áážáááŤáááşá
inner_join()left_join()right_join()full_join()semi_join()nest_join()anti_join()
ááťá˝ááşáŻááşááĄááąáˇáĄááťááˇáşáá˝ááş áĄááŻáśá¸áĄááťáŹá¸ááŻáśá¸áážáŹ left_join().
ááááĄááźááşá¸áĄááŻáśáážá áşááŻáĄááąááźááˇáşá áĄáááşááąáŹáşááźááŤááŻááşááąáŹááşááťááşááťáŹá¸áááş áááŹá¸áážá áşááŻááŤáááşáááşá áááááĄááźááşá¸áĄááŻáśáĄááźá áşá by ááŤáááşáááş ááąáŹáşááśááťáŹá¸ááᯠáááşáážááşáááŤáááşá
áĄááťáŹá¸áááŻááşáááŹá¸áááş R: dplyr áá˝ááş ááŤáááşáááşá
# ОйŃодинŃоП ŃайНиŃŃ
left_join(titanic, gender,
by = c("Sex" = "id"))R- data.table áážá áááŹá¸ááťáŹá¸á áĄááťáŹá¸áááŻááş ááťáááşáááşáážáŻ
Đ data.table ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻá á
áŹá¸áá˝á˛ááťáŹá¸ááᯠááąáŹáˇááźááˇáş ááťáááşáááşáááş áááŻáĄááşáááşá merge().
data.table áá˝ááş merge() ááŻááşááąáŹááşáááş áĄááźáąáŹááşá¸ááźááťááşááťáŹá¸
- xá y â ááŤáááşáááş áááŹá¸ááťáŹá¸
- by â áááŹá¸áážá áşááŻá ááŻáśá¸áá˝ááş ááŹáááşáá°ááŤá ááŤáááşáááşááąáŹáˇááźá áşáááˇáş ááąáŹáşááś
- by.xá by.y â áááŹá¸ááťáŹá¸áá˝ááş ááá°ááŽááąáŹáĄáááşááťáŹá¸áážáááŤá ááąáŤááşá¸á ááşááááˇáşááąáŹáşááśáĄáááşááťáŹá¸
- all, all.x, all.y â Join áĄááťááŻá¸áĄá áŹá¸á áĄáŹá¸ááŻáśá¸áááş áááŹá¸áážá áşááŻááŻáśá¸ááž áĄáááşá¸áĄáŹá¸ááŻáśá¸ááᯠááźááşááąá¸áááşá all.x áááş LEFT JOIN ááŻááşááąáŹááşááťááşáážááˇáş áááŻááşááŽáááş (ááááááŹá¸ááĄáááşá¸áĄáŹá¸ááŻáśá¸ááᯠááťááşááŹá¸áááş) all.y â áááş áááşá¸áážááˇáş áááşáááŻááşáááş RIGHT JOIN ááŻááşááąáŹááşááťááş (ááŻááááááŹá¸ááĄáááşá¸áĄáŹá¸ááŻáśá¸ááᯠááťááşááŹá¸áá˛áˇáááş)á
R- data.table áážá áááŹá¸ááťáŹá¸á áĄááťáŹá¸áááŻááş ááťáááşáááşáážáŻ
# ОйŃодинŃоП ŃайНиŃŃ
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)áĄááťáŹá¸áááŻááşáááŹá¸áá˝ááş Python-áááşááŤááťáŹá¸ ááŤáááşááŤá
áĄááźááşá data.tableáá˝ááş pandas áááŹá¸ááťáŹá¸ááᯠááťáááşáááşáááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻáááşá merge().
áááşááŤááťáŹá¸áá˝ááş merge() ááŻááşááąáŹááşááťááşá áĄááźáąáŹááşá¸ááźááťááşááťáŹá¸
- áááşáá˛áˇáááŻáˇ â ááťáááşáááşáážáŻáĄááťááŻá¸áĄá áŹá¸- áááşá ááŹá áĄááźááşá áĄáá˝ááşá¸
- on â áááŹá¸áážá áşááŻá ááŻáśá¸áá˝ááş ááŹáááşáá°ááŤá ááąáŹáˇáá áşááŻááźá áşáááşá
- left_oná right_on â áááŹá¸ááťáŹá¸áá˝ááş ááá°ááŽááąáŹáĄáááşááťáŹá¸áážáááŤá ááąáŹáˇááąáŹáşááśááťáŹá¸ááĄáááşááťáŹá¸
áĄááťáŹá¸áááŻááşáááŹá¸áá˝ááş Python-áááşááŤááťáŹá¸ ááŤáááşááŤá
# ОйŃодинŃоП пО кНŃŃŃ
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")áĄááźáąááśáááşá¸áááŻá¸ááŻááşááąáŹááşááťááşááťáŹá¸áážááˇáş áá˝ááşááťááşááŹá¸ááąáŹ ááąáŹáşááśááťáŹá¸
Window ááŻááşááąáŹááşááťááşááťáŹá¸áááş á áŻá ááşá¸áážáŻááŻááşááąáŹááşááťááşááťáŹá¸áážááˇáş áĄáááášááŤááşáááşáá°ááźáŽá¸ ááąááŹáá˝á˛ááźááşá¸á áááşááźáŹáážáŻáá˝ááşáááşá¸ áááźáŹáááĄááŻáśá¸ááźáŻááźáááşá áááŻáˇááąáŹáş á áŻá ááşá¸áážáŻááŻááşááąáŹááşááťááşááťáŹá¸áážááˇáşááá°áá˛á áááşá¸áááŻá¸ááŻááşááąáŹááşááťááşááťáŹá¸áááş ááąááŹááąáŹááşá áĄáááşá¸áĄááąáĄáá˝ááşááᯠááźáąáŹááşá¸áá˛ááźááşá¸ááážáááŤá

áĄááźáąááśáĄáŹá¸ááźááˇáşá áááşá¸áááŻá¸ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻá ááťá˝ááşáŻááşáááŻáˇáááş á áśáááşáážááşááťááşáĄááťááŻáˇáĄá áááşááŹááąáŹááąááŹááąáŹááşááᯠáĄáááŻááşá¸ááťáŹá¸áĄááźá áş áááŻááşá¸ááźáŹá¸ááŹá¸áááşá áĄáá˝ááşáá áşááŻááááşáááŻá¸ áááŻáˇáááŻááş áĄáá˝ááşááťáŹá¸á á˝áŹááźááˇáşá áááşá¸áááŻá¸áá áşááŻá áŽáá˝ááş ááááşá¸áááşášááťáŹáááŻááşáᏠááŻááşááąáŹááşááťááşááťáŹá¸ááᯠááŻááşááąáŹááşááŤáááşá á¤ááŻááşááąáŹááşááťááşááťáŹá¸á ááááşááᯠá áŹááźáąáŹááşá¸áá áşááŻá áŽáá˝ááş ááźááşááąá¸áááşá áááŻáááŻáááşáážáŹá áááŹá¸áážá áĄáááşá¸ á áŻá áŻááąáŤááşá¸ áĄááąáĄáá˝ááşááᯠáááźáąáŹááşá¸áá˛áá˛á
áĽááᏠá áŹá¸áá˝á˛ááᯠááźááˇáşááĄáąáŹááş áááŻááşáááşá¸áá áş. áááşá¸á cabin class áĄáá˝ááşá¸ áááşáážááşáá áşááŻá áŽá ááŻááşááťá ááááş áááşááťáž ááŹáááŻááşáážáŻááşá¸ááᯠááťá˝ááşáŻááşáááŻáˇ áá˝ááşááťááşáááŻááşááŤáááşá
ááŤáááŻááŻááşáááŻáˇá ááŽáááŻááşá¸áážáŹáážááá˛áˇ áááşáážááşáááŻááşáááŻááşáá˛áˇ áááşáážá cabin class áĄáá˝ááş áááşáážááşá áŻá áŻááąáŤááşá¸ááŻááşááťá ááááşááᯠáááŻááşá¸áá áşááźáąáŹááşá¸ááťááşá¸á áŽáážáŹ ááá°ááážáŹ ááźá áşááźáŽá¸ áááşáážááşáá áşááŻááťááşá¸á áŽáá˛áˇ ááŻááşááťá ááááşááᯠáá°ááŽáá˛áˇ cabin class áááşáážááşáĄáŹá¸ááŻáśá¸áá˛áˇ á áŻá áŻááąáŤááşá¸ááŻááşááťá ááááşáá˛áˇ áá˝á˛áááŻááşááŤá .
R- tidyverseá dplyr áá˝ááş Window ááŻááşááąáŹááşááťááşááťáŹá¸
áĄáááşá¸áĄáŻááşá
áŻáá˝á˛áˇááźááşá¸ááᯠáááŻáśá¸áᲠááąáŹáşááśáĄáá
áşááťáŹá¸áááˇáşáááşá dplyr function áááŻááąáŹááşáá˝ááşááąá¸áááşá mutate().
áĄáááşááąáŹáşááźá፠ááźáżááŹááᯠáááşáááşáĄáááŻááş ááąááŹáĄáŻááşá áŻáá˝á˛áˇááźááşá¸ááźááˇáş áááşááźáąáážááşá¸áááŻááşááŤáááşá Pclass ááąáŹáşááśáĄáá áşáá áşááŻáá˝ááş áĄáá˝ááşááᯠááąáŤááşá¸á ááşá¸ááŤá áĄá. áááŻáˇááąáŹááş áááŹá¸ááᯠáĄáŻááşá áŻáá˝á˛ááźáŽá¸ áĄáá˝ááşáááşáááŻá¸ááťáŹá¸ááᯠáá˝á˛ááŤá áĄá ááááşáĄáááˇáşáá˝ááş ááźá áşááťááşáá˛áˇáááşá
R: dplyr áá˝ááş Window ááŻááşááąáŹááşááťááşááťáŹá¸
group_by(titanic, Pclass) %>%
mutate(Pclass_cost = sum(Fare)) %>%
ungroup() %>%
mutate(ticket_fare_rate = Fare / Pclass_cost)R: data.table áážá Window ááŻááşááąáŹááşááťááşááťáŹá¸
ááźáąáážááşá¸ááťááş algorithm áááş áá˝ááşáážáááá˛áˇáááŻáˇ áá°ááŽááąááŤáááşá dplyráááŹá¸ááᯠáĄáá˝ááşáĄáááŻááş ááźáááşá¸ááąáŤááşááťáŹá¸áĄááźá
áş áá˝á˛áááş áááŻáĄááşáááşá Pclass. áĄáááşá¸áá
áşááŻá
áŽáážááˇáş áááşáááŻááşáááˇáş áĄáá˝á˛áˇáĄáá˝ááş áááŹáááᯠááąáŹáşááśáĄáá
áşáá
áşááŻáá˝ááş ááŻááşááąá¸ááźáŽá¸ áááşá¸ááĄáá˝á˛áˇáážá áááşáážááşáá
áşááŻá
áŽá ááŻááşááťá
ááááşááąá
áŻááᯠáá˝ááşááťááşáááˇáş ááąáŹáşááśáá
áşááŻááᯠááąáŤááşá¸áááˇáşááŤá
ááąáŹáşááśáĄáá
áşááťáŹá¸áááˇáşáááş data.table áĄáąáŹáşáááąáᏠáá
ášá
áŻáášáááş :=. áĄáąáŹááşáá˝ááş áááşááąáˇááťáşááᯠáĄááŻáśá¸ááźáŻá ááźáżááŹáá
áşááŻááᯠááźáąáážááşá¸ááźááşá¸ áĽáááŹáá
áşááŻááźá
áşáááşá data.table
R: data.table áážá Window ááŻááşááąáŹááşááťááşááťáŹá¸
titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost),
by = Pclass]Python- pandas áážá Window ááŻááşááąáŹááşááťááşááťáŹá¸
ááąáŹáşááśáĄáá
áşáááˇáşáááş áááşá¸áááşá¸áá
áşáᯠpandas - function áááŻááŻáśá¸ááŤá assign(). áĄáááşá¸ááťáŹá¸áĄáŻááşá
áŻáá˝á˛áˇááźááşá¸ááážááᲠcabin áĄáááşá¸áĄáááŻááş áááşáážááşááťáŹá¸áááŻááşááťá
ááááşááᯠáĄááťááşá¸ááťáŻááşáááşá ááťá˝ááşáŻááşáááŻáˇáááş ááŻááşááąáŹááşááťááşááᯠáĄááŻáśá¸ááźáŻááŤáááşá transform().
áĄáąáŹááşáá˝ááş ááťá˝ááşáŻááşáááŻáˇáááş áááŹá¸áá˝ááş áááˇáşáá˝ááşá¸ááŹá¸ááąáŹ áĄááźáąáá áşááŻá áĽáááŹáá áşááŻááźá áşáááşá áááŻááşáááşá¸áá áş áá°ááŽááąáŹ ááąáŹáşááś á ááŻá
Python- pandas áážá Window ááŻááşááąáŹááşááťááşááťáŹá¸
titanic.assign(Pclass_cost = titanic.groupby('Pclass').Fare.transform(sum),
ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])ááŻááşááąáŹááşááťááşááťáŹá¸áážááˇáş áááşá¸áááşá¸ááťáŹá¸ á áŹááąá¸á áŹáá°áááŹá¸
áĄáąáŹááşáá˝ááş ááťá˝ááşáŻááşáááŻáˇáááˇáşáá˝ááşá¸á ááşá¸á áŹá¸ááŹá¸ááąáŹ áááşááąáˇááťáşááťáŹá¸áážá ááąááŹááźááˇáş áĄááťááŻá¸ááťááŻá¸ááąáŹ ááŻááşááąáŹááşááťááşááťáŹá¸ááᯠááŻááşááąáŹááşáááşáĄáá˝ááş áááşá¸áááşá¸ááťáŹá¸áĄááźáŹá¸ á áŹááąá¸á áŹáá°áááŹá¸áá áşááŻááźá áşáááşá
ááąáŤáşááźááťááş
áááşáááşááąáŹ
ááąááŹ
áááşááŤ
ááąááŹááᯠáááşááąáááşá
vroom()/ readr::read_csv() / readr::read_tsv()
fread()
read_csv()
ááąááŹááąáŹááşááťáŹá¸ áááşááŽá¸ááźááşá¸á
tibble()
data.table()
dict() + from_dict()
ááąáŹáşááśááťáŹá¸ááᯠáá˝áąá¸ááťááşááźááşá¸á
select()
áááşááźáą já
ááŻáááşá¸áá˝ááşá¸ááťáŹá¸áĄáá˝ááşá¸ ááŻáááááąááŹ
ááťá˝ááşáŻááşáááŻáˇáááş á
ááŻáááşá¸áá˝ááşá¸á
áá˝ááşááťáŹá¸áá˝ááş áááŻáĄááşááąáŹááąáŹáşááśááťáŹá¸á
áŹáááşá¸ááᯠááźááşáá˝áŹá¸áááş / drop() / filter() / select_dtypes()
áááşá¸á
áŽá
á
áşááźááşá¸á
filter()
áááşááźáą iá
ááŻáááşá¸áá˝ááşá¸ááťáŹá¸áĄáá˝ááşá¸ áááááąááŹ
ááťá˝ááşáŻááşáááŻáˇáááş á
ááŻáááşá¸áá˝ááşá¸á
áá˝ááşááťáŹá¸áá˝ááş á
á
áşááŻááşááźááşá¸áááŻááşáᏠáĄááźáąáĄááąááťáŹá¸ááᯠá
áŹáááşá¸ááźáŻá
áŻáááş/ filter()
áĄáŻááşá
áŻáá˝á˛áˇááźááşá¸áážááˇáş ááąáŤááşá¸á
ááşá¸ááźááşá¸á
group_by() + summarise()
áĄááźááşá¸áá˝áŹá¸áážáŻááťáŹá¸ j + by
groupby() + agg()
á
áŹá¸áá˝á˛ááťáŹá¸á ááąáŤááşáááŻááşáááášá (UNION)
bind_rows()
rbind()
concat()
áĄááťáŹá¸áááŻááş áááŹá¸ááťáŹá¸ ááŤáááşááźááşá¸ (JOIN)
left_join() / *_join()
merge()
merge()
áĄááźáąááśáááşá¸áááŻá¸ááŻááşááąáŹááşááťááşááťáŹá¸áážááˇáş áá˝ááşááťááşááŹá¸ááąáŹ ááąáŹáşááśááťáŹá¸áááˇáşááźááşá¸á
group_by() + mutate()
áááşááźáą j operator ááᯠáĄááŻáśá¸ááźáŻ := + áĄááźááşá¸áĄááŻáś by
transform() + assign()
ááąáŹááşááťááş
ááąáŹááşá¸ááŤá¸áá˝ááş ááťá˝ááşáŻááşáááş data processing á áĄááąáŹááşá¸áá˝ááşááŻáśá¸ááąáŹ áĄááąáŹááşáĄáááşááąáŹáşáážáŻááťáŹá¸ááᯠáááąáŹáşááźááŹá¸ááąá áááŻáˇááźáąáŹááˇáş áážááşááťááşááťáŹá¸áá˝ááş ááťá˝ááşáŻááşááĄáážáŹá¸ááťáŹá¸ááᯠáááşááźááşááąá¸áááşáááŻááťážááş áááŻáˇáááŻááş R/ Python áá˝ááş data áážááˇáşáĄááŻááşááŻááşáááşáĄáá˝ááş áĄááźáŹá¸ááąáŹáááşá¸áááŹááťáŹá¸ááźááˇáş ááąáŹááşá¸ááŤá¸áá˝ááşááąáŹáşááźááŹá¸ááąáŹáĄááťááşáĄáááşááťáŹá¸ááᯠáááŻá¸áááŻá¸áážááşá¸áážááşá¸ááźááˇáşá á˝ááşááąá¸áááşáááŻááŤá áááşá¸ááźáąáŹááşááŤáááşá
áĄáááşáážáŹ ááąá¸áá˛áˇááááŻáᲠááąáŹááşá¸ááŤá¸áá˛áˇ áááşáá˝ááşááťááşá áááşááŹááŹá ááŹá¸á áááŻááąáŹááşá¸áá˛áááŻáá˛áˇ áĄááźááşááᯠááťáážááşáááŻáˇ áááŻááşáᲠááŹááŹá ááŹá¸ áážá áşááŻá ááŻáśá¸ááᯠáááşáá°áá˝ááˇáşááááŻáˇ áá˝ááşáá°áĄáąáŹááşá ááŤáážáááŻááş áááŻáĄááşáááş áá°áááŻáˇááźáŹá¸áážáŹ áá˝ážáąáˇááźáąáŹááşá¸áááŻáˇááŤáá˛á
ááąáŹááşá¸ááŤá¸ááᯠááźááŻááşáážá áşáááşááŤá ááťá˝ááşáŻááşá á áŹáááşá¸áá˝ááşá¸áá°áĄáá áşááťáŹá¸ áážáááŹáááˇáşáĄáá˝ááş áááşá¸ááźáąáŹááşááááŤáááşá и ááťááşáááşááťáŹá¸á
áĄááşááŹááťá°á¸
áááˇáşááŻááşáááşá¸áá˝ááş áĄáąáŹááşááŤáááşááąáˇááťáşááťáŹá¸áá˛ááž áááşáááˇáşáĄááŹááᯠáááşáĄááŻáśá¸ááźáŻááááşá¸á
áážááşááťááşááťáŹá¸áá˝ááş áááşáááş áááşááá˝áąá¸ááťááşáážáŻáĄáá˝ááş áĄááźáąáŹááşá¸ááźááťááşááᯠááąá¸ááŹá¸áááŻááşáááşá
á áŹáááşá¸áá˝ááşá¸áĄááŻáśá¸ááźáŻáá°ááťáŹá¸áᏠá á áşáááşá¸áá˝ááş ááŤáááşáááŻááşááŤáááşá , ááťáąá¸áá°á¸ááźáŻá
áááşáááˇáşááąáᏠá áŽááśááąáŹááşáá˝ááşááąá¸ááźááşá¸ áááşááąáˇááťáşááᯠáááşáĄááŻáśá¸ááźáŻááŤááᲠ(áá˝áąá¸ááťááşá ááŹááťáŹá¸á á˝áŹááᯠáááşáá˝áąá¸ááťááşáááŻááşáááş)
45,2%áááˇáşáážááşá¸áááşáááşáážáŻ áá
33,3%data.table14
54,8%áááşá፠áá
áĄááŻáśá¸ááźáŻáá° 42 áŚá¸ áá˛ááąá¸áá˛áˇáááşá ááŻáśá¸á
á˝á˛áá° áá áŚá¸ áážáąáŹááşááąáá˛áˇááŤáááşá
source: www.habr.com
