ืืืจื ืืืื ืคึฟืึทืจ R ืึธืืขืจ Python ืืืืฃ ืืขืจ ืืื ืืขืจื ืขืฅ, ืืืจ ืืืขื ืืขืคึฟืื ืขื ืืืืืึทื ื ืคืื ืึทืจืืืงืืขื ืืื ืงืืืึธืืขืืขืจืก ืคืื ืืืกืงืืกืืขืก ืืืืฃ ืื ืืขืืข ืคืื โโืืืึธืก ืืืื ืขืจ ืืื ืืขืกืขืจ, ืคืึทืกืืขืจ ืืื ืืขืจ ืืึทืงืืืขื ืฆื ืึทืจืืขืื ืืื ืืึทืื. ืึธืืขืจ ืืืืืขืจ, ืึทืืข ืื ืึทืจืืืงืืขื ืืื ืืืกืคึผืืืฅ ืืขื ืขื ื ืืฉื ืกืคึผืขืฆืืขื ื ืืฆืืง.
ืืขืจ ืฆืื ืคืื ืืขื ืึทืจืืืงื ืืื ืฆื ืคืึทืจืืืืึทืื ืื ืืงืขืจืืืง ืืึทืื ืคึผืจืึทืกืขืกืื ื ืืขืงื ืืงืก ืืื ืื ืืขืจืกื ืคืึธืืงืก ืคึผืึทืงืึทืืืฉืึทื ืคืื ืืืืืข ืฉืคึผืจืึทืื. ืืื ืืขืืคึผืก ืืืืขื ืขืจ ืืขืฉืืืื ื ืืขื ืขืคึผืขืก ืืืึธืก ืืื ืืึธื ื ืื ืืืืกื ื ืึธื. ืคืืจ ืื ืืืืก ืฉืจืืืื ืืื Python, ืืขืื ืืืืก ืืื ืืืื ืืขื ืืืื ืืืก ืืขืืืข ืืื R, ืืื ืคืืจืงืขืจื.
ืืขืฉืึทืก ืืขื ืึทืจืืืงื ืืืจ ืืืขืื ืึทื ืึทืืืื ืื ืกืื ืืึทืงืก ืคืื ืื ืืขืจืกื ืคืึธืืงืก ืคึผืึทืงืึทืืืฉืึทื ืืื R. ืืึธืก ืืขื ืขื ืื ืคึผืึทืงืึทืืืฉืึทื ืึทืจืืึทื ืืขืจืขืื ื ืืื ืืขืจ ืืืืืืึธืืขืง tidyverse
ืืื ืืืื ืื ืคึผืขืงื data.table
. ืืื ืคืึทืจืืืืึทืื ืืืืขืจ ืกืื ืืึทืงืก ืืื pandas
, ืื ืืขืจืกื ืคืึธืืงืก ืืึทืื ืึทื ืึทืืืกืืก ืคึผืขืงื ืืื ืคึผืืืืึธื.
ืืืจ ืืืขืื ืืืื ืฉืจืื ืืืจื ืฉืจืื ืืืจื ืื ืืื ืฆืข ืืจื ืคืื ืืึทืื ืึทื ืึทืืืกืืก ืคืื ืืึธืืืื ื ืขืก ืฆื ืืืจืืคืืจื ืึทื ืึทืืืกืืก ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ื ืืฆื Python ืืื R.
ืฆืืคืจืืื
ืืขืจ ืึทืจืืืงื ืงืขื ืขื ืืืื ืืขืืืืื ื ืืื ืึท ืึธืคึผื ืึทืจื ืืืึทื ืืืื ืืืจ ืืึธื ืคืืจืืขืกื ืืื ืฆื ืืืจืืคืืจื ืขืืืขืืข ืืึทืื ืคึผืจืึทืกืขืกืื ื ืึธืคึผืขืจืึทืฆืืข ืืื ืืืื ืขืจ ืคืื ืื ืคึผืึทืงืืืืฉืื ืืื ืืขืจ ืืึทืืจืึทืืืื ื.
ืืืืคึผื ืกืื ืืึทืงืก ืืืคืขืจืึทื ืกืื ืฆืืืืฉื ืจ ืืื ืคึผืืืืึธื
ืงืกื ืืืงืก.ืึทืงืกืขืก ืคึผืึทืงืงืึทืืข ืคืึทื ืืงืฉืึทื ื
ืงืกื ืืืงืก.ืึทืกืืื ืืึทื ื
ืงืกื ืืืงืก.ืื ืืขืงืกืื ื
ืงืกื ืืืงืก.ืืขืืืึธืืก ืืื OOP
ืงืกื ืืืงืก.ืคึผืืืคึผืืืื ื
ืงืกื ืืืงืก.ืืึทืืึท ืกืืจืึทืงืืฉืขืจื ืขืืืขืืข ืืืขืจืืขืจ ืืืขืื ืื ืคึผืึทืงืึทืืืฉืึทื ืืืจ ืืืขืื ื ืืฆื
ืงืกื ืืืงืก.ืฆืืืืืง
ืงืกื ืืืงืก.ืืึทืืึท.ืืึทืืืข
ืงืกื ืืืงืก.pandas ืื ืกืืึธืืื ื ืคึผืึทืงืึทืืืฉืึทื ืืึธืืืื ื ืืึทืืึท ืฉืืคื ืืึทืืึทืคืจืึทืืขืก ืกืขืืขืงืืื ื ืื ืฉืคืืืื ืืืจ ืืึทืจืคึฟื ืคืืืืขืจืื ื ืจืึธืื ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืืืขืจืืืงืึทื ืคืึทืจืืึทื ื ืคืื ืืืฉื (UNION) ืืึธืจืืืึธื ืืึทื ืคืึทืจืืื ืื ืคืื ืืืฉื (JOIN) ืืงืขืจืืืง ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื ืงืึทืืงืืึทืืืืืื ืฉืคืืืื ืงืึธืจืขืกืคึผืึธื ืืขื ืฅ ืืืฉ ืฆืืืืฉื ืืึทืื ืคึผืจืึทืกืขืกืื ื ืืขืืืึธืืก ืืื ืจ ืืื ืคึผืืืืึธื ืกืึธืฃ ื ืงืืจืฅ ืืืขืจืืืืง ืืืขืื ืืืึธืก ืคึผืขืงื ืืืจ ื ืืฆื
ืืืื ืืืจ ืืขื ื ืืื ืืขืจืขืกืืจื ืืื ืืึทืื ืึทื ืึทืืืกืืก, ืืืจ ืงืขื ืืขืคึฟืื ืขื ืืืื
ืืืืคึผื ืกืื ืืึทืงืก ืืืคืขืจืึทื ืกืื ืฆืืืืฉื ืจ ืืื ืคึผืืืืึธื
ืฆื ืืึทืื ืขืก ืืจืื ืืขืจ ืคึฟืึทืจ ืืืจ ืฆื ืืึทืฉืืืืขื ืคืื Python ืฆื R, ืึธืืขืจ ืืืืฆืข ืืืขืจืกืึท, ืืื ืืืขื ืืขืื ืึท ืืืกื ืืืืคึผื ืคืื ืงืื ืืืึธืก ืืืจ ืืึทืจืคึฟื ืฆื ืืึทืฆืึธืื ืืคืืขืจืงืืึทืืงืืึทื.
ืึทืงืกืขืก ืคึผืึทืงืงืึทืืข ืคืึทื ืืงืฉืึทื ื
ืึทืืึธื ืึท ืคึผืขืงื ืืื ืืึธืืืื ืืื R, ืืืจ ืืึธื ื ืื ืืึทืจืคึฟื ืฆื ืกืคึผืขืฆืืคืืฆืืจื ืื ืคึผืขืงื ื ืึธืืขื ืฆื ืึทืงืกืขืก ืื ืคืึทื ืืงืฉืึทื ื. ืืื ืจืืึฟ ืงืึทืกืขืก ืืึธืก ืืื ื ืืฉื ืคึผืจืึธืกื ืืื ืจ, ืึธืืขืจ ืขืก ืืื ืคึผืึทืกืืง. ืืืจ ืืึธื ื ืื ืืึธืื ืฆื ืึทืจืืึทื ืคืืจ ืึท ืคึผืขืงื ืืืื ืืืจ ืืึทืจืคึฟื ืืืื ืขืจ ืคืื ืื ืคืึทื ืืงืฉืึทื ื ืืื ืืืื ืงืึธื, ืึธืืขืจ ื ืึธืจ ืจืืคื ืขืก ืืืจื ืกืคึผืขืฆืืคืืฆืืจื ืื ื ืึธืืขื ืคืื ืืขื ืคึผืขืงื ืืื ืื ื ืึธืืขื ืคืื ืื ืคืื ืงืฆืืข. ืืขืจ ืกืขืคึผืึทืจืึทืืึธืจ ืฆืืืืฉื ืคึผืขืงื ืืื ืคึฟืื ืงืฆืืข ื ืขืืขื ืืื ืจ ืืื ืึท ืืึธืคึผื ืฆืืืืืคึผืื ืื. package_name::function_name()
.
ืืื Python, ืืืืฃ ืื ืคืึทืจืงืขืจื, ืขืก ืืื ืืขืืืืื ืงืืึทืกืืฉ ืฆื ืจืืคื ืื ืคืึทื ืืงืฉืึทื ื ืคืื ืึท ืคึผืขืงื ืืืจื ืืคืืจืืฉ ืกืคึผืขืฆืืคืืฆืืจื ืืืึทื ื ืึธืืขื. ืืืขื ืึท ืคึผืขืงื ืืื ืืึทืื ืืึธืืืื, ืขืก ืืืืฉืึทืืืึทืื ืืขืืขืื ืึท ืคืึทืจืงืืจืฆื ื ืึธืืขื, ืืืฉื. pandas
ืืืืฉืึทืืืึทืื ืึท ืคึผืกืขืืืืึธื ืื ืืื ืืขื ืืฆื pd
. ื ืคึผืขืงื ืคึฟืื ืงืฆืืข ืืื ืึทืงืกืขืกื ืืืจื ืึท ืคึผืื ืงื package_name.function_name()
.
ืึทืกืืื ืืึทื ื
ืืื R, ืขืก ืืื ืคึผืจืึธืกื ืฆื ื ืืฆื ืึท ืคืืึทื ืฆื ืืึทืฉืืืืขื ืึท ืืืขืจื ืฆื ืึท ืืืืคืขืฅ. obj_name <- value
, ืืึธืืฉ ืึท ืืืื ืืงืืืึทืื ืฆืืืื ืืื ืขืจืืืืื, ืื ืืืื ืืงืืืึทืื ืฆืืืื ืืื ืจ ืืื ืืขื ืืฆื ืืคึฟืจื ืฆื ืคืึธืจื ืืืึทืืืขืก ืฆื ืคืื ืงืฆืืึธื ืืจื ืึทืจืืืืขื ืื.
ืืื Python, ืื ืึทืกืืื ืืึทื ื ืืื ืขืงืกืงืืืกืืืืื ืืื ืึท ืืืื ืืงืืืึทืื ืฆืืืื obj_name = value
.
ืื ืืขืงืกืื ื
ืขืก ืืขื ืขื ืืืื ืืึทื ืฅ ืืึทืืืึทืืืง ืืืคืขืจืึทื ืกืื ืืึธ. ืืื R, ืื ืืขืงืกืื ื ืกืืึทืจืฅ ืืื ืืืื ืืื ืืืื ืึทืืข ืกืคึผืขืกืืคืืขื ืขืืขืืขื ืื ืืื ืื ืจืืืึทืืืื ื ืงืืื,
ืืื ืคึผืืืืึธื, ืื ืืขืงืกืื ื ืกืืึทืจืฅ ืคืื ื ืื ืืื ืื ืืืืกืืขืงืืืื ืงืืื ืืื ื ืืฉื ืึทืจืืึทื ื ืขืืขื ืื ืืขืฆืืข ืขืืขืืขื ื ืกืคึผืขืกืืคืืขื ืืื ืื ืืื ืืขืงืก. ืึทืืื ืคึผืืึทื x[i:j]
ืืื ืคึผืืืืึธื ืืืขื ื ืืฉื ืึทืจืืึทื ื ืขืืขื ืื j ืขืืขืืขื ื.
ืขืก ืืขื ืขื ืืืื ืืืคืขืจืึทื ืกืื ืืื ื ืขืืึทืืืื ืื ืืขืงืกืื ื, ืืื ืจ ื ืึธืืืืืฉืึทื x[-1]
ืืืขื ืฆืืจืืงืงืืืขื ืึทืืข ืขืืขืืขื ืื ืคืื ืื ืืืขืงืืึธืจ ืึทืืืฅ ืื ืืขืฆืืข. ืืื ืคึผืืืืึธื, ืึท ืขื ืืขื ื ืึธืืืืืฉืึทื ืืืขื ืฆืืจืืงืงืืืขื ืืืืื ืื ืืขืฆืืข ืขืืขืืขื ื.
ืืขืืืึธืืก ืืื OOP
R ืืืคึผืืึทืืึทื ืฅ OOP ืืื ืืืื ืืืืืขื ืข ืืืขื, ืืื ืืขืฉืจืืื ืืืขืื ืืขื ืืื ืืขื ืึทืจืืืงื tydiverse
ืขืก ืืืขื ืืืื ืืจืื ืืขืจ ืืื pandas
. ืืึธืืฉ ืืึธืก ืงืขื ืืืื ืืืื ืกืึทืืืืฉืขืงืืืื ืืืื ืื ื.
ืืื ืงืืจืฅ, ืึทืืืืฉืขืงืฅ ืืื ืจ ืืึธื ื ืื ืืึธืื ืืขืืืึธืืก (ืืืื ืืืจ ืจืขืื ืืืขืื S3 ืงืืืกื, ืึธืืขืจ ืขืก ืืขื ืขื ืื ืืขืจืข OOP ืืืคึผืืึทืืึทื ืฅ ืืืึธืก ืืขื ืขื ืคืื ืืืืื ืืงืขืจ ืคึผืจืึธืกื). ืขืก ืืขื ืขื ืืืืื ืืขื ืขืจืึทืืืืขื ืคืึทื ืืงืฉืึทื ื ืืืึธืก ืคึผืจืึธืฆืขืก ืืื ืืืคืขืจืขื ืืื ืืืคึผืขื ืืื ื ืืืืฃ ืื ืงืืึทืก ืคืื ืื ืืืืคืขืฅ.
ืคึผืืืคึผืืืื ื
ืืึธืืขืจ ืืึธืก ืืื ืืขืจ ื ืึธืืขื ืคึฟืึทืจ pandas
ืขืก ืืืขื ื ืืฉื ืืืื ืืึธืจ ืจืืืืืง, ืึธืืขืจ ืืื ืืืขื ืคึผืจืืืืจื ืฆื ืืขืจืงืืขืจื ืื ืืืึทืืฉ.
ืืื ืกืืจ ื ืืฉื ืฆื ืจืึทืืขืืืขื ืื ืืขืจืืืืืื ืืฉืืื ืืช ืืื ื ืืฉื ืคึผืจืึธืืืฆืืจื ืืื ืืืืืง ืึทืืืืฉืขืงืฅ ืืื ืื ืึทืจืืขื ืกืืืืืืข, ืืืจ ืงืขื ืขื ื ืืฆื ืึท ืืื ืคืื ืจืขืจื - ืืื ืืข. ืืขื ืข. ืคืึธืจื ืื ืจืขืืืืืึทื ืคืื ืึท ืืขืืฉืื ืคืื ืืืื ืคึฟืื ืงืฆืืข ืฆื ืืขืจ ืืืืึทืืขืจ, ืืื ืืึธื ื ืื ืจืึทืืขืืืขื ืื ืืขืจืืืืืื ืจืขืืืืืึทืื.
ืืึธืืืจ ื ืขืืขื ืื ืคืืืืขื ืืข ืงืึธื ืืืืฉืคึผืื, ืืื ืืืจ ืงืจืึธื ืื ืืขืจืืืืืื ืืฉืืื ืืช ืืื ืืึทืืื ืืขืจ ืึทืืืืฉืขืงืฅ:
temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )
ืืืจ ืืึธืื ืืืจืืืขืงืึธืื 3 ืึทืคึผืขืจืืืฉืึทื ื ืกืึทืงืืืขื ืืฉืึทืื, ืืื ืืขืจ ืจืขืืืืืึทื ืคืื ืืขืืขืจ ืืื ืืขืจืืืขืืืขื ืืื ืึท ืืึทืืื ืืขืจ ืืืืคืขืฅ. ืืืขืจ ืืื ืคืึทืงื, ืืืจ ืืึธื ื ืื ืืึทืจืคึฟื ืื ืื ืืขืจืืืืืื ืึทืืืืฉืขืงืก.
ืึธืืขืจ ืืคืืื ืขืจืืขืจ, ืึธืืขืจ ืืขืจ ืืึทืงืึทื ื ืฆื ืขืงืกืกืขื ืืืืขืจื.
obj <- func3(func2(func1()))
ืืื ืืขื ืคืึทื, ืืืจ ืืึธืื ื ืืฉื ืจืึทืืขืืืขื ืื ืืขืจืืืืืื ืืขืืฉืื ืจืขืืืืืึทืื, ืึธืืขืจ ืืืืขื ืขื ืงืึธื ืืื ื ืขืกืืขื ืคืึทื ืืงืฉืึทื ื ืืื ืืึธืจ ืืืืึทืงืืืขื.
ืืืจ ืืืขืื ืงืืงื ืืื ืขืืืขืืข ืึทืคึผืจืึธืืืฉืื ืฆื ืืึทืื ืคึผืจืึทืกืขืกืื ื ืืื R, ืืื ืืื ืืืจืืคืืจื ืขื ืืขื ืึทืคึผืขืจืืืฉืึทื ื ืืื ืคืึทืจืฉืืืขื ืข ืืืขืื.
ืคึผืืืคึผืืืื ื ืืื ืืขืจ ืืืืืืึธืืขืง tidyverse
ืืืคึผืืึทืืขื ืึทื ืืืจื ืืขืจ ืึธืคึผืขืจืึทืืึธืจ %>%
.
obj <- func1() %>%
func2() %>%
func3()
ืึทืืื ืืืจ ื ืขืืขื ืื ืจืขืืืืืึทื ืคืื ืืขืจ ืึทืจืืขื func1()
ืืื ืคืึธืจื ืขืก ืืื ืืขืจ ืขืจืฉืืขืจ ืึทืจืืืืขื ื ืฆื func2()
, ืืขืืึธืื ืืืจ ืคืึธืจื ืื ืจืขืืืืืึทื ืคืื ืืขื ืืขืืฉืื ืืื ืืขืจ ืขืจืฉืืขืจ ืึทืจืืืืขื ื func3()
. ืืื ืืื ืื ืกืืฃ, ืืืจ ืฉืจืืึทืื ืึทืืข ืื ืืฉืืื ืืช ืืขืืื ืืื ืื ืืืืคืขืฅ obj <-
.
ืึทืืข ืคืื โโืื ืืืืื ืืื ืืืืืกืืจืึทืืขื ืืขืกืขืจ ืืื ืืืขืจืืขืจ ืืืจื ืืขื ืืขืืข:
ะ data.table
ืงืืืื ืืขื ืขื ืืขื ืืฆื ืืื ืึท ืขื ืืขื ืืืขื.
newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]
ืืื ืืขืืขืจ ืคืื ืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ ืืืจ ืงืขื ืขื ื ืืฆื ืื ืจืขืืืืืึทื ืคืื ืื ืคืจืืขืจืืืงืข ืึธืคึผืขืจืึทืฆืืข.
ะ pandas
ืึทืืึท ืึทืคึผืขืจืืืฉืึทื ื ืืขื ืขื ืืคืืขืฉืืืื ืืืจื ืึท ืคึผืื ืงื.
obj = df.fun1().fun2().fun3()
ืืขื ืข. ืืืจ ื ืขืืขื ืืื ืืืขืจ ืืืฉ df ืืื ื ืืฆื ืืืจ ืฉืืื fun1()
, ืืขืืึธืื ืืืจ ืฆืืืืืื ืืขื ืืืคึฟื ืฆื ืืขืจ ืืืงืืืขื ืจืขืืืืืึทื fun2()
ื ืึธื fun3()
. ืื ืจืืืึทืืืื ื ืจืขืืืืืึทื ืืื ืืขืจืืืขืืืขื ืืื ืึท ืืืืคืขืฅ ืึธืืืืฉ .
ืืึทืืึท ืกืืจืึทืงืืฉืขืจื
ืืึทืืึท ืกืืจืึทืงืืฉืขืจื ืืื ืจ ืืื ืคึผืืืืึธื ืืขื ืขื ืขื ืืขื, ืึธืืขืจ ืืึธืื ืคืึทืจืฉืืืขื ืข ื ืขืืขื.
ืืึทืฉืจืืึทืืื ื
ื ืึธืืขื ืืื ืจ
ื ืึธืืขื ืืื ืคึผืืืืึธื / ืคึผืึทื ืืึทืก
ืืืฉ ืกืืจืืงืืืจ
ืืึทืืึท.ืคืจืึทืืข, ืืึทืืึท.ืืืฉ, ืืึทืืืข
ืืึทืืึทืคืจืึทืืข
ืืืื-ืืืืขื ืฉืึทื ืึทื ืจืฉืืื ืคืื ืืืึทืืืขืก
ืืืขืงืืึธืจ
ืกืขืจืืข ืืื ืคึผืึทื ืืึทืก ืึธืืขืจ ืจืฉืืื ืืื ืจืืื ืคึผืืืืึธื
ืืืืื-ืืืจืื ื ืื-ืืึทืืืืึทืจ ืกืืจืืงืืืจ
ืจืฉืืื
ืืืขืจืืขืจืืื (ืืืงื)
ืืืจ ืืืขืื ืงืืงื ืืื ืขืืืขืืข ืื ืืขืจืข ืคึฟืขืึดืงืืืื ืืื ืืืคืขืจืึทื ืกืื ืืื ืกืื ืืึทืงืก ืืื ืื.
ืขืืืขืืข ืืืขืจืืขืจ ืืืขืื ืื ืคึผืึทืงืึทืืืฉืึทื ืืืจ ืืืขืื ื ืืฆื
ืขืจืฉืืขืจ, ืืื ืืืขื ืืึธืื ืืืจ ืึท ืืืกื ืืืขืื ืื ืคึผืึทืงืึทืืืฉืึทื ืืืึธืก ืืืจ ืืืขื ืืืื ืืึทืงืึทื ื ืืื ืืื ืืขื ืึทืจืืืงื.
ืฆืืืืืง
ืืึทืึทืืืขืจ ืืืขืืืืึทืื:
ืืืืืืึธืืขืง tidyverse
ืืขืฉืจืืื ืืืจื Hedley Wickham, ืขืืืขืจ ืคืึธืจืฉืื ื ืกืกืืขื ืืืกื ืืื RStudio. tidyverse
ืืืฉืืืื ืคืื ืึทื ืืืคึผืจืขืกืืื ืืึทื ื ืคืื ืคึผืึทืงืึทืืืฉืึทื ืืืึธืก ืคืึทืจืคึผืึธืฉืขืืขืจื ืืึทืื ืคึผืจืึทืกืขืกืื ื, 5 ืคืื ืืืึธืก ืืขื ืขื ืึทืจืืึทื ืืขืจืขืื ื ืืื ืื ืฉืคึผืืฅ 10 ืืึทืื ืืึธืืื ืคืื ืื CRAN ืจืืคึผืึทืืึทืืึธืจื.
ืื ืืึทืจืฅ ืคืื ืืขืจ ืืืืืืึธืืขืง ืืืฉืืืื ืคืื ืื ืคืืืืขื ืืข ืคึผืึทืงืึทืืืฉืึทื: ggplot2
, dplyr
, tidyr
, readr
, purrr
, tibble
, stringr
, forcats
. ืืขืืขืจ ืคืื ืื ืคึผืึทืงืึทืืืฉืึทื ืืื ืึทืืืขื ืฆื ืกืึธืืืืข ืึท ืกืคึผืขืฆืืคืืฉ ืคึผืจืึธืืืขื. ืคึฟืึทืจ ืืืึทืฉืคึผืื dplyr
ืืืฉืืคื ืคึฟืึทืจ ืืึทืื ืืึทื ืืคึผืืึทืืืืฉืึทื, tidyr
ืฆื ืืจืขื ืืขื ืื ืืึทืื ืฆื ืึท ืฆืืืืืง ืคืึธืจืขื, stringr
ืกืืืคึผืืึทืคืืื ืืจืืขืื ืืื ืกืืจืื ืืก, ืืื ggplot2
ืืื ืืืื ืขืจ ืคืื ืื ืืขืจืกื ืคืึธืืงืก ืืึทืื ืืืืืฉืืืึทืืึทืืืืฉืึทื ืืืฉืืจืื.
ืืืึทืืข tidyverse
ืืื ืื ืคึผืึทืฉืืขืก ืืื ืืจืื ื ืฆื ืืืืขื ืขื ืกืื ืืึทืงืก, ืืืึธืก ืืื ืืื ืคืืืข ืืืขืื ืขื ืืขื ืฆื ืื SQL ืึธื ืคึฟืจืขื ืฉืคึผืจืึทื.
ืืึทืืึท.ืืึทืืืข
ืืืืจ data.table
ืืื ืืึทื ืืึธืืข ืคืื โโH2O.ai.
ืืขืจ ืขืจืฉืืขืจ ืืขืืืื ื ืคืื ืืขืจ ืืืืืืึธืืขืง ืืื ืืขืืืขื ืืื 2006.
ืืขืจ ืคึผืขืงื ืกืื ืืึทืงืก ืืื ื ืืฉื ืืื ืืึทืงืืืขื ืืื ืืื tidyverse
ืืื ืืื ืืขืจ ืจืขืืึทื ืืกืึทื ื ืคืื ืงืืึทืกืืฉ ืืึทืืึทืคืจืึทืืขืก ืืื ืจ, ืึธืืขืจ ืืื ืืขืจ ืืขืืืืงืขืจ ืฆืืื ืืืืืืืืง ืืงืกืคึผืึทื ืืื ืืื ืคืึทื ืืงืฉืึทื ืึทืืืื.
ืื ืืึทื ืืคึผืืึทืืืืฉืึทื ื ืืื ืื ืืืฉ ืืื ืืขื ืคึผืขืงื ืืขื ืขื ืืืกืงืจืืืื ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ, ืืื ืืืื ืืืจ ืืืืขืจืืขืฆื ืื ืกืื ืืึทืงืก data.table
ืืื SQL, ืืืจ ืืึทืงืืืขื ืขืคึผืขืก ืืื ืืึธืก: data.table[ WHERE, SELECT, GROUP BY ]
ืื ืฉืืึทืจืงืืื ืคืื ืืขื ืคึผืขืงื ืืื ืื ืืืืงืืึทื ืคืื ืคึผืจืึทืกืขืกืื ื ืืจืืืก ืึทืืึทืื ืฅ ืคืื ืืึทืื.
pandas
ืืึทืึทืืืขืจ ืืืขืืืืึทืื:
ืืขืจ ื ืึธืืขื ืคืื ืืขืจ ืืืืืืึธืืขืง ืงืืื ืคืื ืื ืขืงืึธื ืึธืืขืืจืืง ืืขืจืืื "ืืึทืคืืืข ืืึทืื", ืืขื ืืฆื ืฆื ืืึทืฉืจืืึทืื ืืืืืืืืืขื ืกืืึธื ืึทื ืกืืจืึทืงืืฉืขืจื ืืื ืคึฟืึธืจืืึทืฆืืข ืกืขืฅ.
ืืืืจ pandas
ืืื ืืืขืจืืงืื ืขืจ Wes McKinney.
ืืืขื ืขืก ืงืืื ืฆื ืืึทืื ืึทื ืึทืืืกืืก ืืื ืคึผืืืืึธื, ืืืืึทื pandas
ื ืืื. ื ืืืืขืจ ืืืืืืคืื ืงืืืึธื ืึทื, ืืืื-ืืืจืื ืคึผืขืงื ืืืึธืก ืึทืืึทืื ืืืจ ืฆื ืืืจืืคืืจื ืงืืื ืืึทื ืืคึผืืึทืืืืฉืึทื ืืื ืืึทืื, ืคึฟืื ืืึธืืืื ื ืืึทืื ืคึฟืื ืงืืื ืงืืืืื ืฆื ืืืืืฉืืืึทืืืืืื ื ืขืก.
ืื ืกืืึธืืื ื ื ืึธื ืคึผืึทืงืึทืืืฉืึทื
ืื ืคึผืึทืงืึทืืืฉืึทื ืืืกืงืึทืกื ืืื ืืขื ืึทืจืืืงื ืืขื ืขื ื ืืฉื ืึทืจืืึทื ืืขืจืขืื ื ืืื ืื ืืงืขืจืืืง R ืืื Python ืืืกืืจืืืืืฉืึทื ื. ืืึธืืฉ ืขืก ืืื ืึท ืงืืืื ืงืืืืืืึทื, ืืืื ืืืจ ืืื ืกืืึทืืืจื ืื ืึทื ืึทืงืึธื ืืึท ืคืึทืจืฉืคึผืจืืืืื ื, ืืขืืึธืื ืื ืกืืึทืืืจื ืึทืืืฉื ืึทืื pandas
ื ืื ืคืืจืืื ืื.
ืื ืกืืึธืืื ื ืคึผืึทืงืึทืืืฉืึทื ืืื R
ืืืื ืืืจ ืืึธื ืืขืขืคื ื ืื RStudio ืึทื ืืืืืงืืื ื ืกืืืืืืข ืืืึท ืืื ืืกืืขืจ ืึทืืึธื, ืืืจ ืืืกืืึธืืข ืฉืืื ืืืืกื ืืื ืฆื ืื ืกืืึทืืืจื ืื ืคืืจืืื ืื ืคึผืขืงื ืืื R. ืฆื ืื ืกืืึทืืืจื ืคึผืึทืงืึทืืืฉืึทื, ื ืืฆื ืื ื ืึธืจืืึทื ืืึทืคึฟืขื. install.packages()
ืืืจื ืืืืคื ืขืก ืืืืึทื ืืื ืจ ืืื.
# ัััะฐะฝะพะฒะบะฐ ะฟะฐะบะตัะพะฒ
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")
ื ืึธื ืืึทื ืืึธื ืืืจืื ื, ืื ืคึผืึทืงืึทืืืฉืึทื ืืึทืจืคึฟื ืฆื ืืืื ืงืึธื ื ืขืงืืขื, ืคึฟืึทืจ ืืืึธืก ืืื ืจืืึฟ ืงืึทืกืขืก ืื ืืึทืคึฟืขื ืืื ืืขื ืืฆื library()
.
# ะฟะพะดะบะปััะตะฝะธะต ะธะปะธ ะธะผะฟะพัั ะฟะฐะบะตัะพะฒ ะฒ ัะฐะฑะพัะตะต ะพะบััะถะตะฝะธะต
library(vroom)
library(readr)
library(dplyr)
library(data.table)
ืื ืกืืึธืืื ื ืคึผืึทืงืึทืืืฉืึทื ืืื ืคึผืืืืึธื
ืึทืืื, ืืืื ืืืจ ืืึธืื ืจืืื ืคึผืืืืึธื ืืื ืกืืึทืืืจื, ืืขืืึธืื pandas
ืืืจ ืืึทืจืคึฟื ืฆื ืื ืกืืึทืืืจื ืขืก ืืึทื ืืืึทืื. ืขืคึฟืขื ืขื ืึท ืืึทืคึฟืขื ืฉืืจื, ืึธืืขืจ ืืืึธืงืืึทื, ืืืคึผืขื ืืื ื ืืืืฃ ืืืื ืึธืคึผืขืจืืืืื ื ืกืืกืืขื ืืื ืึทืจืืึทื ืื ืคืืืืขื ืืข ืืึทืคึฟืขื.
pip install pandas
ืืขืจื ืึธื ืืืจ ืฆืืจืืงืงืืืขื ืฆื Python ืืื ืึทืจืืึทื ืคืืจ ืื ืืื ืกืืึทืืืจื ืคึผืขืงื ืืื ืื ืืึทืคึฟืขื import
.
import pandas as pd
ืืึธืืืื ื ืืึทืืึท
ืืึทืืึท ืืืื ืื ื ืืื ืืืื ืขืจ ืคืื ืื ืืขืจืกื ืืืืืืืง ืกืืขืคึผืก ืืื ืืึทืื ืึทื ืึทืืืกืืก. ืืืืืข Python ืืื R, ืืืื ืืืจ ืืืืื, ืฆืืฉืืขืื ืืจืืื ืึทืคึผืขืจืืื ืึทืืื ืฆื ืงืจืืื ืืึทืื ืคึฟืื ืงืืื ืงืืืืื: ืืืืข ืืขืงืขืก, ืืขืงืขืก ืคึฟืื ืืขืจ ืืื ืืขืจื ืขืฅ, ืืืขืืกืืืขืก, ืึทืืข ืืื ืื ืคืื ืืึทืืึทืืืืกืื.
ืืืืขืจ ืืขื ืึทืจืืืงื ืืืจ ืืืขืื ื ืืฆื ืขืืืขืืข ืืึทืืึทืกืขืฅ:
- ืฆืืืื ืืึทืื ืืึธืืื ืคืื Google Analytics.
- ืืืืึทื ืืง ืคึผืึทืกืึทืืฉืืจ ืืึทืืึทืกืขื.
ืึทืืข ืื ืืึทืื ืืขื ืขื ืืืืฃ ืืืื
ืืึธืืืื ื ืืึทืื ืืื ืจ: ืืืืืืืืขืจืกืข, vroom, readr
ืฆื ืืึธืื ืืึทืื ืืื ืึท ืืืืืืึธืืขืง tidyverse
ืขืก ืืขื ืขื ืฆืืืื ืคึผืึทืงืึทืืืฉืึทื: vroom
, readr
. vroom
ืืขืจ ืืึธืืขืจื, ืึธืืขืจ ืืื ืืขืจ ืฆืืงืื ืคึฟื ืื ืคึผืึทืงืึทืืืฉืึทื ืงืขื ืขื ืืืื ืงืึทืืืืื ื.
ืฆืืืืจื ืคืื vroom
.
vroom vs reader
ืืืึธืก ืืื ืืขืจ ืืขืืืื ื ืคืืvroom
ืืืื ืขื ืคึฟืึทืจreadr
? ืืืฆื ืืืจ ืคึผืืึทื ืฆื ืืึธืื ืื ืฆืืืื ืคึผืึทืงืึทืืืฉืึทื ืืืืึทืืื ืกืขืคึผืขืจืึทืืื, ืึธืืขืจ ืืกืชึผืื ืืืจ ืืืขืื ืคืึทืจืืื ืืงื ืื ืคึผืึทืงืึทืืืฉืึทื ืืื ืืขืจ ืฆืืงืื ืคึฟื. ืืืื ืืืกืึธืจื ืฆื Vroom ืก ืคืืื ืืืืขื ืขื ืืื ืืืืขืจ ืืึทืื ืคึผืจืึธืืืขืืก ืงืขื ืขื ื ืื ืืืื ืจืขืคึผืึธืจืืขื ืืื ืคืจืึธื ื, ืึทืืื ืืื ืืขืกืืขืจ ืฆื ืคืึทืจืืื ืืงื ืืื ืจืืงืืืืืขืจื ืขืืืขืืข ืืขืืึทื ืง.vroom vs readr
ืืืึธืก ืืื ืืขืืืื ื ืืืื ืขื?vroom
ืคืึทืจreadr
? ืืื ืืขื ืืึธืืขื ื ืืืจ ืคึผืืึทื ืฆื ืึทื ืืืืืงืืขื ืืืืืข ืคึผืึทืงืึทืืืฉืึทื ืกืขืคึผืขืจืึทืืื, ืึธืืขืจ ืืืจ ืืืขืื ืืืกืืึธืืข ืคืึทืจืืื ืื ืืื ืืื ืืขืจ ืฆืืงืื ืคึฟื. ืืืื ืขืจ ืคืื ืื ืืืกืึทืืืืึทื ืืืืืฉืื ืคืื ืคืืื ืืืืขื ืขืvroom
ืืื ืึทื ืขืืืขืืข ืคึผืจืึธืืืขืืก ืืื ืื ืืึทืื ืงืขื ืขื ื ืื ืืืื ืืขืืืืื ืืื ืฉืืืึทืื, ืึทืืื ืืืจ ืืึทืจืคึฟื ืฆื ืืจืึทืืื ืืืขืื ืืื ืืขืกืืขืจ ืฆื ืคืึทืจืืื ืื ืืื.
ืืื ืืขื ืึทืจืืืงื ืืืจ ืืืขืื ืงืืงื ืืื ืืืืืข ืืึทืื ืืึธืืืื ื ืคึผืึทืงืึทืืืฉืึทื:
ืืึธืืืื ื ืืึทืื ืืื R: vroom ืคึผืขืงื
# install.packages("vroom")
library(vroom)
# ะงัะตะฝะธะต ะดะฐะฝะฝัั
## vroom
ga_nov <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")
ืืึธืืืื ื ืืึทืื ืืื R: readr
# install.packages("readr")
library(readr)
# ะงัะตะฝะธะต ะดะฐะฝะฝัั
## readr
ga_nov <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")
ืืื ืืขื ืคึผืขืงื vroom
, ืจืึทืืึทืจืืืึทืก ืคืื ืื Csv / tsv ืืึทืื ืคึฟืึธืจืืึทื, ืืึธืืืื ื ืืื ืืืจืืืขืงืึธืื ืืืจื ืื ืคืื ืงืฆืืข ืคืื โโโโืื ืืขืืืข ื ืึธืืขื vroom()
, ืืื ืืขื ืคึผืขืงื readr
ืืืจ ื ืืฆื ืึท ืึทื ืืขืจืฉ ืคึฟืื ืงืฆืืข ืคึฟืึทืจ ืืขืืขืจ ืคึฟืึธืจืืึทื read_tsv()
ะธ read_csv()
.
ืืึธืืืื ื ืืึทืื ืืื ืจ: data.table
ะ data.table
ืขืก ืืื ืึท ืคึฟืื ืงืฆืืข ืคึฟืึทืจ ืืึธืืืื ื ืืึทืื fread()
.
ืืึธืืืื ื ืืึทืื ืืื ืจ: data.table ืคึผืขืงื
# install.packages("data.table")
library(data.table)
## data.table
ga_nov <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")
ืืึธืืืื ื ืืึทืื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
ืืืื ืืืจ ืคืึทืจืืืืึทืื ืืื R ืคึผืึทืงืึทืืืฉืึทื, ืืื ืืขื ืคืึทื ืื ืกืื ืืึทืงืก ืืื ืงืืึธืืกืึทืกื ืฆื pandas
ืืืขื readr
, ืืืืึทื pandas
ืงืขื ืขื ืืขืื ืืึทืื ืคึฟืื ืขืจืืขืฅ, ืืื ืขืก ืืื ืึท ืืึทื ืฅ ืืฉืคึผืื ืคืื ืคืึทื ืืงืฉืึทื ื ืืื ืืขื ืคึผืขืงื read_*()
.
read_csv()
read_excel()
read_sql()
read_json()
read_html()
ืืื ืคืืืข ืื ืืขืจืข ืคืึทื ืืงืฉืึทื ื ืืืืืื ื ืฆื ืืืืขื ืขื ืืึทืื ืคืื ืคืึทืจืฉืืื ืคึฟืึธืจืืึทืืืจืื ืืขื. ืืืขืจ ืคืืจ ืืื ืืขืจืข ืฆืืืขืง ืืื ืขืก ืืขื ืื read_table()
ืึธืืขืจ read_csv()
ื ืืฆื ืึทืจืืืืขื ื ืกืขืคืืขืืืขืจ ืฆื ืกืคึผืขืฆืืคืืฆืืจื ืื ืืืึทื ืกืขืคึผืึทืจืึทืืึธืจ.
ืืึธืืืื ื ืืึทืื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
import pandas as pd
ga_nov = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")
ืฉืืคื ืืึทืืึทืคืจืึทืืขืก
ืืืฉ ืืืืึทื ืืง, ืฐืขืื ืข ืื ืจ ืืื ื ืื ืืขืืื ื ืื ื ื ืคืขืื ืืขืฉืืขืื, ืืืึธืก ืกืืึธืจื ืื ืคึผืึทืกืึทืืฉืืจ ืก ืืืฉืขื ืืขืจ ืืืืขื ืืืคึฟืืงืึทืฆืืข.
ืึธืืขืจ ืคึฟืึทืจ ืึท ืืขืจ ืืึทืงืืืขื ืคึผืจืขืืขื ืืืจืื ื ืคืื ืืึทืื ืืื ืืขืจืืื ืขื ืคืื ืคึผืึทืกืึทืืฉืืจ ืืืฉืขื ืืขืจ, ืืืจ ืืึธื ื ืืฆื ืืขื ื ืึธืืขื ืืื ืืื ืื ืืืฉืขื ืืขืจ ืงืึธื.
ืฆื ืืึธื ืืึธืก, ืืืจ ืืึทืื ืึท ืงืืืื ืืืขืืืืืึทืืขืจ, ืึท ืืืฉ ืืื ืืืึธืก ืขืก ืืืขื ืืืื ืืืืื 2 ืฉืคืืืื (ืงืึธื ืืื ืืืฉืขื ืืขืจ ื ืึธืืขื) ืืื 2 ืจืึธืื, ืจืืกืคึผืขืงืืืืืื.
ืงืจืืืืืื ื ืึท ืืึทืืึทืคืจืึทืืข ืืื R: tidyverse, dplyr
ืืื ืื ืงืึธื ืืืืฉืคึผืื ืืื ืื, ืืืจ ืืึทืื ืื ืืขืืขืื ืืึทืืึทืคืจืึทืืข ื ืืฆื ืื ืคึฟืื ืงืฆืืข tibble()
.
ืงืจืืืืืื ื ืึท ืืึทืืึทืคืจืึทืืข ืืื R: dplyr
## dplyr
### ัะพะทะดะฐัะผ ัะฟัะฐะฒะพัะฝะธะบ
gender <- tibble(id = c(1, 2),
gender = c("female", "male"))
ืงืจืืืืืื ื ืึท ืืึทืืึทืคืจืึทืืข ืืื ืจ: data.table
ืงืจืืืืืื ื ืึท ืืึทืืึทืคืจืึทืืข ืืื ืจ: data.table
## data.table
### ัะพะทะดะฐัะผ ัะฟัะฐะฒะพัะฝะธะบ
gender <- data.table(id = c(1, 2),
gender = c("female", "male"))
ืงืจืืืืืื ื ืึท ืืึทืืึทืคืจืึทืืข ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
ะ pandas
ืื ืฉืึทืคืื ื ืคืื ืจืึธืืขื ืืื ืืืจืืืขืงืึธืื ืืื ืขืืืขืืข ืกืืึทืืขืก, ืขืจืฉืืขืจ ืืืจ ืืึทืื ืึท ืืืขืจืืขืจืืื, ืืื ืืขืืึธืื ืืืจ ืงืึธื ืืืขืจื ืืขื ืืืขืจืืขืจืืื ืืื ืึท ืืึทืืึทืคืจืึทืืข.
ืงืจืืืืืื ื ืึท ืืึทืืึทืคืจืึทืืข ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
# ัะพะทะดะฐัะผ ะดะฐัะฐ ััะตะนะผ
gender_dict = {'id': [1, 2],
'gender': ["female", "male"]}
# ะฟัะตะพะฑัะฐะทัะตะผ ัะปะพะฒะฐัั ะฒ ะดะฐัะฐััะตะนะผ
gender = pd.DataFrame.from_dict(gender_dict)
ืกืขืืขืงืืื ื ืฉืคืืืื
ืื ืืืฉื ืืื ืืืึธืก ืืืจ ืึทืจืืขื ืงืขื ืึทื ืืืึทืืื ืืึทืืึทื ื ืึธืืขืจ ืืคืืื ืืื ืืขืจืืขืจ ืคืื ืฉืคืืืื ืคืื ืืึทืื. ืืืขืจ ืฆื ืืืจืืคืืจื ืึทื ืึทืืืกืืก, ืืื ืึท ืืขืจืฉื, ืืืจ ืืึธื ื ืื ืืึทืจืคึฟื ืึทืืข ืื ืฉืคืืืื ืืืึธืก ืืขื ืขื ืื ืืืฆื ืืื ืื ืืงืืจ ืืืฉ.
ืืขืจืืืขืจ, ืืืื ืขืจ ืคืื ืื ืขืจืฉืืขืจ ืึทืคึผืขืจืืืฉืึทื ื ืืืึธืก ืืืจ ืืืขื ืืืจืืคืืจื ืืื ืื ืืงืืจ ืืืฉ ืืื ืฆื ืืืกืืขืงื ืขืก ืคืื ืืื ืืืืืง ืืื ืคึฟืึธืจืืึทืฆืืข ืืื ืืึทืคืจืืึทืขื ืื ืืึผืจืื ืืืึธืก ืื ืืื ืคึฟืึธืจืืึทืฆืืข ืึทืงืืึทืคึผืืื.
ืกืขืืขืงืืื ื ืฉืคืืืื ืืื ืจ: ืืืืืืขืจืกืข, ืืคึผืืืจ
ืกืื ืืึทืงืก dplyr
ืืื ืืืืขืจ ืขื ืืขื ืฆื ืื SQL ืึธื ืคึฟืจืขื ืฉืคึผืจืึทื, ืืืื ืืืจ ืืขื ื ืืึทืงืึทื ื ืืื ืขืก, ืืืจ ืืืขื ืืขืฉืืืื ื ืืขื ืืขื ืคึผืขืงื.
ืฆื ืืืืกืงืืืึทืื ืฉืคืืืื, ื ืืฆื ืื ืคึฟืื ืงืฆืืข select()
.
ืื ืืขืจ ืืขื ืขื ืืืืฉืคืืื ืคืื ืงืึธื ืืื ืืืึธืก ืืืจ ืงืขื ืขื ืืืืกืงืืืึทืื ืฉืคืืืื ืืื ืื ืคืืืืขื ืืข ืืืขืื:
- ืืืกืืื ื ืื ื ืขืืขื ืคืื ืื ืคืืจืืื ืื ืฉืคืืืื
- ืึธืคึผืฉืืงื ืฆื ืืืึทื ื ืขืืขื ื ืืฆื ืจืขืืืืขืจ ืืืืกืืจืืงื
- ืืืื ืืึทืื ืืืคึผ ืึธืืขืจ ืงืืื ืื ืืขืจืข ืคืึทืจืืึธื ืคืื ืื ืืึทืื ืงืึทื ืืืื ื ืืื ืื ืืืึทื
ืืืืกืงืืืึทืื ืฉืคืืืื ืืื ืจ: ืืคึผืืืจ
# ะัะฑะพั ะฝัะถะฝัั
ััะพะปะฑัะพะฒ
## dplyr
### ะฒัะฑัะฐัั ะฟะพ ะฝะฐะทะฒะฐะฝะธั ััะพะปะฑัะพะฒ
select(ga_nov, date, source, sessions)
### ะธัะบะปััั ะฟะพ ะฝะฐะทะฒะฐะฝะธั ััะพะปะฑัะพะฒ
select(ga_nov, -medium, -bounces)
### ะฒัะฑัะฐัั ะฟะพ ัะตะณัะปััะฝะพะผั ะฒััะฐะถะตะฝะธั, ััะพะฑัั ะธะผะตะฝะฐ ะบะพัะพััั
ะทะฐะบะฐะฝัะธะฒะฐัััั ะฝะฐ s
select(ga_nov, matches("s$"))
### ะฒัะฑัะฐัั ะฟะพ ััะปะพะฒะธั, ะฒัะฑะธัะฐะตะผ ัะพะปัะบะพ ัะตะปะพัะธัะปะตะฝะฝัะต ััะพะปะฑัั
select_if(ga_nov, is.integer)
ืกืขืืขืงืืื ื ืฉืคืืืื ืืื ืจ: data.table
ืื ืืขืืืข ืึทืคึผืขืจืืืฉืึทื ื ืืื data.table
ืืขื ืขื ืืืจืืืขืงืึธืื ืึท ืืืกื ืึทื ืืขืจืฉ, ืืื ืื ืึธื ืืืื ืคืื ืืขื ืึทืจืืืงื ืืื ืฆืืืขืฉืืขืื ืึท ืืึทืฉืจืืึทืืื ื ืคืื ืืืึธืก ืึทืจืืืืขื ืื ืืขื ืขื ืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ ืืื data.table
.
DT[i,j,by]
ืืื:
ืืื - ืืืื, ื.ื. ืคึฟืืืืจืืจืื ื ืืืจื ืจืึธืื
j - ืืืืกืงืืืึทืื|ืืขืจืืืึทื ืืืงื|ืืึธื, ื.ื. ืกืึทืืขืงืืื ื ืฉืคืืืื ืืื ืงืึทื ืืืขืจืืื ื ืืื
ืืืจื - ืืึทืื ืืจืืคึผืื ื
ืกืขืืขืงืืื ื ืฉืคืืืื ืืื ืจ: data.table
## data.table
### ะฒัะฑัะฐัั ะฟะพ ะฝะฐะทะฒะฐะฝะธั ััะพะปะฑัะพะฒ
ga_nov[ , .(date, source, sessions) ]
### ะธัะบะปััั ะฟะพ ะฝะฐะทะฒะฐะฝะธั ััะพะปะฑัะพะฒ
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### ะฒัะฑัะฐัั ะฟะพ ัะตะณัะปััะฝะพะผั ะฒััะฐะถะตะฝะธั
ga_nov[, .SD, .SDcols = patterns("s$")]
ืืืึทืืขืืืืืง .SD
ืึทืืึทืื ืืืจ ืฆื ืึทืงืกืขืก ืึทืืข ืฉืคืืืื, ืืื .SDcols
ืคืืืืขืจ ืื ืคืืจืืื ืื ืฉืคืืืื ื ืืฆื ืจืขืืืืขืจ ืืืืกืืจืืงื, ืึธืืขืจ ืื ืืขืจืข ืคืึทื ืืงืฉืึทื ื ืฆื ืคืืืืขืจ ืื ื ืขืืขื ืคืื ืื ืฉืคืืืื ืืืจ ืืึทืจืคึฟื.
ืกืขืืขืงืืื ื ืฉืคืืืื ืืื ืคึผืืืืึธื, ืคึผืึทื ืืึทืก
ืฆื ืืืืกืงืืืึทืื ืฉืคืืืื ืืืื ื ืึธืืขื ืืื pandas
ืขืก ืืื ืืขื ืื ืฆื ืฆืืฉืืขืื ืึท ืจืฉืืื ืคืื ืืืืขืจ ื ืขืืขื. ืืื ืฆื ืืืืกืงืืืึทืื ืึธืืขืจ ืืืกืฉืืืกื ืฉืคืืืื ืืืจื ื ืึธืืขื ื ืืฆื ืจืขืืืืขืจ ืืืืกืืจืืงื, ืืืจ ืืึทืจืคึฟื ืฆื ื ืืฆื ืื ืคืึทื ืืงืฉืึทื ื drop()
ะธ filter()
, ืืื ืึทืจืืืืขื ื ืึทืงืก=1, ืืื ืืืึธืก ืืืจ ืึธื ืืืืึทืื ืึทื ืขืก ืืื ื ืืืืืง ืฆื ืคึผืจืึธืฆืขืก ืฉืคืืืื ืืื ืืื ืจืึธืื.
ืฆื ืืืืกืงืืืึทืื ืึท ืคืขืื ืืืจื ืืึทืื ืืืคึผ, ื ืืฆื ืื ืคึฟืื ืงืฆืืข select_dtypes()
, ืืื ืืื ืืขื ืืช ืึทืจืืึทื ื ืขืืขื ืึธืืขืจ ืืืกืฉืืืกื ืคืึธืจื ืึท ืจืฉืืื ืคืื ืืึทืื ืืืืคึผืก ืงืึธืจืึทืกืคึผืึทื ืืื ื ืฆื ืืืึธืก ืคืขืืืขืจ ืืืจ ืืึทืจืคึฟื ืฆื ืืืืกืงืืืึทืื.
ืกืขืืขืงืืื ื ืฉืคืืืื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
# ะัะฑะพั ะฟะพะปะตะน ะฟะพ ะฝะฐะทะฒะฐะฝะธั
ga_nov[['date', 'source', 'sessions']]
# ะัะบะปััะธัั ะฟะพ ะฝะฐะทะฒะฐะฝะธั
ga_nov.drop(['medium', 'bounces'], axis=1)
# ะัะฑัะฐัั ะฟะพ ัะตะณัะปััะฝะพะผั ะฒััะฐะถะตะฝะธั
ga_nov.filter(regex="s$", axis=1)
# ะัะฑัะฐัั ัะธัะปะพะฒัะต ะฟะพะปั
ga_nov.select_dtypes(include=['number'])
# ะัะฑัะฐัั ัะตะบััะพะฒัะต ะฟะพะปั
ga_nov.select_dtypes(include=['object'])
ืคืืืืขืจืื ื ืจืึธืื
ืคึฟืึทืจ ืืืึทืฉืคึผืื, ืื ืืงืืจ ืืืฉ ืงืขื ืึทื ืืืึทืืื ืขืืืขืืข ืืึธืจื ืคืื ืืึทืื, ืึธืืขืจ ืืืจ ื ืึธืจ ืืึทืจืคึฟื ืฆื ืคืื ืึทื ืืขืจืงืืืึทืื ืื ืืขืฆืืข ืืืืฉ. ืืืืืขืจ, ืขืงืกืืจืข ืฉืืจืืช ืืืขื ืคึผืึทืืขืืขื ืื ืืึทืื ืคึผืจืึทืกืขืกืื ื ืคึผืจืึธืฆืขืก ืืื ืคืึทืจืืืืื ืื ืคึผืืกื ืืึผืจืื.
ืคืืืืขืจืื ื ืฉืืจืืช ืืื ืจ: ืืืืืืืขืจืกืข, ืืคึผืืืจ
ะ dplyr
ืื ืคึฟืื ืงืฆืืข ืืื ืืขื ืืฆื ืฆื ืคืืืืขืจ ืจืึธืื filter()
. ืขืก ื ืขืื ืึท ืืึทืืึทืคืจืึทืืข ืืื ืืขืจ ืขืจืฉืืขืจ ืึทืจืืืืขื ื, ืืื ืืืจ ืจืฉืืื ืื ืคึฟืืืืจืืจืื ื ืื ืึธืื.
ืืืขื ืฉืจืืืื ืืึทืืืฉืืงืึทื ืืืืกืืจืืงื ืฆื ืคืืืืขืจ ืึท ืืืฉ, ืืื ืืขื ืคืึทื, ืกืคึผืขืฆืืคืืฆืืจื ืื ืืืึทื ื ืขืืขื ืึธื ืงืืืึธืืขืก ืืื ืึธื ืืขืจืงืืขืจื ืื ืืืฉ ื ืึธืืขื.
ืืืขื ื ืืฆื ืงืืืคื ืืึทืืืฉืืงืึทื ืืืืกืืจืืงื ืฆื ืคืืืืขืจ, ื ืืฆื ืื ืคืืืืขื ืืข ืึธืคึผืขืจืืืืขืจื:
- & ืึธืืขืจ ืงืึธืืข - ืืึทืืืฉืืงืึทื AND
- | - ืืึทืืืฉืืงืึทื ืึธืืขืจ
ืคืืืืขืจืื ื ืฉืืจืืช ืืื ืจ: ืืคึผืืืจ
# ัะธะปัััะฐัะธั ัััะพะบ
## dplyr
### ัะธะปัััะฐัะธั ัััะพะบ ะฟะพ ะพะดะฝะพะผั ััะปะพะฒะธั
filter(ga_nov, source == "google")
### ัะธะปััั ะฟะพ ะดะฒัะผ ััะปะพะฒะธัะผ ัะพะตะดะธะฝัะฝะฝัะผ ะปะพะณะธัะตัะบะธะผ ะธ
filter(ga_nov, source == "google" & sessions >= 10)
### ัะธะปััั ะฟะพ ะดะฒัะผ ััะปะพะฒะธัะผ ัะพะตะดะธะฝัะฝะฝัะผ ะปะพะณะธัะตัะบะธะผ ะธะปะธ
filter(ga_nov, source == "google" | sessions >= 10)
ืคืืืืขืจืื ื ืจืึธืื ืืื ืจ: data.table
ืืื ืืื ืืื ืฉืืื ืืขืฉืจืืื ืืืืื, ืืื data.table
ืืึทืื ืงืึทื ืืืขืจืืฉืึทื ืกืื ืืึทืงืก ืืื ืขื ืงืืึธืืื ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ.
DT[i,j,by]
ืืื:
ืืื - ืืืื, ื.ื. ืคึฟืืืืจืืจืื ื ืืืจื ืจืึธืื
j - ืืืืกืงืืืึทืื|ืืขืจืืืึทื ืืืงื|ืืึธื, ื.ื. ืกืึทืืขืงืืื ื ืฉืคืืืื ืืื ืงืึทื ืืืขืจืืื ื ืืื
ืืืจื - ืืึทืื ืืจืืคึผืื ื
ืืขืจ ืึทืจืืืืขื ื ืืื ืืขื ืืฆื ืฆื ืคืืืืขืจ ืจืึธืื i, ืืืึธืก ืืื ืืขืจ ืขืจืฉืืขืจ ืฉืืขืืข ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ.
ืฉืคืืืื ืืขื ืขื ืึทืงืกืขืกื ืืื ืืึทืืืฉืืงืึทื ืืืืกืืจืืงื ืึธื ืฆืืืึทื ืืึทืจืงืก ืืื ืึธื ืกืคึผืขืฆืืคืืฆืืจื ืื ืืืฉ ื ืึธืืขื.
ืืึทืืืฉืืงืึทื ืืืืกืืจืืงื ืืขื ืขื ืคืืจืืื ืื ืฆื ืืขืืขืจ ืื ืืขืจืขืจ ืืื ืื ืืขืืืข ืืืขื ืืื ืืื dplyr
ืืืจื ืื & ืืื | ืึธืคึผืขืจืืืืขืจื.
ืคืืืืขืจืื ื ืจืึธืื ืืื ืจ: data.table
## data.table
### ัะธะปัััะฐัะธั ัััะพะบ ะฟะพ ะพะดะฝะพะผั ััะปะพะฒะธั
ga_nov[source == "google"]
### ัะธะปััั ะฟะพ ะดะฒัะผ ััะปะพะฒะธัะผ ัะพะตะดะธะฝัะฝะฝัะผ ะปะพะณะธัะตัะบะธะผ ะธ
ga_nov[source == "google" & sessions >= 10]
### ัะธะปััั ะฟะพ ะดะฒัะผ ััะปะพะฒะธัะผ ัะพะตะดะธะฝัะฝะฝัะผ ะปะพะณะธัะตัะบะธะผ ะธะปะธ
ga_nov[source == "google" | sessions >= 10]
ืคืืืืขืจืื ื ืกืืจืื ืืก ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
ืคืืืืขืจ ืืืื ืจืึธืื ืืื pandas
ืขื ืืขื ืฆื ืคืืืืขืจืื ื ืืื data.table
, ืืื ืืื ืืขืืื ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ.
ืืื ืืขื ืคืึทื, ืึทืงืกืขืก ืฆื ืฉืคืืืื ืืื ืืึทืืืงืข ืืืจืืืขืงืึธืื ืืืจื ืื ืืึทืงืืืืื ื ืื ื ืึธืืขื ืคืื ืื ืืึทืืึทืคืจืึทืืข; ืืขืืึธืื ืืขืจ ืืืึทื ื ืึธืืขื ืงืขื ืขื ืืืื ืืืื ืื ืืขืืืืื ืืื ืฆืืืึทื ืืึทืจืงืก ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ (ืืืึทืฉืคึผืื df['col_name']
), ืึธืืขืจ ืึธื ืฆืืืืจื ื ืึธื ืืขืจ ืฆืืึทื (ืืืึทืฉืคึผืื df.col_name
).
ืืืื ืืืจ ืืึทืจืคึฟื ืฆื ืคืืืืขืจ ืึท ืืึทืืึทืคืจืึทืืข ืืืจื ืขืืืขืืข ืืืืื ืืื ืืขื, ืืขืืขืจ ืฆืืฉืืึทื ื ืืืื ืืืื ืฉืืขืื ืืื ืงืืึทืืขืจื. ืืึทืืืฉืืงืึทื ืื ืึธืื ืืขื ืขื ืคืืจืืื ืื ืืื ืืขืืขืจ ืื ืืขืจืข ืืืจื ืึธืคึผืขืจืืืืขืจื &
ะธ |
.
ืคืืืืขืจืื ื ืกืืจืื ืืก ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
# ะคะธะปัััะฐัะธั ัััะพะบ ัะฐะฑะปะธัั
### ัะธะปัััะฐัะธั ัััะพะบ ะฟะพ ะพะดะฝะพะผั ััะปะพะฒะธั
ga_nov[ ga_nov['source'] == "google" ]
### ัะธะปััั ะฟะพ ะดะฒัะผ ััะปะพะฒะธัะผ ัะพะตะดะธะฝัะฝะฝัะผ ะปะพะณะธัะตัะบะธะผ ะธ
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### ัะธะปััั ะฟะพ ะดะฒัะผ ััะปะพะฒะธัะผ ัะพะตะดะธะฝัะฝะฝัะผ ะปะพะณะธัะตัะบะธะผ ะธะปะธ
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืคืื ืืึทืื
ืืืื ืขืจ ืคืื ืื ืืขืจืกื ืงืึทืืึทื ืื ืืขื ืืฆื ืึทืคึผืขืจืืืฉืึทื ื ืืื ืืึทืื ืึทื ืึทืืืกืืก ืืื ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื.
ืื ืกืื ืืึทืงืก ืคึฟืึทืจ ืคึผืขืจืคืึธืจืืื ื ืื ืึทืคึผืขืจืืืฉืึทื ื ืืื ืฆืขืืืึธืจืคื ืืืืขืจ ืึทืืข ืื ืคึผืึทืงืึทืืืฉืึทื ืืืึธืก ืืืจ ืึธืคึผืฉืึทืฆื.
ืืื ืืขื ืคืึทื, ืืืจ ืืืขืื ื ืขืืขื ืึท ืืึทืืึทืคืจืึทืืข ืืื ืึท ืืืึทืฉืคึผืื ืืืืึทื ืืง, ืืื ืจืขืืขื ืขื ืื ื ืืืขืจ ืืื ืืืจืืฉื ืืืืขื ืคึผืจืืึทื ืคืื ืืืงืืฅ ืืืคึผืขื ืืื ื ืืืืฃ ืื ืืึทืืข ืงืืึทืก.
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืคืื ืืึทืื ืืื ืจ: ืืืืืืืขืจืกืข, ืืคึผืืืจ
ะ dplyr
ืื ืคึฟืื ืงืฆืืข ืืื ืืขื ืืฆื ืคึฟืึทืจ ืืจืืคึผืื ื group_by()
, ืืื ืคึฟืึทืจ ืึทืืืจืขืืึทืืืึธื summarise()
. ืืื ืคืึทืงื, dplyr
ืขืก ืืื ืึท ืืึทื ืฅ ืืฉืคึผืื ืคืื ืคืึทื ืืงืฉืึทื ื summarise_*()
, ืึธืืขืจ ืืขืจ ืฆืื ืคืื ืืขื ืึทืจืืืงื ืืื ืฆื ืคืึทืจืืืืึทืื ืื ืืงืขืจืืืง ืกืื ืืึทืงืก, ืึทืืื ืืืจ ืืืขืื ื ืืฉื ืืืื ืืื ืึทืืึท ืืืฉืึทื ืืืึทื.
ืืงืขืจืืืง ืึทืืืจืขืืึทืืืึธื ืคืึทื ืืงืฉืึทื ื:
sum()
โ ืกืืืืmin()
/max()
- ืืื ืืืื ืืื ืืึทืงืกืืืื ืืืขืจืmean()
- ืืืจืืฉื ืืืืขืmedian()
โ ืืืืlength()
- ืงืืืึทื ืืืื
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืืื ืจ: ืืคึผืืืจ
## dplyr
### ะณััะฟะฟะธัะพะฒะบะฐ ะธ ะฐะณัะตะณะฐัะธั ัััะพะบ
group_by(titanic, Pclass) %>%
summarise(passangers = length(PassengerId),
avg_price = mean(Fare))
ืฆื ืคืื ืงืฆืืึธื ืืจื group_by()
ืืืจ ืืึธืื ืืืจืืืขืืื ืืขื ืืขื ืืืฉ ืืื ืืขืจ ืขืจืฉืืขืจ ืึทืจืืืืขื ื ืืืืึทื ืืง, ืืื ืืขืืึธืื ืื ืืขืืืืื ืื ืคืขืื Pclass, ืืื ืืืขืืื ืืืจ ืืืขืื ืืจืืคืขืก ืืื ืืืขืจ ืืืฉ. ืืขืจ ืจืขืืืืืึทื ืคืื ืืขื ืึธืคึผืขืจืึทืฆืืข ื ืืฆื ืื ืึธืคึผืขืจืึทืืึธืจ %>%
ืืืจืืืขืืื ืืขื ืืื ืืขืจ ืขืจืฉืืขืจ ืึทืจืืืืขื ื ืฆื ืื ืคึฟืื ืงืฆืืข summarise()
, ืืื ืฆืืืขืืขืื 2 ืืขืจ ืคืขืืืขืจ: ืคึผืึทืกืึทืืฉืืจื ะธ avg_price. ืืื ืืขืจ ืขืจืฉืืขืจ, ื ืืฆื ืื ืคึฟืื ืงืฆืืข length()
ืงืึทืืงืืึทืืืืืื ืื ื ืืืขืจ ืคืื ืืืงืืฅ, ืืื ืืื ืื ืจืืข ื ืืฆื ืื ืคึฟืื ืงืฆืืข mean()
ืืืงืืืขื ืื ืืืจืืฉื ืืืืขื ืืืืขื ืคึผืจืืึทื.
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืคืื ืืึทืื ืืื ืจ: data.table
ะ data.table
ืืขืจ ืึทืจืืืืขื ื ืืื ืืขื ืืฆื ืคึฟืึทืจ ืึทืืืจืขืืึทืืืึธื j
ืืืึธืก ืืื ืึท ืฆืืืืื ืฉืืขืืข ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ, ืืื ืคึฟืึทืจ ืืจืืคึผืื ื by
ืึธืืขืจ keyby
, ืืืึธืก ืืึธืื ืื ืืจืื ืฉืืขืืข.
ืื ืจืฉืืื ืคืื ืึทืืืจืขืืึทืืืึธื ืคืึทื ืืงืฉืึทื ื ืืื ืืขื ืคืึทื ืืื ืืืืขื ืืงืึทื ืฆื ืื ืืืกืงืจืืืื ืืื dplyr
, ืืืืึทื ืืึธืก ืืขื ืขื ืคืึทื ืืงืฉืึทื ื ืคืื ืื ืืงืขืจืืืง R ืกืื ืืึทืงืก.
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืืื ืจ: data.table
## data.table
### ัะธะปัััะฐัะธั ัััะพะบ ะฟะพ ะพะดะฝะพะผั ััะปะพะฒะธั
titanic[, .(passangers = length(PassengerId),
avg_price = mean(Fare)),
by = Pclass]
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืคืื ืืึทืื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
ืืจืืคึผืื ื ืืื pandas
ืขื ืืื ืฆื dplyr
, ืึธืืขืจ ืื ืึทืืืจืขืืึทืืืึธื ืืื ื ืืฉื ืขื ืืขื ืฆื dplyr
ื ืืฉื ืืืืฃ data.table
.
ืฆื ืืจืืคึผืข, ื ืืฆื ืืขื ืืืคึฟื groupby()
, ืืื ืืืึธืก ืืืจ ืืึทืจืคึฟื ืฆื ืคืึธืจื ืึท ืจืฉืืื ืคืื ืฉืคืืืื ืืืจื ืืืึธืก ืื ืืึทืืึทืคืจืึทืืข ืืืขื ืืืื ืืจืืคึผื.
ืคึฟืึทืจ ืึทืืืจืขืืึทืืืึธื ืืืจ ืงืขื ืขื ื ืืฆื ืืขื ืืืคึฟื agg()
ืืืึธืก ืึธื ื ืขืืขื ืึท ืืืขืจืืขืจืืื. ืื ืืืขืจืืขืจืืื ืฉืืืกืืขื ืืขื ืขื ืื ืฉืคืืืื ืืืืฃ ืืืึธืก ืืืจ ืืืขื ืฆืืืืืื ืื ืึทืืืจืขืืึทืืืึธื ืคืึทื ืืงืฉืึทื ื, ืืื ืื ืืืึทืืืขืก ืืขื ืขื ืื ื ืขืืขื ืคืื ืื ืึทืืืจืขืืึทืืืึธื ืคืึทื ืืงืฉืึทื ื.
ืึทืืืจืขืืึทืืืึธื ืคืึทื ืืงืฉืึทื ื:
sum()
โ ืกืืืืmin()
/max()
- ืืื ืืืื ืืื ืืึทืงืกืืืื ืืืขืจืmean()
- ืืืจืืฉื ืืืืขืmedian()
โ ืืืืcount()
- ืงืืืึทื ืืืื
ืคืื ืงืฆืืึธื ืืจื reset_index()
ืืื ืืขื ืืืึทืฉืคึผืื ืืื ืื, ืขืก ืืื ืืขื ืืฆื ืฆื ืืึทืฉืืขืืืง ื ืขืกืืขื ืื ืืขืงืกืื ืึทื pandas
ืืืคืึธืืฅ ืฆื ื ืึธื ืืึทืื ืึทืืืจืขืืึทืืืึธื.
ืกืืืืึธื ืึทืืึทืื ืืืจ ืฆื ืืึทื ืฆื ืื ืืืืึทืืขืจ ืฉืืจื.
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
# ะณััะฟะฟะธัะพะฒะบะฐ ะธ ะฐะณัะตะณะฐัะธั ะดะฐะฝะฝัั
titanic.groupby(["Pclass"]).
agg({'PassengerId': 'count', 'Fare': 'mean'}).
reset_index()
ืืืขืจืืืงืึทื ืคืึทืจืืื ืื ืคืื ืืืฉื
ืึท ืึธืคึผืขืจืึทืฆืืข ืืื ืืืึธืก ืืืจ ืคืึทืจืืื ืื ืฆืืืื ืึธืืขืจ ืืขืจ ืืืฉื ืคืื ืืขืจ ืืขืืืืงืขืจ ืกืืจืืงืืืจ. ืื ืืึทืื ืืืจ ืืึธืืืื ืึผืืื ืืืฉื ืืึท_ื ืึธืื ะธ ga_dec. ืื ืืืฉื ืืขื ืขื ืืืืขื ืืงืึทื ืืื ืกืืจืืงืืืจ, ื.ื. ืืึธืื ืื ืืขืืืข ืฉืคืืืื, ืืื ืื ืืึทืื ืืืืคึผืก ืืื ืื ืฉืคืืืื.
ืืึธืก ืืื ืึท ืืคึผืืึธืึทื ืคืื Google Analytics ืคึฟืึทืจ ืื ืืืืฉ ืคืื ื ืืืืขืืืขืจ ืืื ืืขืฆืขืืืขืจ, ืืื ืืขื ืึธืคึผืืืืืื ื ืืืจ ืืืขืื ืคืึทืจืืื ืื ืื ืืึทืื ืืื ืืืื ืืืฉ.
ืืืขืจืืืงืื ืฆืืืฉืขืคึผืขื ืืืฉื ืืื ืจ: ืืืืืืืขืจืกืข, ืืคึผืืืจ
ะ dplyr
ืืืจ ืงืขื ืขื ืคืึทืจืืื ืื 2 ืืืฉื ืืื ืืืื ืืื ืื ืคึฟืื ืงืฆืืข bind_rows()
, ืคืืจืืื ืืืฉื ืืื ืืืึทื ืืขื ืืช.
ืคืืืืขืจืื ื ืฉืืจืืช ืืื ืจ: ืืคึผืืืจ
# ะะตััะธะบะฐะปัะฝะพะต ะพะฑัะตะดะธะฝะตะฝะธะต ัะฐะฑะปะธั
## dplyr
bind_rows(ga_nov, ga_dec)
ืืืขืจืืืงืื ืืืฉืืื ืื ื ืืืฉื ืืื ืจ: data.table
ืขืก ืืื ืืืื ืืึธืจื ืืฉื ืงืึธืืคึผืืืฆืืจื, ืืึธืื ืืื ืื ื ืืฆื rbind()
.
ืคืืืืขืจืื ื ืจืึธืื ืืื ืจ: data.table
## data.table
rbind(ga_nov, ga_dec)
ืืืขืจืืืงืื ืืืฉืืื ืื ื ืืืฉื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
ะ pandas
ืื ืคึฟืื ืงืฆืืข ืืื ืืขื ืืฆื ืฆื ืคืึทืจืืื ืื ืืืฉื concat()
, ืืื ืืืึธืก ืืืจ ืืึทืจืคึฟื ืฆื ืคืึธืจื ืึท ืจืฉืืื ืคืื ืจืึธืืขื ืฆื ืคืึทืจืืื ืื ืืื.
ืคืืืืขืจืื ื ืกืืจืื ืืก ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
# ะฒะตััะธะบะฐะปัะฝะพะต ะพะฑัะตะดะธะฝะตะฝะธะต ัะฐะฑะปะธั
pd.concat([ga_nov, ga_dec])
ืืึธืจืืืึธื ืืึทื ืคืึทืจืืื ืื ืคืื ืืืฉื
ื ืึธืคึผืขืจืึทืฆืืข ืืื ืืืึธืก ืฉืคืืืื ืคืื ืื ืจืืข ืืขื ืขื ืืืกืืฃ ืฆื ืืขืจ ืขืจืฉืืขืจ ืืืฉ ืืืจื ืฉืืืกื. ืขืก ืืื ืึธืคื ืืขื ืืฆื ืืืขื ืขื ืจืืืฉืื ื ืึท ืคืึทืงื ืืืฉ (ืืืฉื, ืึท ืืืฉ ืืื ืคืืจืงืืืคืื ื ืืึทืื) ืืื ืขืืืขืืข ืจืขืคึฟืขืจืขื ืฅ ืืึทืื (ืืืฉื, ืื ืคึผืจืืึทื ืคืื ืึท ืคึผืจืึธืืืงื).
ืขืก ืืขื ืขื ืขืืืขืืข ืืืืคึผืก ืคืื ืืืฉืืื ืฅ:
ืืื ืื ืคืจืืขืจ ืืึธืืืื ืืืฉ ืืืืึทื ืืง ืืืจ ืืึธืื ืึท ืืืึทื ืืขืฉืืขืื, ืืืึธืก ืงืึธืจืึทืกืคึผืึทื ืื ืฆื ืื ืคึผืึทืกืึทืืฉืืจ ืก ืืืฉืขื ืืขืจ ืงืึธื:
1 - ืืืืึทืืืขื
2 - ืืืจ
ืืืื, ืืืจ ืืึธืื ืืืฉืืคื ืึท ืืืฉ - ืึท ืจืขืคึฟืขืจืขื ืฅ ืืื ืืืฉืขื ืืขืจ. ืคึฟืึทืจ ืึท ืืขืจ ืืึทืงืืืขื ืคึผืจืขืืขื ืืืจืื ื ืคืื ืืึทืื ืืืขืื ืื ืืืฉืขื ืืขืจ ืคืื ืคึผืึทืกืึทื ืืืฉืขืจื, ืืืจ ืืึทืจืคึฟื ืฆื ืืืืื ืื ื ืึธืืขื ืคืื ืื ืืืฉืขื ืืขืจ ืคืื ืื ืืืขืืืืืึทืืขืจ ืืืฉืขื ืืขืจ ืฆืื ืืืฉ ืืืืึทื ืืง.
ืืึธืจืืืึธื ืืึทื ืืืฉ ืคืึทืจืืื ืื ืืื ืจ: ืืืืืืืขืจืกืข, ืืคึผืืืจ
ะ dplyr
ืขืก ืืื ืึท ืืึทื ืฅ ืืฉืคึผืื ืคืื ืคืึทื ืืงืฉืึทื ื ืคึฟืึทืจ ืืึธืจืืืึธื ืืึทื ืืืฉืืื ืื ื:
inner_join()
left_join()
right_join()
full_join()
semi_join()
nest_join()
anti_join()
ืื ืืขืจืกื ืงืึทืืึทื ืื ืืขื ืืฆื ืืื ืืืื ืคืืจ ืืื left_join()
.
ืืื ืืขืจ ืขืจืฉืืขืจ ืฆืืืื ืึทืจืืืืขื ืื, ืื ืคืึทื ืืงืฉืึทื ื ืืืกืืขื ืืืืื ื ืขืืขื ืฆืืืื ืืืฉื ืฆื ืคืึทืจืืื ืื, ืืื ืืื ืื ืืจืื ืึทืจืืืืขื ื by ืืืจ ืืืื ืกืคึผืขืฆืืคืืฆืืจื ืื ืฉืคืืืื ืฆื ืคืึทืจืืื ืื.
ืืึธืจืืืึธื ืืึทื ืืืฉ ืคืึทืจืืื ืื ืืื ืจ: ืืคึผืืืจ
# ะพะฑัะตะดะธะฝัะตะผ ัะฐะฑะปะธัั
left_join(titanic, gender,
by = c("Sex" = "id"))
ืืึธืจืืืึธื ืืึทื ืคืึทืจืืื ืื ืคืื ืืืฉื ืืื ืจ: data.table
ะ data.table
ืืืจ ืืึทืจืคึฟื ืฆื ืคืึทืจืืื ืื ืืืฉื ืืืจื ืฉืืืกื ื ืืฆื ืื ืคึฟืื ืงืฆืืข merge()
.
ืึทืจืืืืขื ืื ืฆื ืฆืื ืืืคืืืกื () ืคึฟืื ืงืฆืืข ืืื data.table
- ืจืขื ืืืขื , ื - ืืึทืืืขืก ืคึฟืึทืจ ืืืฉืืื ืื ื
- ืืืจื - ืืืึทื ืืืึธืก ืืื ืืขืจ ืฉืืืกื ืฆื ืคืึทืจืืื ืื ืืืื ืขืก ืืื ืื ืืขืืืข ื ืึธืืขื ืืื ืืืืืข ืืืฉื
- by.x, by.y - ื ืขืืขื ืคืื ืื ืฉืคืืืื ืฆื ืืืื ืืขืจืืืฉื, ืืืื ืืื ืืึธืื ืคืึทืจืฉืืืขื ืข ื ืขืืขื ืืื ืื ืืืฉื
- all, all.x, all.y - ืคืึทืจืืื ืื ืืืคึผ, ืึทืืข ืืืขื ืฆืืจืืงืงืืืขื ืึทืืข ืจืึธืื ืคืื ืืืืืข ืืืฉื, all.x ืงืึธืจืึทืกืคึผืึทื ืื ืฆื ืื LEFT JOIN ืึธืคึผืขืจืึทืฆืืข (ืืืขื ืืึธืื ืึทืืข ืื ืจืึธืื ืคืื ืืขืจ ืขืจืฉืืขืจ ืืืฉ), all.y - ืงืึธืจืึทืกืคึผืึทื ืื ืฆื ืื RIGHT JOIN ืึธืคึผืขืจืึทืฆืืข (ืืืขื ืืึธืื ืึทืืข ืื ืจืึธืื ืคืื ืื ืจืืข ืืืฉ).
ืืึธืจืืืึธื ืืึทื ืคืึทืจืืื ืื ืคืื ืืืฉื ืืื ืจ: data.table
# ะพะฑัะตะดะธะฝัะตะผ ัะฐะฑะปะธัั
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)
ืืึธืจืืืึธื ืืึทื ืืืฉ ืคืึทืจืืื ืื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
ืืื ืืืื ืืื data.table
ืืื pandas
ืื ืคึฟืื ืงืฆืืข ืืื ืืขื ืืฆื ืฆื ืคืึทืจืืื ืื ืืืฉื merge()
.
ืึทืจืืืืขื ืื ืคืื ืื ืฆืื ืืืคืืืกื () ืคึฟืื ืงืฆืืข ืืื ืคึผืึทื ืืึทืก
- ืืื - ืงืฉืจ ืืืคึผ: ืืื ืงืก, ืจืขืื, ืืืกืืืืื ืืงืกื, ืื ืขืจ
- ืืืืฃ - ืืืึทื ืืืึธืก ืืื ืึท ืฉืืืกื ืืืื ืขืก ืืื ืื ืืขืืืข ื ืึธืืขื ืืื ืืืืืข ืืืฉื
- left_on, right_on - ื ืขืืขื ืคืื ืฉืืืกื ืฉืคืืืื, ืืืื ืืื ืืึธืื ืคืึทืจืฉืืืขื ืข ื ืขืืขื ืืื ืืืฉื
ืืึธืจืืืึธื ืืึทื ืืืฉ ืคืึทืจืืื ืื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
# ะพะฑัะตะดะธะฝัะตะผ ะฟะพ ะบะปััั
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")
ืืงืขืจืืืง ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื ืงืึทืืงืืึทืืืืืื ืฉืคืืืื
ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืขื ืขื ืขื ืืขื ืืื ืืืึทืืฉ ืฆื ืึทืืืจืขืืึทืืืึธื ืคืึทื ืืงืฉืึทื ื, ืืื ืืขื ืขื ืืืื ืึธืคื ืืขื ืืฆื ืืื ืืึทืื ืึทื ืึทืืืกืืก. ืึธืืขืจ ื ืื ืขื ืืขื ืึทืืืจืขืืึทืืืึธื ืคืึทื ืืงืฉืึทื ื, ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืึธื ื ืื ืืืืฉื ืื ื ืืืขืจ ืคืื ืจืึธืื ืคืื ืื ืึทืืืืึธืืื ื ืืึทืืึทืคืจืึทืืข.
ืืกืขื ืฉืึทืื, ื ืืฆื ืื ืคึฟืขื ืฆืืขืจ ืคึฟืื ืงืฆืืข, ืืืจ ืฉืคึผืึทืืื ืื ืื ืงืึทืืื ื ืืึทืืึทืคืจืึทืืข ืืื ืคึผืึทืจืฅ ืืืื ืขืืืขืืข ืงืจืืืขืจืืึธื, ื.ืข. ืืืื ืื ืืืขืจื ืคืื ืึท ืคืขืื, ืึธืืขืจ ืขืืืขืืข ืคืขืืืขืจ. ืืื ืืืจ ืคืืจื ืืืืก ืึทืจืืืืขืืืง ืึทืคึผืขืจืืืฉืึทื ื ืืืืฃ ืืขืืขืจ ืคึฟืขื ืฆืืขืจ. ืืขืจ ืจืขืืืืืึทื ืคืื ืื ืึทืคึผืขืจืืืฉืึทื ื ืืืขื ืืืื ืืืืืขืงืขืจื ืืื ืืขืืขืจ ืฉืืจื, ื.ื. ืึธื ืืฉืึทื ืืื ื ืื ืืึทื ืฅ ื ืืืขืจ ืคืื ืจืึธืื ืืื ืื ืืืฉ.
ืคึฟืึทืจ ืืืึทืฉืคึผืื, ืืึธืืืจ ื ืขืืขื ืื ืืืฉ ืืืืึทื ืืง. ืืืจ ืงืขื ืขื ืจืขืืขื ืขื ืืืึธืก ืคึผืจืึธืฆืขื ื ืื ืคึผืจืืึทื ืคืื ืืขืืขืจ ืืืืขื ืืื ืืขืืืขื ืืื ืืืื ืืึทืืข ืงืืึทืก.
ืฆื ืืึธื ืืึธืก, ืืืจ ืืึทืจืคึฟื ืฆื ืืึทืงืืืขื ืืื ืืขืืขืจ ืฉืืจื ืื ืืึทื ืฅ ืคึผืจืืึทื ืคืื ืึท ืืืืขื ืคึฟืึทืจ ืื ืงืจืึทื ื ืงืึทืืื ืข ืงืืึทืก ืฆื ืืืึธืก ืื ืืืืขื ืืื ืื ืฉืืจื ืืขืืขืจื, ืืื ืืืืื ืื ืคึผืจืืึทื ืคืื ืืขืืขืจ ืืืืขื ืืืจื ืื ืืึทื ืฅ ืงืึธืก ืคืื ืึทืืข ืืืงืืฅ ืคืื ืืขืจ ืืขืืืืงืขืจ ืงืึทืืื ืข ืงืืึทืก .
ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื R: tidyverse, dplyr
ืฆื ืืืืื ื ืืึทืข ืฉืคืืืื ืึธื ื ืืฆื ืจืืืขืจื ืืจืืคึผืื ื, ืืื dplyr
ืืืืื ื ืคึฟืื ืงืฆืืข mutate()
.
ืืืจ ืงืขื ืขื ืกืึธืืืืข ืื ืคึผืจืึธืืืขื ืืืกืงืจืืืื ืืืืื ืืืจื ืืจืืคึผืื ื ืืึทืื ืืืจื ืคืขืื Pclass ืืื ืกืึทืื ืื ืคืขืื ืืื ืึท ื ืืึท ืืืึทื ืึธืคึผืฆืึธื. ืืืืึทืืขืจ, ืื ืืจืึธืืคึผ ืื ืืืฉ ืืื ืืืืื ืื ืคืขืื ืืืึทืืืขืก ืึธืคึผืฆืึธื ืฆื ืืืึธืก ืืขืืจืืคื ืืื ืื ืคืจืืขืจืืืงืข ืฉืจืื.
ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื R: dplyr
group_by(titanic, Pclass) %>%
mutate(Pclass_cost = sum(Fare)) %>%
ungroup() %>%
mutate(ticket_fare_rate = Fare / Pclass_cost)
ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื ืจ: data.table
ืื ืืืืืื ื ืึทืืืขืจืืืึทื ืืืืืื ืื ืืขืืืข ืืื ืืื dplyr
, ืืืจ ืืึทืจืคึฟื ืฆื ืฉืคึผืึทืืื ืื ืืืฉ ืืื ืคึฟืขื ืฆืืขืจ ืืืจื ืคืขืื Pclass. ืจืขืืืืืึทื ืืื ืึท ื ืืึท ืืืึทื ืื ืกืืืข ืคึฟืึทืจ ืื ืืจืืคึผืข ืงืึธืจืึทืกืคึผืึทื ืืื ื ืฆื ืืขืืขืจ ืจืืืขืจื, ืืื ืืืืื ืึท ืืืึทื ืืื ืืืึธืก ืืืจ ืจืขืืขื ืขื ืื ืืืืื ืคืื ืื ืคึผืจืืึทื ืคืื ืืขืืขืจ ืืืืขื ืืื ืืืึทื ืืจืืคึผืข.
ืฆื ืืืืื ื ืืึทืข ืฉืคืืืื ืฆื data.table
ืึธืคึผืขืจืึทืืึธืจ ืคืึธืจืฉืืขืื :=
. ืื ืืขืจ ืืื ืึท ืืืึทืฉืคึผืื ืคืื ืกืึทืืืืื ื ืึท ืคึผืจืึธืืืขื ื ืืฆื ืืขื ืคึผืขืงื data.table
ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื ืจ: data.table
titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost),
by = Pclass]
ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
ืืืื ืืืขื ืฆื ืืืืื ืึท ื ืืึทืข ืืืึทื pandas
- ื ืืฆื ืื ืคึฟืื ืงืฆืืข assign()
. ืฆื ืกืึทืืขืจืืื ืื ืคึผืจืืึทื ืคืื ืืืงืืฅ ืืืจื ืงืึทืืื ืข ืงืืึทืก, ืึธื ืืจืืคึผืื ื ืจืึธืื, ืืืจ ืืืขืื ื ืืฆื ืื ืคึฟืื ืงืฆืืข transform()
.
ืื ืืขืจ ืืื ืึท ืืืึทืฉืคึผืื ืคืื ืึท ืืืืืื ื ืืื ืืืึธืก ืืืจ ืืืืื ืฆื ืื ืืืฉ ืืืืึทื ืืง ืื ืืขืืืข 2 ืฉืคืืืื.
ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื ืคึผืืืืึธื: ืคึผืึทื ืืึทืก
titanic.assign(Pclass_cost = titanic.groupby('Pclass').Fare.transform(sum),
ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])
ืคืึทื ืืงืฉืึทื ื ืืื ืืขืืืึธืืก ืงืึธืจืขืกืคึผืึธื ืืขื ืฅ ืืืฉ
ืื ืืขืจ ืืื ืึท ืืืฉ ืคืื ืงืึธืจืขืกืคึผืึธื ืืขื ืฅ ืฆืืืืฉื ืืขืืืึธืืก ืคึฟืึทืจ ืคึผืขืจืคืึธืจืืื ื ืคืึทืจืฉืืื ืึทืคึผืขืจืืืฉืึทื ื ืืื ืืึทืื ืืื ืื ืคึผืึทืงืึทืืืฉืึทื ืืืึธืก ืืืจ ืืึธืื ืืึทืืจืึทืื.
ืืึทืฉืจืืึทืืื ื
ืฆืืืืืง
ืืึทืืึท.ืืึทืืืข
pandas
ืืึธืืืื ื ืืึทืืึท
vroom()
/ readr::read_csv()
/ readr::read_tsv()
fread()
read_csv()
ืฉืืคื ืืึทืืึทืคืจืึทืืขืก
tibble()
data.table()
dict()
+ from_dict()
ืกืขืืขืงืืื ื ืฉืคืืืื
select()
ืึทืจืืืืขื ื j, ืจืืข ืฉืืขืืข ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ
ืืืจ ืคืึธืจื ืื ืจืฉืืื ืคืื ืคืืจืืื ืื ืฉืคืืืื ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ / drop()
/ filter()
/ select_dtypes()
ืคืืืืขืจืื ื ืจืึธืื
filter()
ืึทืจืืืืขื ื i, ืขืจืฉืืขืจ ืฉืืขืืข ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ
ืืืจ ืจืฉืืื ืื ืคึฟืืืืจืืจืื ื ืื ืึธืื ืืื ืงืืืึทืืจืึทื ืืจืึทืงืึทืฅ / filter()
ืืจืืคึผืื ื ืืื ืึทืืืจืขืืึทืืืึธื
group_by()
+ summarise()
ืืขื ืืช j + by
groupby()
+ agg()
ืืืขืจืืืงืึทื ืคืึทืจืืึทื ื ืคืื ืืืฉื (UNION)
bind_rows()
rbind()
concat()
ืืึธืจืืืึธื ืืึทื ืคืึทืจืืื ืื ืคืื ืืืฉื (JOIN)
left_join()
/ *_join()
merge()
merge()
ืืงืขืจืืืง ืคึฟืขื ืฆืืขืจ ืคืึทื ืืงืฉืึทื ื ืืื ืึทืืื ื ืงืึทืืงืืึทืืืืืื ืฉืคืืืื
group_by()
+ mutate()
ืึทืจืืืืขื ื j ื ืืฆื ืื ืึธืคึผืขืจืึทืืึธืจ :=
+ ืึทืจืืืืขื ื by
transform()
+ assign()
ืกืึธืฃ
ืืึธืืขืจ ืืื ืืขื ืึทืจืืืงื ืืื ืืืกืงืจืืืื ื ืื ืื ืืขืจืกื ืึธืคึผืืืืึทื ืืืคึผืืึทืืขื ืืืืฉืึทื ืคืื ืืึทืื ืคึผืจืึทืกืขืกืื ื, ืึทืืื ืืื ืืืขื ืืืื ืฆืืคืจืืื ืืืื ืืืจ ืจืืืืืง ืืืื ืืืกืืืืงืก ืืื ืื ืืึทืืขืจืงืื ืืขื, ืึธืืขืจ ื ืึธืจ ืืขืกืึธืคืข ืื ืืื ืคึฟืึธืจืืึทืฆืืข ืืขืืขืื ืืื ืืขื ืึทืจืืืงื ืืื ืื ืืขืจืข ืืขืงื ืืงืก ืคึฟืึทืจ ืืจืืขืื ืืื ืืึทืื ืืื ืจ / ืคึผืืืืึธื.
ืืื ืืื ืืึธื ืืขืฉืจืืื ืืืืื, ืืื ืืขืจ ืฆืื ืคืื ืืขื ืึทืจืืืงื ื ืืฉื ืืขืืืขื ืฆื ืึธื ืืึธื ืึท ืืืื ืื ื ืืืืฃ ืืืึธืก ืฉืคึผืจืึทื ืืื ืืขืกืขืจ, ื ืึธืจ ืฆื ืคืึทืจืคึผืึธืฉืขืืขืจื ืื ืืขืืขืื ืืืื ืืื ืืืืกืฆืืืขืจื ืขื ืืืืืข ืฉืคึผืจืึทืื, ืึธืืขืจ, ืืืื ื ืืืืืง, ืืืืจืืจื ืฆืืืืฉื ืืื.
ืืืื ืืืจ ืืืืงื ืืขื ืึทืจืืืงื, ืืื ืืืขื ืืืื ืฆืืคืจืืื ืฆื ืืึธืื ื ืืึทืข ืืืื ืขื ืื ืฆื ืืืื ืึทืจืืืงื
ะะฟัะพั
ืืืึธืก ืคืื ืื ืคืืืืขื ืืข ืคึผืึทืงืึทืืืฉืึทื ืืึธื ืืืจ ื ืืฆื ืืื ืืืื ืึทืจืืขื?
ืืื ืื ืืึทืืขืจืงืื ืืขื ืืืจ ืงืขื ืขื ืฉืจืืึทืื ืื ืกืืื ืคึฟืึทืจ ืืืื ืืจืืจื.
ืืืืื ืจืขืืืกืืจืืจื ื ืืฆืขืจืก ืงืขื ืขื ืึธื ืืืื ื ืขืืขื ืืื ืื ืืืขืจืืืืง.
ืืืึธืก ืืึทืื ืคึผืจืึทืกืขืกืื ื ืคึผืขืงื ืืึธื ืืืจ ื ืืฆื (ืืืจ ืงืขื ืขื ืืืืกืงืืืึทืื ืขืืืขืืข ืึธืคึผืฆืืขืก)
-
ืงืกื ืืืงืก%tidyverse19
-
ืงืกื ืืืงืก%data.table14
-
ืงืกื ืืืงืก%pandas23
42 ืืื ืืฆืขืจ ืืืื ืืขืฉืืืื. 9 ืืื ืืฆืขืจ ืืืื ืืื ืืคืืขืืืืื.
ืืงืืจ: www.habr.com