āĻāĻ¨ā§āĻāĻžāĻ°āĻ¨ā§āĻā§ R āĻŦāĻž Python āĻ āĻ¨ā§āĻ¸āĻ¨ā§āĻ§āĻžāĻ¨ āĻāĻ°āĻžāĻ° āĻŽāĻžāĻ§ā§āĻ¯āĻŽā§, āĻāĻĒāĻ¨āĻŋ āĻ˛āĻā§āĻˇ āĻ˛āĻā§āĻˇ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ āĻāĻŦāĻ āĻāĻ˛ā§āĻāĻ¨āĻžāĻ° āĻāĻŋāĻ˛ā§āĻŽāĻŋāĻāĻžāĻ° āĻĒāĻžāĻŦā§āĻ¨ āĻ¯āĻžāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻāĻāĻāĻŋ āĻāĻžāĻ˛, āĻĻā§āĻ°ā§āĻ¤ āĻāĻŦāĻ āĻĄā§āĻāĻž āĻ¨āĻŋāĻ¯āĻŧā§ āĻāĻžāĻ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻāĻ°āĻ āĻ¸ā§āĻŦāĻŋāĻ§āĻžāĻāĻ¨āĻāĨ¤ āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻĻā§āĻ°ā§āĻāĻžāĻā§āĻ¯āĻŦāĻļāĻ¤, āĻāĻ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ āĻāĻŦāĻ āĻŦāĻŋāĻ¤āĻ°ā§āĻ āĻŦāĻŋāĻļā§āĻˇāĻāĻžāĻŦā§ āĻāĻžāĻ°ā§āĻ¯āĻāĻ° āĻ¨āĻ¯āĻŧāĨ¤
āĻāĻ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§āĻāĻŋāĻ° āĻāĻĻā§āĻĻā§āĻļā§āĻ¯ āĻšāĻ˛ āĻāĻāĻ¯āĻŧ āĻāĻžāĻˇāĻžāĻ° āĻ¸āĻŦāĻā§āĻ¯āĻŧā§ āĻāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻĒā§āĻ¯āĻžāĻā§āĻā§āĻ° āĻŽā§āĻ˛āĻŋāĻ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ°āĻŖ āĻā§āĻļāĻ˛āĻā§āĻ˛āĻŋāĻ° āĻ¤ā§āĻ˛āĻ¨āĻž āĻāĻ°āĻžāĨ¤ āĻāĻŦāĻ āĻĒāĻžāĻ āĻāĻĻā§āĻ° āĻĻā§āĻ°ā§āĻ¤ āĻāĻŽāĻ¨ āĻāĻŋāĻā§ āĻāĻ¯āĻŧāĻ¤ā§āĻ¤ āĻāĻ°āĻ¤ā§ āĻ¸āĻšāĻžāĻ¯āĻŧāĻ¤āĻž āĻāĻ°ā§āĻ¨ āĻ¯āĻž āĻ¤āĻžāĻ°āĻž āĻāĻāĻ¨āĻ āĻāĻžāĻ¨ā§āĻ¨ āĻ¨āĻžāĨ¤ āĻ¯āĻžāĻ°āĻž āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻ˛ā§āĻā§āĻ¨, āĻ¤āĻžāĻĻā§āĻ° āĻāĻ¨ā§āĻ¯ R-āĻ āĻāĻāĻ āĻāĻŋāĻ¨āĻŋāĻ¸ āĻā§āĻāĻžāĻŦā§ āĻāĻ°āĻŦā§āĻ¨ āĻ¤āĻž āĻā§āĻāĻā§ āĻŦā§āĻ° āĻāĻ°ā§āĻ¨ āĻāĻŦāĻ āĻāĻ° āĻŦāĻŋāĻĒāĻ°ā§āĻ¤ā§āĨ¤
āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§āĻ° āĻ¸āĻŽāĻ¯āĻŧ āĻāĻŽāĻ°āĻž R-āĻāĻ° āĻ¸āĻŦāĻā§āĻ¯āĻŧā§ āĻāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻ° āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖ āĻāĻ°āĻŦāĨ¤ āĻāĻā§āĻ˛āĻŋ āĻšāĻ˛ āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋāĻ¤ā§ āĻ
āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋ tidyverse
āĻāĻŦāĻ āĻĒā§āĻ¯āĻžāĻā§āĻāĻ data.table
. āĻāĻŦāĻ āĻ¤āĻžāĻĻā§āĻ° āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ° āĻ¸āĻžāĻĨā§ āĻ¤ā§āĻ˛āĻ¨āĻž āĻāĻ°ā§āĻ¨ pandas
, āĻĒāĻžāĻāĻĨāĻ¨ā§āĻ° āĻ¸āĻŦāĻā§āĻ¯āĻŧā§ āĻāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻĄā§āĻāĻž āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖ āĻĒā§āĻ¯āĻžāĻā§āĻāĨ¤
āĻāĻŽāĻ°āĻž āĻ§āĻžāĻĒā§ āĻ§āĻžāĻĒā§ āĻĄā§āĻāĻž āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖā§āĻ° āĻĒā§āĻ°ā§ āĻĒāĻĨāĻāĻŋ āĻ˛ā§āĻĄ āĻāĻ°āĻž āĻĨā§āĻā§ āĻĒāĻžāĻāĻĨāĻ¨ āĻāĻŦāĻ āĻāĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖāĻžāĻ¤ā§āĻŽāĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨ āĻ¸āĻŽā§āĻĒāĻžāĻĻāĻ¨ āĻāĻ°āĻŦāĨ¤
āĻ¸āĻ¨ā§āĻ¤ā§āĻˇā§āĻ
āĻāĻ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§āĻāĻŋ āĻāĻāĻāĻŋ āĻāĻŋāĻ āĻļā§āĻ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻ¯ā§āĻ¤ā§ āĻĒāĻžāĻ°ā§ āĻ¯āĻĻāĻŋ āĻāĻĒāĻ¨āĻŋ āĻā§āĻ˛ā§ āĻ¯āĻžāĻ¨ āĻ¯ā§ āĻā§āĻāĻžāĻŦā§ āĻŦāĻŋāĻŦā§āĻāĻ¨āĻžāĻ§ā§āĻ¨ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻāĻāĻāĻŋāĻ¤ā§ āĻāĻŋāĻā§ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻ¸ā§āĻ¸āĻŋāĻ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨ āĻāĻ°āĻ¤ā§ āĻšāĻ¯āĻŧā§ˇ
R āĻāĻŦāĻ Python āĻāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻĒā§āĻ°āĻ§āĻžāĻ¨ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻĒāĻžāĻ°ā§āĻĨāĻā§āĻ¯
1.1.āĻĒā§āĻ¯āĻžāĻā§āĻ āĻĢāĻžāĻāĻļāĻ¨ āĻ ā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ¸ āĻāĻ°āĻž
1.2.āĻ ā§āĻ¯āĻžāĻ¸āĻžāĻāĻ¨āĻŽā§āĻ¨ā§āĻ
1.3.āĻāĻ¨ā§āĻĄā§āĻā§āĻ¸
1.4.āĻĒāĻĻā§āĻ§āĻ¤āĻŋ āĻāĻŦāĻ OOP
1.5.āĻĒāĻžāĻāĻĒāĻ˛āĻžāĻāĻ¨
1.6.āĻāĻĒāĻžāĻ¤ā§āĻ¤ āĻāĻžāĻ āĻžāĻŽā§ āĻāĻŽāĻ°āĻž āĻ¯ā§ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻŦ āĻ¸ā§ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻā§ āĻāĻ¯āĻŧā§āĻāĻāĻŋ āĻļāĻŦā§āĻĻ
2.1.āĻĒāĻ°āĻŋāĻĒāĻžāĻāĻŋ
2.2.āĻĄā§āĻāĻž.āĻā§āĻ¯āĻžāĻŦāĻ˛
2.3.āĻĒāĻžāĻ¨ā§āĻĄāĻžāĻ¸ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻž āĻšāĻā§āĻā§ āĻ¤āĻĨā§āĻ¯ āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤ āĻšāĻā§āĻā§ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž āĻāĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻ ā§āĻ¯āĻžāĻā§āĻ°āĻŋāĻā§āĻļāĻ¨ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻāĻ˛ā§āĻ˛āĻŽā§āĻŦ āĻāĻāĻ¨āĻŋāĻ¯āĻŧāĻ¨ (UNION) āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻ¯ā§āĻāĻĻāĻžāĻ¨ (JOIN) āĻĒā§āĻ°āĻžāĻĨāĻŽāĻŋāĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻŦāĻ āĻāĻŖāĻ¨āĻž āĻāĻ°āĻž āĻāĻ˛āĻžāĻŽ R āĻāĻŦāĻ Python-āĻ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻ¸ā§āĻ¸āĻŋāĻ āĻĒāĻĻā§āĻ§āĻ¤āĻŋāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻāĻŋāĻ āĻŋāĻĒāĻ¤ā§āĻ°ā§āĻ° āĻ¸āĻžāĻ°āĻŖā§ āĻāĻĒāĻ¸āĻāĻšāĻžāĻ° āĻāĻĒāĻ¨āĻŋ āĻā§āĻ¨ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨ āĻ¸ā§ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻā§ āĻāĻāĻāĻŋ āĻ¸āĻāĻā§āĻˇāĻŋāĻĒā§āĻ¤ āĻ¸āĻŽā§āĻā§āĻˇāĻž
āĻāĻĒāĻ¨āĻŋ āĻ¯āĻĻāĻŋ āĻĄā§āĻāĻž āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖā§ āĻāĻā§āĻ°āĻšā§ āĻšāĻ¨ āĻ¤āĻŦā§ āĻāĻĒāĻ¨āĻŋ āĻāĻŽāĻžāĻ° āĻā§āĻāĻā§ āĻĒā§āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨
R āĻāĻŦāĻ Python āĻāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻĒā§āĻ°āĻ§āĻžāĻ¨ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻĒāĻžāĻ°ā§āĻĨāĻā§āĻ¯
āĻāĻĒāĻ¨āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻĒāĻžāĻāĻĨāĻ¨ āĻĨā§āĻā§ R-āĻ āĻ¸ā§āĻ¯ā§āĻāĻ āĻāĻ°āĻž āĻ¸āĻšāĻ āĻāĻ°āĻ¤ā§, āĻŦāĻž āĻāĻ° āĻŦāĻŋāĻĒāĻ°ā§āĻ¤ā§, āĻāĻŽāĻŋ āĻāĻ¯āĻŧā§āĻāĻāĻŋ āĻĒā§āĻ°āĻ§āĻžāĻ¨ āĻĒāĻ¯āĻŧā§āĻ¨ā§āĻ āĻĻā§āĻŦ āĻ¯āĻž āĻāĻĒāĻ¨āĻžāĻā§ āĻŽāĻ¨ā§āĻ¯ā§āĻ āĻĻāĻŋāĻ¤ā§ āĻšāĻŦā§āĨ¤
āĻĒā§āĻ¯āĻžāĻā§āĻ āĻĢāĻžāĻāĻļāĻ¨ āĻ ā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ¸ āĻāĻ°āĻž
āĻāĻāĻŦāĻžāĻ° āĻāĻāĻāĻŋ āĻĒā§āĻ¯āĻžāĻā§āĻ R-āĻ āĻ˛ā§āĻĄ āĻšāĻ¯āĻŧā§ āĻā§āĻ˛ā§, āĻĒā§āĻ¯āĻžāĻā§āĻā§āĻ° āĻĢāĻžāĻāĻļāĻ¨ āĻ
ā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ¸ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻāĻĒāĻ¨āĻžāĻā§ āĻĒā§āĻ¯āĻžāĻā§āĻā§āĻ° āĻ¨āĻžāĻŽ āĻāĻ˛ā§āĻ˛ā§āĻ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§ āĻ¨āĻžāĨ¤ āĻŦā§āĻļāĻŋāĻ°āĻāĻžāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§ āĻāĻāĻŋ R-āĻ āĻ¸āĻžāĻ§āĻžāĻ°āĻŖ āĻ¨āĻ¯āĻŧ, āĻ¤āĻŦā§ āĻāĻāĻŋ āĻā§āĻ°āĻšāĻŖāĻ¯ā§āĻā§āĻ¯āĨ¤ āĻāĻĒāĻ¨āĻžāĻ° āĻā§āĻĄā§ āĻāĻ° āĻāĻāĻāĻŋ āĻĢāĻžāĻāĻļāĻ¨ āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ āĻšāĻ˛ā§ āĻāĻĒāĻ¨āĻžāĻā§ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻŽāĻĻāĻžāĻ¨āĻŋ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§ āĻ¨āĻž, āĻ¤āĻŦā§ āĻĒā§āĻ¯āĻžāĻā§āĻā§āĻ° āĻ¨āĻžāĻŽ āĻāĻŦāĻ āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻ¨āĻžāĻŽ āĻāĻ˛ā§āĻ˛ā§āĻ āĻāĻ°ā§ āĻāĻāĻŋāĻā§ āĻāĻ˛ āĻāĻ°ā§āĻ¨āĨ¤ R-āĻ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻŦāĻ āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻ¨āĻžāĻŽā§āĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻŦāĻŋāĻāĻžāĻāĻ āĻšāĻ˛ āĻāĻāĻāĻŋ āĻĄāĻžāĻŦāĻ˛ āĻā§āĻ˛āĻ¨āĨ¤ package_name::function_name()
.
āĻĒāĻžāĻāĻĨāĻ¨ā§, āĻŦāĻŋāĻĒāĻ°ā§āĻ¤ā§, āĻāĻāĻāĻŋ āĻĒā§āĻ¯āĻžāĻā§āĻā§āĻ° āĻĢāĻžāĻāĻļāĻ¨āĻā§ āĻ¸ā§āĻĒāĻˇā§āĻāĻāĻžāĻŦā§ āĻ¨āĻžāĻŽ āĻāĻ˛ā§āĻ˛ā§āĻ āĻāĻ°ā§ āĻāĻ˛ āĻāĻ°āĻžāĻā§ āĻā§āĻ˛āĻžāĻ¸āĻŋāĻ āĻŦāĻ˛ā§ āĻŽāĻ¨ā§ āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤ āĻ¯āĻāĻ¨ āĻāĻāĻāĻŋ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻĄāĻžāĻāĻ¨āĻ˛ā§āĻĄ āĻāĻ°āĻž āĻšāĻ¯āĻŧ, āĻ¤āĻāĻ¨ āĻāĻāĻŋ āĻ¸āĻžāĻ§āĻžāĻ°āĻŖāĻ¤ āĻāĻāĻāĻŋ āĻ¸āĻāĻā§āĻˇāĻŋāĻĒā§āĻ¤ āĻ¨āĻžāĻŽ āĻĻā§āĻāĻ¯āĻŧāĻž āĻšāĻ¯āĻŧ, āĻ¯ā§āĻŽāĻ¨ pandas
āĻ¸āĻžāĻ§āĻžāĻ°āĻŖāĻ¤ āĻāĻāĻāĻŋ āĻāĻĻā§āĻŽāĻ¨āĻžāĻŽ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧ pd
. āĻāĻāĻāĻŋ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻāĻāĻŋ āĻĄāĻ āĻŽāĻžāĻ§ā§āĻ¯āĻŽā§ āĻ
ā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ¸ āĻāĻ°āĻž āĻšāĻ¯āĻŧ package_name.function_name()
.
āĻ ā§āĻ¯āĻžāĻ¸āĻžāĻāĻ¨āĻŽā§āĻ¨ā§āĻ
R-āĻ, āĻāĻāĻāĻŋ āĻŦāĻ¸ā§āĻ¤ā§āĻ° āĻŽāĻžāĻ¨ āĻ¨āĻŋāĻ°ā§āĻ§āĻžāĻ°āĻŖā§āĻ° āĻāĻ¨ā§āĻ¯ āĻāĻāĻāĻŋ āĻ¤ā§āĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻ¸āĻžāĻ§āĻžāĻ°āĻŖāĨ¤ obj_name <- value
, āĻ¯āĻĻāĻŋāĻ āĻāĻāĻāĻŋ āĻāĻāĻ āĻ¸āĻŽāĻžāĻ¨ āĻāĻŋāĻšā§āĻ¨ āĻ
āĻ¨ā§āĻŽā§āĻĻāĻŋāĻ¤, R-āĻ āĻāĻāĻ āĻ¸āĻŽāĻžāĻ¨ āĻāĻŋāĻšā§āĻ¨āĻāĻŋ āĻĒā§āĻ°āĻžāĻĨāĻŽāĻŋāĻāĻāĻžāĻŦā§ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻā§ āĻŽāĻžāĻ¨ āĻĒāĻžāĻ¸ āĻāĻ°āĻ¤ā§ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧāĨ¤
āĻĒāĻžāĻāĻĨāĻ¨ā§, āĻ
ā§āĻ¯āĻžāĻ¸āĻžāĻāĻ¨āĻŽā§āĻ¨ā§āĻ āĻāĻāĻā§āĻāĻŋāĻ¯āĻŧāĻžāĻāĻžāĻŦā§ āĻāĻāĻ āĻ¸āĻŽāĻžāĻ¨ āĻāĻŋāĻšā§āĻ¨ āĻĻāĻŋāĻ¯āĻŧā§ āĻāĻ°āĻž āĻšāĻ¯āĻŧ obj_name = value
.
āĻāĻ¨ā§āĻĄā§āĻā§āĻ¸
āĻāĻāĻžāĻ¨ā§āĻ āĻŦā§āĻļ āĻāĻ˛ā§āĻ˛ā§āĻāĻ¯ā§āĻā§āĻ¯ āĻĒāĻžāĻ°ā§āĻĨāĻā§āĻ¯ āĻ°āĻ¯āĻŧā§āĻā§āĨ¤ R-āĻ, āĻ¸ā§āĻā§āĻāĻ°āĻŖ āĻāĻ āĻĨā§āĻā§ āĻļā§āĻ°ā§ āĻšāĻ¯āĻŧ āĻāĻŦāĻ āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻĒāĻ°āĻŋāĻ¸āĻ°ā§ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻāĻĒāĻžāĻĻāĻžāĻ¨ āĻ āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤ āĻāĻ°ā§,
āĻĒāĻžāĻāĻĨāĻ¨ā§, āĻ¸ā§āĻā§āĻāĻ°āĻŖ āĻļā§āĻ¨ā§āĻ¯ āĻĨā§āĻā§ āĻļā§āĻ°ā§ āĻšāĻ¯āĻŧ āĻāĻŦāĻ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻŋāĻ¤ āĻĒāĻ°āĻŋāĻ¸āĻ°ā§ āĻ¸ā§āĻā§āĻ¤ā§ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻāĻ°āĻž āĻļā§āĻˇ āĻāĻĒāĻžāĻĻāĻžāĻ¨āĻāĻŋ āĻ
āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤ āĻāĻ°āĻž āĻšāĻ¯āĻŧ āĻ¨āĻžāĨ¤ āĻ¤āĻžāĻ āĻĄāĻŋāĻāĻžāĻāĻ¨ x[i:j]
āĻĒāĻžāĻāĻĨāĻ¨ā§ j āĻāĻĒāĻžāĻĻāĻžāĻ¨ āĻ
āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤ āĻšāĻŦā§ āĻ¨āĻžāĨ¤
R āĻ¸ā§āĻŦāĻ°āĻ˛āĻŋāĻĒāĻŋāĻ¤ā§ āĻ¨ā§āĻ¤āĻŋāĻŦāĻžāĻāĻ āĻ¸ā§āĻā§āĻāĻ°āĻŖā§āĻ° āĻŽāĻ§ā§āĻ¯ā§āĻ āĻĒāĻžāĻ°ā§āĻĨāĻā§āĻ¯ āĻ°āĻ¯āĻŧā§āĻā§ x[-1]
āĻļā§āĻˇāĻāĻŋ āĻāĻžāĻĄāĻŧāĻž āĻā§āĻā§āĻāĻ°ā§āĻ° āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻāĻĒāĻžāĻĻāĻžāĻ¨ āĻĢāĻŋāĻ°āĻŋāĻ¯āĻŧā§ āĻĻā§āĻŦā§āĨ¤ āĻĒāĻžāĻāĻĨāĻ¨ā§, āĻāĻāĻāĻŋ āĻ
āĻ¨ā§āĻ°ā§āĻĒ āĻ¸ā§āĻŦāĻ°āĻ˛āĻŋāĻĒāĻŋ āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° āĻļā§āĻˇ āĻāĻĒāĻžāĻĻāĻžāĻ¨ āĻĒā§āĻ°āĻĻāĻžāĻ¨ āĻāĻ°āĻŦā§āĨ¤
āĻĒāĻĻā§āĻ§āĻ¤āĻŋ āĻāĻŦāĻ OOP
R āĻ¤āĻžāĻ° āĻ¨āĻŋāĻāĻ¸ā§āĻŦ āĻāĻĒāĻžāĻ¯āĻŧā§ OOP āĻĒā§āĻ°āĻ¯āĻŧā§āĻ āĻāĻ°ā§, āĻāĻŽāĻŋ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§ āĻāĻāĻŋ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻā§ āĻ˛āĻŋāĻā§āĻāĻŋ tydiverse
āĻāĻ° āĻā§āĻ¯āĻŧā§ āĻ¸āĻšāĻ āĻšāĻŦā§ pandas
. āĻ¯āĻĻāĻŋāĻ āĻāĻāĻž āĻāĻŽāĻžāĻ° āĻŦāĻŋāĻˇāĻ¯āĻŧāĻāĻ¤ āĻŽāĻ¤āĻžāĻŽāĻ¤ āĻšāĻ¤ā§ āĻĒāĻžāĻ°ā§āĨ¤
āĻ¸āĻāĻā§āĻˇā§āĻĒā§, R-āĻāĻ° āĻ āĻŦāĻā§āĻā§āĻā§āĻ° āĻĒāĻĻā§āĻ§āĻ¤āĻŋ āĻ¨ā§āĻ (āĻ¯āĻĻāĻŋ āĻāĻŽāĻ°āĻž S3 āĻā§āĻ˛āĻžāĻ¸ā§āĻ° āĻāĻĨāĻž āĻŦāĻ˛āĻŋ, āĻ¤āĻŦā§ āĻ āĻ¨ā§āĻ¯āĻžāĻ¨ā§āĻ¯ OOP āĻŦāĻžāĻ¸ā§āĻ¤āĻŦāĻžāĻ¯āĻŧāĻ¨ āĻ°āĻ¯āĻŧā§āĻā§ āĻ¯āĻž āĻ āĻ¨ā§āĻ āĻāĻŽ āĻ¸āĻžāĻ§āĻžāĻ°āĻŖ)āĨ¤ āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° āĻ¸āĻžāĻ§āĻžāĻ°āĻŖā§āĻā§āĻ¤ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻā§ āĻ¯ā§āĻā§āĻ˛āĻŋ āĻŦāĻ¸ā§āĻ¤ā§āĻ° āĻļā§āĻ°ā§āĻŖā§āĻ° āĻāĻĒāĻ° āĻ¨āĻŋāĻ°ā§āĻāĻ° āĻāĻ°ā§ āĻāĻŋāĻ¨ā§āĻ¨āĻāĻžāĻŦā§ āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻž āĻāĻ°ā§āĨ¤
āĻĒāĻžāĻāĻĒāĻ˛āĻžāĻāĻ¨
āĻ¸āĻŽā§āĻāĻŦāĻ¤ āĻāĻ āĻāĻ¨ā§āĻ¯ āĻ¨āĻžāĻŽ pandas
āĻāĻāĻŋ āĻ¸āĻŽā§āĻĒā§āĻ°ā§āĻŖāĻ°ā§āĻĒā§ āĻ¸āĻ āĻŋāĻ āĻšāĻŦā§ āĻ¨āĻž, āĻ¤āĻŦā§ āĻāĻŽāĻŋ āĻ
āĻ°ā§āĻĨ āĻŦā§āĻ¯āĻžāĻā§āĻ¯āĻž āĻāĻ°āĻžāĻ° āĻā§āĻˇā§āĻāĻž āĻāĻ°āĻŦāĨ¤
āĻŽāĻ§ā§āĻ¯āĻŦāĻ°ā§āĻ¤ā§ āĻāĻŖāĻ¨āĻžāĻā§āĻ˛āĻŋ āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻ¨āĻž āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻāĻŦāĻ āĻāĻžāĻā§āĻ° āĻĒāĻ°āĻŋāĻŦā§āĻļā§ āĻ āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻŦāĻ¸ā§āĻ¤ā§ āĻ¤ā§āĻ°āĻŋ āĻ¨āĻž āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯, āĻāĻĒāĻ¨āĻŋ āĻāĻ āĻ§āĻ°āĻŖā§āĻ° āĻĒāĻžāĻāĻĒāĻ˛āĻžāĻāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨āĨ¤ āĻ¸ā§āĻā§āĻ˛ā§. āĻāĻāĻāĻŋ āĻāĻŖāĻ¨āĻžāĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻāĻāĻāĻŋ āĻĢāĻžāĻāĻļāĻ¨ āĻĨā§āĻā§ āĻĒāĻ°āĻŦāĻ°ā§āĻ¤ā§āĻ¤ā§ āĻĒāĻžāĻ¸ āĻāĻ°ā§āĻ¨ āĻāĻŦāĻ āĻŽāĻ§ā§āĻ¯āĻŦāĻ°ā§āĻ¤ā§ āĻĢāĻ˛āĻžāĻĢāĻ˛āĻā§āĻ˛āĻŋ āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻāĻ°āĻŦā§āĻ¨ āĻ¨āĻžāĨ¤
āĻāĻ¸ā§āĻ¨ āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻāĻŋāĻ¤ āĻā§āĻĄ āĻāĻĻāĻžāĻšāĻ°āĻŖāĻāĻŋ āĻ¨ā§āĻāĻ¯āĻŧāĻž āĻ¯āĻžāĻ, āĻ¯ā§āĻāĻžāĻ¨ā§ āĻāĻŽāĻ°āĻž āĻĒā§āĻĨāĻ āĻŦāĻ¸ā§āĻ¤ā§āĻ¤ā§ āĻŽāĻ§ā§āĻ¯āĻŦāĻ°ā§āĻ¤ā§ āĻāĻŖāĻ¨āĻž āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻāĻ°āĻŋ:
temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )
āĻāĻŽāĻ°āĻž āĻā§āĻ°āĻŽāĻžāĻ¨ā§āĻ¸āĻžāĻ°ā§ 3āĻāĻŋ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨ āĻāĻ°ā§āĻāĻŋ āĻāĻŦāĻ āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋāĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻāĻāĻāĻŋ āĻĒā§āĻĨāĻ āĻŦāĻ¸ā§āĻ¤ā§āĻ¤ā§ āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻāĻŋāĻ˛āĨ¤ āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻāĻ¸āĻ˛ā§, āĻāĻŽāĻžāĻĻā§āĻ° āĻāĻ āĻŽāĻ§ā§āĻ¯āĻŦāĻ°ā§āĻ¤ā§ āĻŦāĻ¸ā§āĻ¤ā§āĻ° āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ āĻ¨ā§āĻāĨ¤
āĻŦāĻž āĻāĻ°āĻ āĻāĻžāĻ°āĻžāĻĒ, āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻāĻā§āĻ¸ā§āĻ˛ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°āĻāĻžāĻ°ā§āĻĻā§āĻ° āĻāĻžāĻā§ āĻāĻ°āĻ āĻĒāĻ°āĻŋāĻāĻŋāĻ¤āĨ¤
obj <- func3(func2(func1()))
āĻāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§, āĻāĻŽāĻ°āĻž āĻŽāĻ§ā§āĻ¯āĻŦāĻ°ā§āĻ¤ā§ āĻāĻŖāĻ¨āĻžāĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻāĻ°āĻŋāĻ¨āĻŋ, āĻ¤āĻŦā§ āĻ¨ā§āĻ¸ā§āĻā§āĻĄ āĻĢāĻžāĻāĻļāĻ¨ āĻ¸āĻš āĻā§āĻĄ āĻĒāĻĄāĻŧāĻž āĻ āĻ¤ā§āĻ¯āĻ¨ā§āĻ¤ āĻ āĻ¸ā§āĻŦāĻŋāĻ§āĻžāĻāĻ¨āĻāĨ¤
āĻāĻŽāĻ°āĻž R-āĻ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ°āĻŖā§āĻ° āĻŦāĻŋāĻāĻŋāĻ¨ā§āĻ¨ āĻĒāĻĻā§āĻ§āĻ¤āĻŋāĻ° āĻĻāĻŋāĻā§ āĻ¤āĻžāĻāĻžāĻŦ āĻāĻŦāĻ āĻ¤āĻžāĻ°āĻž āĻŦāĻŋāĻāĻŋāĻ¨ā§āĻ¨ āĻāĻĒāĻžāĻ¯āĻŧā§ āĻāĻāĻ āĻ§āĻ°āĻ¨ā§āĻ° āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ˛āĻžāĻĒ āĻ¸āĻŽā§āĻĒāĻžāĻĻāĻ¨ āĻāĻ°ā§āĨ¤
āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋāĻ¤ā§ āĻĒāĻžāĻāĻĒāĻ˛āĻžāĻāĻ¨ tidyverse
āĻ
āĻĒāĻžāĻ°ā§āĻāĻ° āĻĻā§āĻŦāĻžāĻ°āĻž āĻŦāĻžāĻ¸ā§āĻ¤āĻŦāĻžāĻ¯āĻŧāĻŋāĻ¤ %>%
.
obj <- func1() %>%
func2() %>%
func3()
āĻāĻāĻāĻžāĻŦā§ āĻāĻŽāĻ°āĻž āĻāĻžāĻā§āĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻā§āĻ°āĻšāĻŖ āĻāĻ°āĻŋ func1()
āĻāĻŦāĻ āĻĒā§āĻ°āĻĨāĻŽ āĻ¯ā§āĻā§āĻ¤āĻŋ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻāĻāĻŋ āĻĒāĻžāĻ¸ func2()
, āĻ¤āĻžāĻ°āĻĒāĻ° āĻāĻŽāĻ°āĻž āĻĒā§āĻ°āĻĨāĻŽ āĻ¯ā§āĻā§āĻ¤āĻŋ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻāĻ āĻāĻŖāĻ¨āĻžāĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻĒāĻžāĻ¸ āĻāĻ°āĻŋ func3()
. āĻāĻŦāĻ āĻļā§āĻˇ āĻĒāĻ°ā§āĻ¯āĻ¨ā§āĻ¤, āĻāĻŽāĻ°āĻž āĻŦāĻ¸ā§āĻ¤ā§āĻ¤ā§ āĻ¸āĻā§āĻāĻžāĻ˛āĻŋāĻ¤ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻāĻŖāĻ¨āĻž āĻ˛āĻŋāĻāĻŋ obj <-
.
āĻāĻĒāĻ°ā§āĻ° āĻ¸āĻŦāĻā§āĻ˛ā§āĻ āĻāĻ āĻŽā§āĻŽā§āĻ° āĻŽāĻžāĻ§ā§āĻ¯āĻŽā§ āĻļāĻŦā§āĻĻā§āĻ° āĻā§āĻ¯āĻŧā§ āĻāĻžāĻ˛ā§āĻāĻžāĻŦā§ āĻāĻŋāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§:
Đ data.table
āĻā§āĻāĻ¨ āĻāĻāĻ āĻāĻžāĻŦā§ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤
newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]
āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻāĻĒāĻ¨āĻŋ āĻāĻā§āĻ° āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨ā§āĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨āĨ¤
Đ pandas
āĻāĻ āĻ§āĻ°āĻ¨ā§āĻ° āĻ
āĻĒāĻžāĻ°ā§āĻļāĻ¨ āĻāĻāĻāĻŋ āĻŦāĻŋāĻ¨ā§āĻĻā§ āĻĻā§āĻŦāĻžāĻ°āĻž āĻĒā§āĻĨāĻ āĻāĻ°āĻž āĻšāĻ¯āĻŧ.
obj = df.fun1().fun2().fun3()
āĻ¸ā§āĻā§āĻ˛ā§. āĻāĻŽāĻ°āĻž āĻāĻŽāĻžāĻĻā§āĻ° āĻā§āĻŦāĻŋāĻ˛ āĻ¨āĻŋāĻ¤ā§ df āĻāĻŦāĻ āĻ¤āĻžāĻ° āĻĒāĻĻā§āĻ§āĻ¤āĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨ fun1()
, āĻ¤āĻžāĻ°āĻĒāĻ° āĻāĻŽāĻ°āĻž āĻĒā§āĻ°āĻžāĻĒā§āĻ¤ āĻĢāĻ˛āĻžāĻĢāĻ˛ā§ āĻĒāĻĻā§āĻ§āĻ¤āĻŋāĻāĻŋ āĻĒā§āĻ°āĻ¯āĻŧā§āĻ āĻāĻ°āĻŋ fun2()
āĻĒāĻ°ā§ fun3()
. āĻĢāĻ˛āĻ¸ā§āĻŦāĻ°ā§āĻĒ āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻāĻāĻāĻŋ āĻŦāĻ¸ā§āĻ¤ā§āĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻāĻ°āĻž āĻšāĻ¯āĻŧ āĻāĻĒāĻ¤ā§āĻ¤āĻŋ .
āĻāĻĒāĻžāĻ¤ā§āĻ¤ āĻāĻžāĻ āĻžāĻŽā§
R āĻāĻŦāĻ Python-āĻ āĻĄā§āĻāĻž āĻ¸ā§āĻā§āĻ°āĻžāĻāĻāĻžāĻ° āĻāĻāĻ āĻ°āĻāĻŽ, āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻāĻŋāĻ¨ā§āĻ¨ āĻ¨āĻžāĻŽ āĻāĻā§āĨ¤
āĻŦāĻŋāĻŦāĻ°āĻŖ
āĻāĻ°-āĻ āĻ¨āĻžāĻŽ
āĻĒāĻžāĻāĻĨāĻ¨/āĻĒāĻžāĻ¨ā§āĻĄāĻžāĻ¸ā§ āĻ¨āĻžāĻŽ
āĻā§āĻŦāĻŋāĻ˛ āĻāĻ āĻ¨
data.frame, data.table, tibble
āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ
āĻŽāĻžāĻ¨āĻā§āĻ˛āĻŋāĻ° āĻāĻ-āĻŽāĻžāĻ¤ā§āĻ°āĻŋāĻ āĻ¤āĻžāĻ˛āĻŋāĻāĻž
āĻā§āĻā§āĻāĻ°
āĻŦāĻŋāĻļā§āĻĻā§āĻ§ āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĒāĻžāĻ¨ā§āĻĄāĻž āĻŦāĻž āĻ¤āĻžāĻ˛āĻŋāĻāĻžāĻ¯āĻŧ āĻ¸āĻŋāĻ°āĻŋāĻ
āĻŽāĻžāĻ˛ā§āĻāĻŋ-āĻ˛ā§āĻā§āĻ˛ āĻ¨āĻ¨-āĻā§āĻŦā§āĻ˛āĻžāĻ° āĻ¸ā§āĻā§āĻ°āĻžāĻāĻāĻžāĻ°
āĻ¤āĻžāĻ˛āĻŋāĻāĻž
āĻ
āĻāĻŋāĻ§āĻžāĻ¨ (āĻĄāĻŋāĻā§āĻ)
āĻāĻŽāĻ°āĻž āĻ¨ā§āĻā§ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ° āĻ āĻ¨ā§āĻ¯āĻžāĻ¨ā§āĻ¯ āĻŦā§āĻļāĻŋāĻˇā§āĻā§āĻ¯ āĻāĻŦāĻ āĻĒāĻžāĻ°ā§āĻĨāĻā§āĻ¯āĻā§āĻ˛āĻŋ āĻĻā§āĻāĻŦāĨ¤
āĻāĻŽāĻ°āĻž āĻ¯ā§ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻŦ āĻ¸ā§ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻā§ āĻāĻ¯āĻŧā§āĻāĻāĻŋ āĻļāĻŦā§āĻĻ
āĻĒā§āĻ°āĻĨāĻŽā§, āĻāĻŽāĻŋ āĻāĻĒāĻ¨āĻžāĻā§ āĻ¸ā§āĻ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻā§ āĻāĻŋāĻā§ āĻŦāĻ˛āĻŦ āĻ¯āĻž āĻāĻĒāĻ¨āĻŋ āĻāĻ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§āĻ° āĻ¸āĻŽāĻ¯āĻŧ āĻĒāĻ°āĻŋāĻāĻŋāĻ¤ āĻšāĻŦā§āĻ¨āĨ¤
āĻĒāĻ°āĻŋāĻĒāĻžāĻāĻŋ
āĻ
āĻĢāĻŋāĻ¸āĻŋāĻ¯āĻŧāĻžāĻ˛ āĻāĻ¯āĻŧā§āĻŦāĻ¸āĻžāĻāĻ:
āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋ tidyverse
āĻšā§āĻĄāĻ˛āĻŋ āĻāĻāĻāĻšā§āĻ¯āĻžāĻŽ āĻ˛āĻŋāĻā§āĻā§āĻ¨, RStudio-āĻāĻ° āĻ¸āĻŋāĻ¨āĻŋāĻ¯āĻŧāĻ° āĻ°āĻŋāĻ¸āĻžāĻ°ā§āĻ āĻ¸āĻžāĻ¯āĻŧā§āĻ¨ā§āĻāĻŋāĻ¸ā§āĻāĨ¤ tidyverse
āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻ° āĻāĻāĻāĻŋ āĻāĻŋāĻ¤ā§āĻ¤āĻžāĻāĻ°ā§āĻˇāĻ āĻ¸ā§āĻ āĻ°āĻ¯āĻŧā§āĻā§ āĻ¯āĻž āĻĄā§āĻāĻž āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ°āĻŖāĻā§ āĻ¸āĻšāĻ āĻāĻ°ā§, āĻ¯āĻžāĻ° āĻŽāĻ§ā§āĻ¯ā§ 5āĻāĻŋ CRAN āĻ¸āĻāĻā§āĻ°āĻšāĻ¸ā§āĻĨāĻ˛ āĻĨā§āĻā§ āĻļā§āĻ°ā§āĻˇ 10āĻāĻŋ āĻĄāĻžāĻāĻ¨āĻ˛ā§āĻĄā§āĻ° āĻ
āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤āĨ¤
āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋāĻ° āĻŽā§āĻ˛ āĻ
āĻāĻļā§ āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻāĻŋāĻ¤ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋ āĻ°āĻ¯āĻŧā§āĻā§: ggplot2
, dplyr
, tidyr
, readr
, purrr
, tibble
, stringr
, forcats
. āĻāĻ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻ° āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻāĻāĻāĻŋ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻ¸āĻŽāĻ¸ā§āĻ¯āĻž āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ā§āĻ° āĻ˛āĻā§āĻˇā§āĻ¯ā§āĨ¤ āĻāĻĻāĻžāĻšāĻ°āĻŖ āĻ¸ā§āĻŦāĻ°ā§āĻĒ dplyr
āĻĄā§āĻāĻž āĻŽā§āĻ¯āĻžāĻ¨āĻŋāĻĒā§āĻ˛ā§āĻļāĻ¨ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§, tidyr
āĻāĻāĻāĻŋ āĻāĻ°āĻāĻ°ā§ āĻĢāĻ°ā§āĻŽ āĻ¤āĻĨā§āĻ¯ āĻāĻ¨āĻ¤ā§, stringr
āĻ¸ā§āĻā§āĻ°āĻŋāĻ āĻĻāĻŋāĻ¯āĻŧā§ āĻāĻžāĻ āĻ¸āĻšāĻ āĻāĻ°ā§, āĻāĻŦāĻ ggplot2
āĻ¸āĻŦāĻā§āĻ¯āĻŧā§ āĻāĻ¨āĻĒā§āĻ°āĻŋāĻ¯āĻŧ āĻ¤āĻĨā§āĻ¯ āĻāĻŋāĻā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ˛āĻžāĻāĻā§āĻļāĻ¨ āĻā§āĻ˛ āĻāĻ.
āĻ¸ā§āĻŦāĻŋāĻ§āĻž tidyverse
āĻ¸āĻ°āĻ˛āĻ¤āĻž āĻāĻŦāĻ āĻ¸āĻšāĻā§ āĻĒāĻžāĻ ā§āĻ¯ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸, āĻ¯āĻž āĻ
āĻ¨ā§āĻ āĻĻāĻŋāĻ āĻĨā§āĻā§ āĻāĻ¸āĻāĻŋāĻāĻāĻ˛ āĻā§āĻ¯āĻŧā§āĻ°āĻŋ āĻāĻžāĻˇāĻžāĻ° āĻŽāĻ¤ā§āĨ¤
āĻĄā§āĻāĻž.āĻā§āĻ¯āĻžāĻŦāĻ˛
āĻĻā§āĻŦāĻžāĻ°āĻž data.table
H2O.ai-āĻāĻ° āĻŽā§āĻ¯āĻžāĻ āĻĄāĻ˛āĨ¤
āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋāĻ° āĻĒā§āĻ°āĻĨāĻŽ āĻĒā§āĻ°āĻāĻžāĻļ 2006 āĻ¸āĻžāĻ˛ā§ āĻšāĻ¯āĻŧā§āĻāĻŋāĻ˛āĨ¤
āĻĒā§āĻ¯āĻžāĻā§āĻ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻāĻ° āĻŽāĻ¤ā§ āĻ¸ā§āĻŦāĻŋāĻ§āĻžāĻāĻ¨āĻ āĻ¨āĻ¯āĻŧ tidyverse
āĻāĻŦāĻ R-āĻ āĻā§āĻ˛āĻžāĻ¸āĻŋāĻ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽāĻā§āĻ˛āĻŋāĻ° āĻāĻ°āĻ āĻŦā§āĻļāĻŋ āĻ¸ā§āĻŽāĻ°āĻŖ āĻāĻ°āĻŋāĻ¯āĻŧā§ āĻĻā§āĻ¯āĻŧ, āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻāĻāĻ āĻ¸āĻŽāĻ¯āĻŧā§ āĻāĻžāĻ°ā§āĻ¯āĻāĻžāĻ°āĻŋāĻ¤āĻž āĻāĻ˛ā§āĻ˛ā§āĻāĻ¯ā§āĻā§āĻ¯āĻāĻžāĻŦā§ āĻĒā§āĻ°āĻ¸āĻžāĻ°āĻŋāĻ¤āĨ¤
āĻāĻ āĻĒā§āĻ¯āĻžāĻā§āĻā§āĻ° āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ¸āĻžāĻĨā§ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻŽā§āĻ¯āĻžāĻ¨āĻŋāĻĒā§āĻ˛ā§āĻļāĻ¨āĻā§āĻ˛āĻŋ āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻŦāĻ°ā§āĻŖāĻ¨āĻž āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§ āĻāĻŦāĻ āĻāĻĒāĻ¨āĻŋ āĻ¯āĻĻāĻŋ āĻŦāĻžāĻā§āĻ¯ āĻāĻ āĻ¨ āĻ
āĻ¨ā§āĻŦāĻžāĻĻ āĻāĻ°ā§āĻ¨ data.table
āĻāĻ¸āĻāĻŋāĻāĻāĻ˛-āĻ, āĻāĻĒāĻ¨āĻŋ āĻāĻ°āĻāĻŽ āĻāĻŋāĻā§ āĻĒāĻžāĻŦā§āĻ¨: data.table[ WHERE, SELECT, GROUP BY ]
āĻāĻ āĻĒā§āĻ¯āĻžāĻā§āĻā§āĻ° āĻļāĻā§āĻ¤āĻŋ āĻšāĻ˛ āĻŦāĻŋāĻĒā§āĻ˛ āĻĒāĻ°āĻŋāĻŽāĻžāĻŖ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ°āĻŖā§āĻ° āĻāĻ¤āĻŋāĨ¤
āĻĒāĻžāĻ¨ā§āĻĄāĻžāĻ¸
āĻ
āĻĢāĻŋāĻ¸āĻŋāĻ¯āĻŧāĻžāĻ˛ āĻāĻ¯āĻŧā§āĻŦāĻ¸āĻžāĻāĻ:
āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋāĻ° āĻ¨āĻžāĻŽāĻāĻŋ āĻāĻ¸ā§āĻā§ āĻāĻā§āĻ¨ā§āĻŽā§āĻā§āĻ°āĻŋāĻ āĻļāĻŦā§āĻĻ "āĻĒā§āĻ¯āĻžāĻ¨ā§āĻ˛ āĻĄā§āĻāĻž" āĻĨā§āĻā§, āĻ¯āĻž āĻ¤āĻĨā§āĻ¯ā§āĻ° āĻŦāĻšā§āĻŽāĻžāĻ¤ā§āĻ°āĻŋāĻ āĻāĻžāĻ āĻžāĻŽā§āĻāĻ¤ āĻ¸ā§āĻāĻā§āĻ˛āĻŋāĻā§ āĻŦāĻ°ā§āĻŖāĻ¨āĻž āĻāĻ°āĻ¤ā§ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧāĨ¤
āĻĻā§āĻŦāĻžāĻ°āĻž pandas
āĻāĻŽā§āĻ°āĻŋāĻāĻžāĻ¨ āĻāĻ¯āĻŧā§āĻ¸ āĻŽā§āĻ¯āĻžāĻāĻāĻŋāĻ¨āĻŋāĨ¤
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĄā§āĻāĻž āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖā§āĻ° āĻā§āĻˇā§āĻ¤ā§āĻ°ā§ āĻ¸āĻŽāĻžāĻ¨ pandas
āĻ¨āĻž. āĻāĻāĻāĻŋ āĻ
āĻ¤ā§āĻ¯āĻ¨ā§āĻ¤ āĻŦāĻšā§āĻŽā§āĻā§, āĻāĻā§āĻ-āĻ¸ā§āĻ¤āĻ°ā§āĻ° āĻĒā§āĻ¯āĻžāĻā§āĻ āĻ¯āĻž āĻāĻĒāĻ¨āĻžāĻā§ āĻĄā§āĻāĻžāĻ° āĻ¸āĻžāĻĨā§ āĻ¯ā§ āĻā§āĻ¨āĻ āĻŽā§āĻ¯āĻžāĻ¨āĻŋāĻĒā§āĻ˛ā§āĻļāĻ¨ āĻāĻ°āĻ¤ā§ āĻĻā§āĻ¯āĻŧ, āĻ¯ā§ āĻā§āĻ¨āĻ āĻāĻ¤ā§āĻ¸ āĻĨā§āĻā§ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻāĻ°āĻž āĻĨā§āĻā§ āĻļā§āĻ°ā§ āĻāĻ°ā§ āĻāĻāĻŋāĻā§ āĻāĻ˛ā§āĻĒāĻ¨āĻž āĻāĻ°āĻž āĻĒāĻ°ā§āĻ¯āĻ¨ā§āĻ¤āĨ¤
āĻ āĻ¤āĻŋāĻ°āĻŋāĻā§āĻ¤ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻž āĻšāĻā§āĻā§
āĻāĻ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§ āĻāĻ˛ā§āĻāĻ¨āĻž āĻāĻ°āĻž āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋ āĻŽā§āĻ˛āĻŋāĻ R āĻāĻŦāĻ Python āĻŦāĻŋāĻ¤āĻ°āĻŖā§ āĻ
āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤ āĻ¨āĻ¯āĻŧāĨ¤ āĻ¯āĻĻāĻŋāĻ āĻāĻāĻāĻŋ āĻā§āĻ āĻ¸āĻ¤āĻ°ā§āĻāĻ¤āĻž āĻ°āĻ¯āĻŧā§āĻā§, āĻāĻĒāĻ¨āĻŋ āĻ¯āĻĻāĻŋ āĻ
ā§āĻ¯āĻžāĻ¨āĻžāĻā§āĻ¨ā§āĻĄāĻž āĻŦāĻŋāĻ¤āĻ°āĻŖ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°ā§āĻ¨ āĻ¤āĻŦā§ āĻ
āĻ¤āĻŋāĻ°āĻŋāĻā§āĻ¤āĻāĻžāĻŦā§ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°ā§āĻ¨ pandas
āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ āĻ¨ā§āĻāĨ¤
R-āĻ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻž āĻšāĻā§āĻā§
āĻāĻĒāĻ¨āĻŋ āĻ¯āĻĻāĻŋ āĻ
āĻ¨ā§āĻ¤āĻ¤ āĻāĻāĻŦāĻžāĻ° RStudio āĻĄā§āĻā§āĻ˛āĻĒāĻŽā§āĻ¨ā§āĻ āĻāĻ¨āĻāĻžāĻ¯āĻŧāĻ°āĻ¨āĻŽā§āĻ¨ā§āĻ āĻā§āĻ˛ā§ āĻĨāĻžāĻā§āĻ¨, āĻ¤āĻžāĻšāĻ˛ā§ āĻāĻĒāĻ¨āĻŋ āĻ¸āĻŽā§āĻāĻŦāĻ¤ āĻāĻ¤āĻŋāĻŽāĻ§ā§āĻ¯ā§āĻ āĻāĻžāĻ¨ā§āĻ¨ āĻāĻŋāĻāĻžāĻŦā§ R-āĻ āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻ¤ā§ āĻšāĻ¯āĻŧāĨ¤ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻ¤ā§, āĻ¸ā§āĻā§āĻ¯āĻžāĻ¨ā§āĻĄāĻžāĻ°ā§āĻĄ āĻāĻŽāĻžāĻ¨ā§āĻĄ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨āĨ¤ install.packages()
āĻāĻāĻŋ āĻ¸āĻ°āĻžāĻ¸āĻ°āĻŋ R āĻ¨āĻŋāĻā§āĻ āĻāĻžāĻ˛āĻžāĻ¨ā§āĻ° āĻŽāĻžāĻ§ā§āĻ¯āĻŽā§āĨ¤
# ŅŅŅĐ°ĐŊОвĐēĐ° ĐŋĐ°ĐēĐĩŅОв
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")
āĻāĻ¨āĻ¸ā§āĻāĻ˛ā§āĻļāĻ¨ā§āĻ° āĻĒāĻ°ā§, āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻā§ āĻ¸āĻāĻ¯ā§āĻā§āĻ¤ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§, āĻ¯āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻŦā§āĻļāĻŋāĻ°āĻāĻžāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§ āĻāĻŽāĻžāĻ¨ā§āĻĄ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧ library()
.
# ĐŋОдĐēĐģŅŅĐĩĐŊиĐĩ иĐģи иĐŧĐŋĐžŅŅ ĐŋĐ°ĐēĐĩŅОв в ŅайОŅĐĩĐĩ ĐžĐēŅŅĐļĐĩĐŊиĐĩ
library(vroom)
library(readr)
library(dplyr)
library(data.table)
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻž āĻšāĻā§āĻā§
āĻ¸ā§āĻ¤āĻ°āĻžāĻ, āĻāĻĒāĻ¨āĻžāĻ° āĻ¯āĻĻāĻŋ āĻŦāĻŋāĻļā§āĻĻā§āĻ§ āĻĒāĻžāĻāĻĨāĻ¨ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻž āĻĨāĻžāĻā§, āĻ¤āĻžāĻšāĻ˛ā§ pandas
āĻāĻĒāĻ¨āĻžāĻā§ āĻŽā§āĻ¯āĻžāĻ¨ā§āĻ¯āĻŧāĻžāĻ˛āĻŋ āĻāĻāĻŋ āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§āĨ¤ āĻāĻĒāĻ¨āĻžāĻ° āĻ
āĻĒāĻžāĻ°ā§āĻāĻŋāĻ āĻ¸āĻŋāĻ¸ā§āĻā§āĻŽā§āĻ° āĻāĻĒāĻ° āĻ¨āĻŋāĻ°ā§āĻāĻ° āĻāĻ°ā§ āĻāĻāĻāĻŋ āĻāĻŽāĻžāĻ¨ā§āĻĄ āĻ˛āĻžāĻāĻ¨ āĻŦāĻž āĻāĻžāĻ°ā§āĻŽāĻŋāĻ¨āĻžāĻ˛ āĻā§āĻ˛ā§āĻ¨ āĻāĻŦāĻ āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻāĻŋāĻ¤ āĻāĻŽāĻžāĻ¨ā§āĻĄāĻāĻŋ āĻ˛āĻŋāĻā§āĻ¨āĨ¤
pip install pandas
āĻ¤āĻžāĻ°āĻĒāĻ°ā§ āĻāĻŽāĻ°āĻž āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĢāĻŋāĻ°ā§ āĻ¯āĻžāĻ āĻāĻŦāĻ āĻāĻŽāĻžāĻ¨ā§āĻĄ āĻ¸āĻš āĻāĻ¨āĻ¸ā§āĻāĻ˛ āĻāĻ°āĻž āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻŽāĻĻāĻžāĻ¨āĻŋ āĻāĻ°āĻŋ import
.
import pandas as pd
āĻ¤āĻĨā§āĻ¯ āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤ āĻšāĻā§āĻā§
āĻĄā§āĻāĻž āĻŽāĻžāĻāĻ¨āĻŋāĻ āĻĄā§āĻāĻž āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖā§āĻ° āĻ¸āĻŦāĻā§āĻ¯āĻŧā§ āĻā§āĻ°ā§āĻ¤ā§āĻŦāĻĒā§āĻ°ā§āĻŖ āĻĒāĻĻāĻā§āĻˇā§āĻĒāĻā§āĻ˛āĻŋāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻāĻāĻāĻŋāĨ¤ Python āĻāĻŦāĻ R āĻāĻāĻ¯āĻŧāĻ, āĻ¯āĻĻāĻŋ āĻāĻā§āĻāĻž āĻšāĻ¯āĻŧ, āĻāĻĒāĻ¨āĻžāĻā§ āĻ¯ā§āĻā§āĻ¨ āĻāĻ¤ā§āĻ¸ āĻĨā§āĻā§ āĻĄā§āĻāĻž āĻĒāĻžāĻāĻ¯āĻŧāĻžāĻ° āĻŦā§āĻ¯āĻžāĻĒāĻ āĻ¸ā§āĻ¯ā§āĻ āĻĒā§āĻ°āĻĻāĻžāĻ¨ āĻāĻ°ā§: āĻ¸ā§āĻĨāĻžāĻ¨ā§āĻ¯āĻŧ āĻĢāĻžāĻāĻ˛, āĻāĻ¨ā§āĻāĻžāĻ°āĻ¨ā§āĻ āĻĨā§āĻā§ āĻĢāĻžāĻāĻ˛, āĻāĻ¯āĻŧā§āĻŦāĻ¸āĻžāĻāĻ, āĻ¸āĻŦ āĻ§āĻ°āĻ¨ā§āĻ° āĻĄā§āĻāĻžāĻŦā§āĻ¸āĨ¤
āĻĒā§āĻ°ā§ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ āĻā§āĻĄāĻŧā§ āĻāĻŽāĻ°āĻž āĻŦā§āĻļ āĻāĻ¯āĻŧā§āĻāĻāĻŋ āĻĄā§āĻāĻžāĻ¸ā§āĻ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻŦ:
- Google Analytics āĻĨā§āĻā§ āĻĻā§āĻāĻŋ āĻĄāĻžāĻāĻ¨āĻ˛ā§āĻĄāĨ¤
- āĻāĻžāĻāĻāĻžāĻ¨āĻŋāĻ āĻĒā§āĻ¯āĻžāĻ¸ā§āĻā§āĻāĻžāĻ° āĻĄā§āĻāĻžāĻ¸ā§āĻāĨ¤
āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ¤āĻĨā§āĻ¯ āĻāĻŽāĻžāĻ° āĻāĻĒāĻ° āĻāĻā§
R-āĻ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻšāĻā§āĻā§: tidyverse, vroom, readr
āĻāĻāĻāĻŋ āĻ˛āĻžāĻāĻŦā§āĻ°ā§āĻ°āĻŋāĻ¤ā§ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻāĻ°āĻ¤ā§ tidyverse
āĻĻā§āĻāĻŋ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻā§: vroom
, readr
. vroom
āĻāĻ°āĻ āĻāĻ§ā§āĻ¨āĻŋāĻ, āĻ¤āĻŦā§ āĻāĻŦāĻŋāĻˇā§āĻ¯āĻ¤ā§ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻšāĻ¤ā§ āĻĒāĻžāĻ°ā§āĨ¤
āĻĨā§āĻā§ āĻāĻĻā§āĻ§ā§āĻ¤āĻŋ vroom
.
vroom āĻŦāĻ¨āĻžāĻŽ āĻĒāĻžāĻ āĻ
āĻāĻ° āĻŽā§āĻā§āĻ¤āĻŋ āĻāĻŋ āĻāĻ°ā§vroom
āĻāĻ¨ā§āĻ¯ āĻŽāĻžāĻ¨ā§readr
? āĻāĻĒāĻžāĻ¤āĻ¤ āĻāĻŽāĻ°āĻž āĻĻā§āĻāĻŋ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻāĻ˛āĻžāĻĻāĻžāĻāĻžāĻŦā§ āĻŦāĻŋāĻāĻļāĻŋāĻ¤ āĻšāĻāĻ¯āĻŧāĻžāĻ° āĻĒāĻ°āĻŋāĻāĻ˛ā§āĻĒāĻ¨āĻž āĻāĻ°āĻāĻŋ, āĻ¤āĻŦā§ āĻ¸āĻŽā§āĻāĻŦāĻ¤ āĻāĻŽāĻ°āĻž āĻāĻŦāĻŋāĻˇā§āĻ¯āĻ¤ā§ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻā§ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻŦāĨ¤ āĻā§āĻ°ā§āĻŽā§āĻ° āĻ āĻ˛āĻ¸ āĻĒāĻĄāĻŧāĻžāĻ° āĻāĻāĻāĻŋ āĻ āĻ¸ā§āĻŦāĻŋāĻ§āĻž āĻšāĻ˛ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻĄā§āĻāĻž āĻ¸āĻŽāĻ¸ā§āĻ¯āĻžāĻā§āĻ˛āĻŋ āĻ¸āĻžāĻŽāĻ¨ā§ āĻ°āĻŋāĻĒā§āĻ°ā§āĻ āĻāĻ°āĻž āĻ¯āĻžāĻ¯āĻŧ āĻ¨āĻž, āĻ¤āĻžāĻ āĻā§āĻāĻžāĻŦā§ āĻ¤āĻžāĻĻā§āĻ° āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻž āĻ¯āĻžāĻ¯āĻŧ āĻ¸ā§ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻā§ āĻāĻŋāĻā§ āĻāĻŋāĻ¨ā§āĻ¤āĻžāĻāĻžāĻŦāĻ¨āĻž āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨āĨ¤vroom āĻŦāĻ¨āĻžāĻŽ āĻĒāĻžāĻ āĻ
āĻŽā§āĻā§āĻ¤āĻŋ āĻŽāĻžāĻ¨ā§ āĻāĻŋ?vroom
āĻĨā§āĻā§readr
? āĻāĻ āĻŽā§āĻšā§āĻ°ā§āĻ¤ā§ āĻāĻŽāĻ°āĻž āĻĒā§āĻĨāĻāĻāĻžāĻŦā§ āĻāĻāĻ¯āĻŧ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻŦāĻŋāĻāĻžāĻļ āĻāĻ°āĻžāĻ° āĻĒāĻ°āĻŋāĻāĻ˛ā§āĻĒāĻ¨āĻž āĻāĻ°āĻāĻŋ, āĻ¤āĻŦā§ āĻāĻŽāĻ°āĻž āĻ¸āĻŽā§āĻāĻŦāĻ¤ āĻāĻŦāĻŋāĻˇā§āĻ¯āĻ¤ā§ āĻ¤āĻžāĻĻā§āĻ° āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻŦāĨ¤ āĻ āĻ˛āĻ¸ āĻĒāĻĄāĻŧāĻžāĻ° āĻāĻāĻāĻŋ āĻ āĻ¸ā§āĻŦāĻŋāĻ§āĻžvroom
āĻĄā§āĻāĻžāĻ° āĻ¸āĻžāĻĨā§ āĻāĻŋāĻā§ āĻ¸āĻŽāĻ¸ā§āĻ¯āĻž āĻāĻā§ āĻĨā§āĻā§ āĻ°āĻŋāĻĒā§āĻ°ā§āĻ āĻāĻ°āĻž āĻ¯āĻžāĻ¯āĻŧ āĻ¨āĻž, āĻ¤āĻžāĻ āĻāĻĒāĻ¨āĻžāĻā§ āĻāĻžāĻŦāĻ¤ā§ āĻšāĻŦā§ āĻāĻŋāĻāĻžāĻŦā§ āĻ¸ā§āĻā§āĻ˛āĻŋāĻā§ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻž āĻ¯āĻžāĻ¯āĻŧāĨ¤
āĻāĻ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§ āĻāĻŽāĻ°āĻž āĻāĻāĻ¯āĻŧ āĻĄā§āĻāĻž āĻ˛ā§āĻĄāĻŋāĻ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻĻā§āĻāĻŦ:
R: vroom āĻĒā§āĻ¯āĻžāĻā§āĻā§ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻšāĻā§āĻā§
# install.packages("vroom")
library(vroom)
# ЧŅĐĩĐŊиĐĩ Đ´Đ°ĐŊĐŊŅŅ
## vroom
ga_nov <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")
R: readr-āĻ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻšāĻā§āĻā§
# install.packages("readr")
library(readr)
# ЧŅĐĩĐŊиĐĩ Đ´Đ°ĐŊĐŊŅŅ
## readr
ga_nov <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")
āĻĒā§āĻ¯āĻžāĻā§āĻā§ vroom
, csv/tsv āĻĄā§āĻāĻž āĻŦāĻŋāĻ¨ā§āĻ¯āĻžāĻ¸ āĻ¨āĻŋāĻ°ā§āĻŦāĻŋāĻļā§āĻˇā§, āĻāĻāĻ āĻ¨āĻžāĻŽā§āĻ° āĻĢāĻžāĻāĻļāĻ¨ āĻĻā§āĻŦāĻžāĻ°āĻž āĻ˛ā§āĻĄ āĻāĻ°āĻž āĻšāĻ¯āĻŧ vroom()
, āĻĒā§āĻ¯āĻžāĻā§āĻā§ readr
āĻāĻŽāĻ°āĻž āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻŦāĻŋāĻ¨ā§āĻ¯āĻžāĻ¸ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻāĻāĻāĻŋ āĻāĻŋāĻ¨ā§āĻ¨ āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻŋ read_tsv()
и read_csv()
.
R: data.table-āĻ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻšāĻā§āĻā§
Đ data.table
āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻāĻāĻāĻŋ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻā§ fread()
.
R: data.table āĻĒā§āĻ¯āĻžāĻā§āĻā§ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻšāĻā§āĻā§
# install.packages("data.table")
library(data.table)
## data.table
ga_nov <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻšāĻā§āĻā§: āĻĒāĻžāĻ¨ā§āĻĄāĻž
āĻ¯āĻĻāĻŋ āĻāĻŽāĻ°āĻž R āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻ° āĻ¸āĻžāĻĨā§ āĻ¤ā§āĻ˛āĻ¨āĻž āĻāĻ°āĻŋ, āĻ¤āĻžāĻšāĻ˛ā§ āĻāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸āĻāĻŋ āĻ¸āĻŦāĻā§āĻ¯āĻŧā§ āĻāĻžāĻā§āĻ° pandas
āĻšāĻ¤ā§ āĻšāĻŦā§ readr
āĻĨā§āĻā§ pandas
āĻ¯ā§āĻā§āĻ¨ āĻāĻžāĻ¯āĻŧāĻāĻž āĻĨā§āĻā§ āĻĄā§āĻāĻžāĻ° āĻ
āĻ¨ā§āĻ°ā§āĻ§ āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§ āĻāĻŦāĻ āĻāĻ āĻĒā§āĻ¯āĻžāĻā§āĻā§ āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻāĻāĻāĻŋ āĻ¸āĻŽā§āĻĒā§āĻ°ā§āĻŖ āĻĒāĻ°āĻŋāĻŦāĻžāĻ° āĻ°āĻ¯āĻŧā§āĻā§ read_*()
.
read_csv()
read_excel()
read_sql()
read_json()
read_html()
āĻāĻŦāĻ āĻ
āĻ¨ā§āĻ¯āĻžāĻ¨ā§āĻ¯ āĻ
āĻ¨ā§āĻ āĻĢāĻžāĻāĻļāĻ¨ āĻŦāĻŋāĻāĻŋāĻ¨ā§āĻ¨ āĻĢāĻ°āĻŽā§āĻ¯āĻžāĻ āĻĨā§āĻā§ āĻĄā§āĻāĻž āĻĒāĻĄāĻŧāĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻĄāĻŋāĻāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻ¯āĻŧā§āĻā§āĨ¤ āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻāĻŽāĻžāĻĻā§āĻ° āĻāĻĻā§āĻĻā§āĻļā§āĻ¯ā§ āĻāĻāĻŋ āĻ¯āĻĨā§āĻˇā§āĻ read_table()
āĻŦāĻž read_csv()
āĻ¯ā§āĻā§āĻ¤āĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻ¸ā§āĻĒā§āĻā§āĻŽā§āĻŦāĻ° āĻāĻ˛āĻžāĻŽ āĻŦāĻŋāĻāĻžāĻāĻ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻāĻ°āĻ¤ā§āĨ¤
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻšāĻā§āĻā§: āĻĒāĻžāĻ¨ā§āĻĄāĻž
import pandas as pd
ga_nov = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")
āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž
āĻā§āĻŦāĻŋāĻ˛ āĻŦāĻŋāĻ°āĻžāĻāĻāĻžāĻ¯āĻŧ, āĻ¯āĻž āĻāĻŽāĻ°āĻž āĻ˛ā§āĻĄ, āĻāĻāĻāĻŋ āĻā§āĻˇā§āĻ¤ā§āĻ° āĻāĻā§ āĻ˛āĻŋāĻā§āĻ, āĻ¯āĻž āĻ¯āĻžāĻ¤ā§āĻ°ā§āĻ° āĻ˛āĻŋāĻā§āĻ āĻļāĻ¨āĻžāĻā§āĻ¤āĻāĻžāĻ°ā§ āĻ¸āĻāĻ°āĻā§āĻˇāĻŖ āĻāĻ°ā§āĨ¤
āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻ¯āĻžāĻ¤ā§āĻ°ā§āĻ° āĻ˛āĻŋāĻā§āĻā§āĻ° āĻĒāĻ°āĻŋāĻĒā§āĻ°ā§āĻā§āĻˇāĻŋāĻ¤ā§ āĻĄā§āĻāĻžāĻ° āĻāĻ°āĻ āĻ¸ā§āĻŦāĻŋāĻ§āĻžāĻāĻ¨āĻ āĻāĻĒāĻ¸ā§āĻĨāĻžāĻĒāĻ¨āĻžāĻ° āĻāĻ¨ā§āĻ¯, āĻāĻĒāĻ¨āĻžāĻ° āĻ˛āĻŋāĻā§āĻ āĻā§āĻĄā§āĻ° āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤ā§ āĻ¨āĻžāĻŽ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻāĻāĻŋāĻ¤āĨ¤
āĻāĻāĻŋ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯, āĻāĻŽāĻ°āĻž āĻāĻāĻāĻŋ āĻā§āĻ āĻĄāĻŋāĻ°ā§āĻā§āĻāĻ°āĻŋ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻŦ, āĻāĻāĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ āĻ¯ā§āĻāĻžāĻ¨ā§ āĻ¯āĻĨāĻžāĻā§āĻ°āĻŽā§ āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° 2āĻāĻŋ āĻāĻ˛āĻžāĻŽ (āĻā§āĻĄ āĻāĻŦāĻ āĻ˛āĻŋāĻā§āĻā§āĻ° āĻ¨āĻžāĻŽ) āĻāĻŦāĻ 2āĻāĻŋ āĻ¸āĻžāĻ°āĻŋ āĻĨāĻžāĻāĻŦā§āĨ¤
R: tidyverse, dplyr-āĻ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž
āĻ¨ā§āĻā§āĻ° āĻā§āĻĄ āĻāĻĻāĻžāĻšāĻ°āĻŖā§, āĻāĻŽāĻ°āĻž āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻĒāĻāĻ¨ā§āĻĻāĻ¸āĻ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻŋ tibble()
.
R: dplyr-āĻ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž
## dplyr
### ŅОСдаŅĐŧ ŅĐŋŅавОŅĐŊиĐē
gender <- tibble(id = c(1, 2),
gender = c("female", "male"))
R: data.table āĻ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž
R: data.table āĻ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž
## data.table
### ŅОСдаŅĐŧ ŅĐŋŅавОŅĐŊиĐē
gender <- data.table(id = c(1, 2),
gender = c("female", "male"))
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž āĻšāĻā§āĻā§: āĻĒāĻžāĻ¨ā§āĻĄāĻž
Đ pandas
āĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻŦāĻŋāĻāĻŋāĻ¨ā§āĻ¨ āĻĒāĻ°ā§āĻ¯āĻžāĻ¯āĻŧā§ āĻŦāĻžāĻšāĻŋāĻ¤ āĻšāĻ¯āĻŧ, āĻĒā§āĻ°āĻĨāĻŽā§ āĻāĻŽāĻ°āĻž āĻāĻāĻāĻŋ āĻ
āĻāĻŋāĻ§āĻžāĻ¨ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻŋ āĻāĻŦāĻ āĻ¤āĻžāĻ°āĻĒāĻ°ā§ āĻāĻŽāĻ°āĻž āĻ
āĻāĻŋāĻ§āĻžāĻ¨āĻāĻŋāĻā§ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽā§ āĻ°ā§āĻĒāĻžāĻ¨ā§āĻ¤āĻ° āĻāĻ°āĻŋāĨ¤
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž āĻšāĻā§āĻā§: āĻĒāĻžāĻ¨ā§āĻĄāĻž
# ŅОСдаŅĐŧ Đ´Đ°ŅĐ° ŅŅĐĩĐšĐŧ
gender_dict = {'id': [1, 2],
'gender': ["female", "male"]}
# ĐŋŅĐĩОйŅаСŅĐĩĐŧ ŅĐģОваŅŅ в Đ´Đ°ŅĐ°ŅŅĐĩĐšĐŧ
gender = pd.DataFrame.from_dict(gender_dict)
āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§
āĻāĻĒāĻ¨āĻŋ āĻ¯ā§ āĻā§āĻŦāĻŋāĻ˛āĻā§āĻ˛āĻŋāĻ° āĻ¸āĻžāĻĨā§ āĻāĻžāĻ āĻāĻ°ā§āĻ¨ āĻ¸ā§āĻā§āĻ˛āĻŋāĻ¤ā§ āĻāĻ¯āĻŧā§āĻ āĻĄāĻāĻ¨ āĻŦāĻž āĻāĻŽāĻ¨āĻāĻŋ āĻļāĻ¤ āĻļāĻ¤ āĻāĻ˛āĻžāĻŽ āĻĄā§āĻāĻž āĻĨāĻžāĻāĻ¤ā§ āĻĒāĻžāĻ°ā§āĨ¤ āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖ āĻāĻžāĻ˛āĻžāĻ¨ā§āĻ° āĻāĻ¨ā§āĻ¯, āĻāĻāĻāĻŋ āĻ¨āĻŋāĻ¯āĻŧāĻŽ āĻšāĻŋāĻ¸āĻžāĻŦā§, āĻāĻĒāĻ¨āĻžāĻ° āĻāĻ¤ā§āĻ¸ āĻā§āĻŦāĻŋāĻ˛ā§ āĻāĻĒāĻ˛āĻŦā§āĻ§ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻāĻ˛āĻžāĻŽā§āĻ° āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ āĻ¨ā§āĻāĨ¤
āĻ āĻ¤āĻāĻŦ, āĻā§āĻ¸ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ¸āĻžāĻĨā§ āĻāĻĒāĻ¨āĻŋ āĻ¯ā§ āĻĒā§āĻ°āĻĨāĻŽ āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ˛āĻžāĻĒāĻā§āĻ˛āĻŋ āĻ¸āĻŽā§āĻĒāĻžāĻĻāĻ¨ āĻāĻ°āĻŦā§āĻ¨ āĻ¤āĻž āĻšāĻ˛ āĻāĻāĻŋāĻā§ āĻ āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻ¤āĻĨā§āĻ¯ āĻĨā§āĻā§ āĻŽā§āĻā§ āĻĢā§āĻ˛āĻž āĻāĻŦāĻ āĻāĻ āĻ¤āĻĨā§āĻ¯āĻāĻŋ āĻĻāĻāĻ˛ āĻāĻ°ā§ āĻ°āĻžāĻāĻž āĻ¸ā§āĻŽā§āĻ¤āĻŋ āĻŽā§āĻā§āĻ¤ āĻāĻ°āĻžāĨ¤
R-āĻ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§: tidyverse, dplyr
āĻļāĻŦā§āĻĻāĻŦāĻŋāĻ¨ā§āĻ¯āĻžāĻ¸ dplyr
SQL āĻā§āĻ¯ā§āĻ¯āĻŧāĻžāĻ°ā§ āĻāĻžāĻˇāĻžāĻ° āĻ¸āĻžāĻĨā§ āĻā§āĻŦ āĻŽāĻŋāĻ˛, āĻ¯āĻĻāĻŋ āĻāĻĒāĻ¨āĻŋ āĻāĻāĻŋāĻ° āĻ¸āĻžāĻĨā§ āĻĒāĻ°āĻŋāĻāĻŋāĻ¤ āĻšāĻ¨ āĻ¤āĻŦā§ āĻāĻĒāĻ¨āĻŋ āĻĻā§āĻ°ā§āĻ¤ āĻāĻ āĻĒā§āĻ¯āĻžāĻā§āĻāĻāĻŋ āĻāĻ¯āĻŧāĻ¤ā§āĻ¤ āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°āĻŦā§āĻ¨āĨ¤
āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻ¤ā§, āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨ select()
.
āĻ¨ā§āĻā§ āĻā§āĻĄā§āĻ° āĻāĻĻāĻžāĻšāĻ°āĻŖ āĻ°āĻ¯āĻŧā§āĻā§ āĻ¯āĻž āĻĻāĻŋāĻ¯āĻŧā§ āĻāĻĒāĻ¨āĻŋ āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻāĻŋāĻ¤ āĻāĻĒāĻžāĻ¯āĻŧā§ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨:
- āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻāĻ˛āĻžāĻŽā§āĻ° āĻ¨āĻžāĻŽ āĻ¤āĻžāĻ˛āĻŋāĻāĻž āĻāĻ°āĻž
- āĻ°ā§āĻā§āĻ˛āĻžāĻ° āĻāĻā§āĻ¸āĻĒā§āĻ°ā§āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻāĻ˛āĻžāĻŽā§āĻ° āĻ¨āĻžāĻŽ āĻĒāĻĄāĻŧā§āĻ¨
- āĻĄā§āĻāĻž āĻāĻžāĻāĻĒ āĻŦāĻž āĻāĻ˛āĻžāĻŽā§ āĻĨāĻžāĻāĻž āĻĄā§āĻāĻžāĻ° āĻ āĻ¨ā§āĻ¯ āĻā§āĻ¨ā§ āĻŦā§āĻļāĻŋāĻˇā§āĻā§āĻ¯ āĻĻā§āĻŦāĻžāĻ°āĻž
R: dplyr-āĻ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§
# ĐŅйОŅ ĐŊŅĐļĐŊŅŅ
ŅŅĐžĐģĐąŅОв
## dplyr
### вŅĐąŅĐ°ŅŅ ĐŋĐž ĐŊаСваĐŊиŅ ŅŅĐžĐģĐąŅОв
select(ga_nov, date, source, sessions)
### иŅĐēĐģŅŅŅ ĐŋĐž ĐŊаСваĐŊиŅ ŅŅĐžĐģĐąŅОв
select(ga_nov, -medium, -bounces)
### вŅĐąŅĐ°ŅŅ ĐŋĐž ŅĐĩĐŗŅĐģŅŅĐŊĐžĐŧŅ вŅŅĐ°ĐļĐĩĐŊиŅ, ŅŅОйŅŅ иĐŧĐĩĐŊĐ° ĐēĐžŅĐžŅŅŅ
СаĐēĐ°ĐŊŅиваŅŅŅŅ ĐŊĐ° s
select(ga_nov, matches("s$"))
### вŅĐąŅĐ°ŅŅ ĐŋĐž ŅŅĐģОвиŅ, вŅйиŅĐ°ĐĩĐŧ ŅĐžĐģŅĐēĐž ŅĐĩĐģĐžŅиŅĐģĐĩĐŊĐŊŅĐĩ ŅŅĐžĐģĐąŅŅ
select_if(ga_nov, is.integer)
R: data.table-āĻ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§
āĻŽāĻ§ā§āĻ¯ā§ āĻāĻāĻ āĻ
āĻĒāĻžāĻ°ā§āĻļāĻ¨ data.table
āĻāĻāĻā§ āĻāĻŋāĻ¨ā§āĻ¨āĻāĻžāĻŦā§ āĻ¸āĻā§āĻāĻžāĻ˛āĻŋāĻ¤ āĻšāĻ¯āĻŧ, āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§āĻ° āĻļā§āĻ°ā§āĻ¤ā§ āĻāĻŽāĻŋ āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ° āĻāĻŋāĻ¤āĻ°ā§ āĻā§ āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ āĻ°āĻ¯āĻŧā§āĻā§ āĻ¤āĻžāĻ° āĻāĻāĻāĻŋ āĻŦāĻ°ā§āĻŖāĻ¨āĻž āĻĻāĻŋāĻ¯āĻŧā§āĻāĻŋāĻ˛āĻžāĻŽ data.table
.
DT[i,j,by]
āĻ¯ā§āĻāĻžāĻ¨ā§:
i - āĻā§āĻĨāĻžāĻ¯āĻŧ, i.e. āĻ¸āĻžāĻ°āĻŋ āĻĻā§āĻŦāĻžāĻ°āĻž āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ
j - āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°ā§āĻ¨|āĻāĻĒāĻĄā§āĻ|āĻāĻ°ā§āĻ¨, āĻ¯ā§āĻŽāĻ¨ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻŦāĻ āĻ¤āĻžāĻĻā§āĻ° āĻ°ā§āĻĒāĻžāĻ¨ā§āĻ¤āĻ°
āĻĻā§āĻŦāĻžāĻ°āĻž - āĻĄā§āĻāĻž āĻā§āĻ°ā§āĻĒāĻŋāĻ
R: data.table-āĻ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§
## data.table
### вŅĐąŅĐ°ŅŅ ĐŋĐž ĐŊаСваĐŊиŅ ŅŅĐžĐģĐąŅОв
ga_nov[ , .(date, source, sessions) ]
### иŅĐēĐģŅŅŅ ĐŋĐž ĐŊаСваĐŊиŅ ŅŅĐžĐģĐąŅОв
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### вŅĐąŅĐ°ŅŅ ĐŋĐž ŅĐĩĐŗŅĐģŅŅĐŊĐžĐŧŅ вŅŅĐ°ĐļĐĩĐŊиŅ
ga_nov[, .SD, .SDcols = patterns("s$")]
āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨āĻļā§āĻ˛ .SD
āĻāĻĒāĻ¨āĻžāĻā§ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻāĻ˛āĻžāĻŽ āĻ
ā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ¸ āĻāĻ°āĻ¤ā§ āĻĻā§āĻ¯āĻŧ, āĻāĻŦāĻ .SDcols
āĻāĻĒāĻ¨āĻžāĻ° āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋāĻ° āĻ¨āĻžāĻŽ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻ¨āĻŋāĻ¯āĻŧāĻŽāĻŋāĻ¤ āĻāĻā§āĻ¸āĻĒā§āĻ°ā§āĻļāĻ¨ āĻŦāĻž āĻ
āĻ¨ā§āĻ¯āĻžāĻ¨ā§āĻ¯ āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° āĻāĻ°ā§āĻ¨āĨ¤
āĻĒāĻžāĻāĻĨāĻ¨, āĻĒāĻžāĻ¨ā§āĻĄāĻžāĻ¯āĻŧ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§
āĻ¨āĻžāĻŽ āĻ
āĻ¨ā§āĻ¸āĻžāĻ°ā§ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻ¤ā§ pandas
āĻ¤āĻžāĻĻā§āĻ° āĻ¨āĻžāĻŽā§āĻ° āĻ¤āĻžāĻ˛āĻŋāĻāĻž āĻĻā§āĻāĻ¯āĻŧāĻžāĻ āĻ¯āĻĨā§āĻˇā§āĻāĨ¤ āĻāĻŦāĻ āĻ°ā§āĻā§āĻ˛āĻžāĻ° āĻāĻā§āĻ¸āĻĒā§āĻ°ā§āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻ¨āĻžāĻŽ āĻ
āĻ¨ā§āĻ¸āĻžāĻ°ā§ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻŦāĻž āĻŦāĻžāĻĻ āĻĻāĻŋāĻ¤ā§, āĻāĻĒāĻ¨āĻžāĻā§ āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻšāĻŦā§ drop()
и filter()
, āĻāĻŦāĻ āĻ¯ā§āĻā§āĻ¤āĻŋ āĻ
āĻā§āĻˇ=1, āĻ¯āĻž āĻĻāĻŋāĻ¯āĻŧā§ āĻāĻĒāĻ¨āĻŋ āĻ¨āĻŋāĻ°ā§āĻĻā§āĻļ āĻāĻ°ā§āĻ¨ āĻ¯ā§ āĻ¸āĻžāĻ°āĻŋāĻā§āĻ˛āĻŋāĻ° āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤ā§ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋ āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻž āĻāĻ°āĻž āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§ˇ
āĻĄā§āĻāĻž āĻāĻžāĻāĻĒ āĻĻā§āĻŦāĻžāĻ°āĻž āĻāĻāĻāĻŋ āĻā§āĻˇā§āĻ¤ā§āĻ° āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻ¤ā§, āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨ select_dtypes()
, āĻāĻŦāĻ āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ āĻŽāĻ§ā§āĻ¯ā§ āĻ
āĻ¨ā§āĻ¤āĻ°ā§āĻā§āĻā§āĻ¤ āĻāĻ°āĻž āĻŦāĻž āĻŦāĻ°ā§āĻāĻ¨ āĻāĻ°āĻž āĻāĻĒāĻ¨āĻžāĻā§ āĻā§āĻ¨ āĻā§āĻˇā§āĻ¤ā§āĻ°āĻā§āĻ˛āĻŋ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§ āĻ¤āĻžāĻ° āĻ¸āĻžāĻĨā§ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻāĻŋāĻ¤ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻāĻžāĻ°ā§āĻ° āĻāĻāĻāĻŋ āĻ¤āĻžāĻ˛āĻŋāĻāĻž āĻĒāĻžāĻ¸ āĻāĻ°ā§āĻ¨ā§ˇ
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§: āĻĒāĻžāĻ¨ā§āĻĄāĻž
# ĐŅйОŅ ĐŋĐžĐģĐĩĐš ĐŋĐž ĐŊаСваĐŊиŅ
ga_nov[['date', 'source', 'sessions']]
# ĐŅĐēĐģŅŅиŅŅ ĐŋĐž ĐŊаСваĐŊиŅ
ga_nov.drop(['medium', 'bounces'], axis=1)
# ĐŅĐąŅĐ°ŅŅ ĐŋĐž ŅĐĩĐŗŅĐģŅŅĐŊĐžĐŧŅ вŅŅĐ°ĐļĐĩĐŊиŅ
ga_nov.filter(regex="s$", axis=1)
# ĐŅĐąŅĐ°ŅŅ ŅиŅĐģОвŅĐĩ ĐŋĐžĐģŅ
ga_nov.select_dtypes(include=['number'])
# ĐŅĐąŅĐ°ŅŅ ŅĐĩĐēŅŅОвŅĐĩ ĐŋĐžĐģŅ
ga_nov.select_dtypes(include=['object'])
āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ
āĻāĻĻāĻžāĻšāĻ°āĻŖāĻ¸ā§āĻŦāĻ°ā§āĻĒ, āĻ¸ā§āĻ°ā§āĻ¸ āĻā§āĻŦāĻŋāĻ˛ā§ āĻāĻ¯āĻŧā§āĻ āĻŦāĻāĻ°ā§āĻ° āĻĄā§āĻāĻž āĻĨāĻžāĻāĻ¤ā§ āĻĒāĻžāĻ°ā§, āĻ¤āĻŦā§ āĻāĻĒāĻ¨āĻžāĻā§ āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° āĻļā§āĻˇ āĻŽāĻžāĻ¸ā§āĻ° āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§āĨ¤ āĻāĻŦāĻžāĻ°, āĻ āĻ¤āĻŋāĻ°āĻŋāĻā§āĻ¤ āĻ˛āĻžāĻāĻ¨ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻ¸ā§āĻ¸āĻŋāĻ āĻĒā§āĻ°āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻā§ āĻ§ā§āĻ° āĻāĻ°ā§ āĻĻā§āĻŦā§ āĻāĻŦāĻ āĻĒāĻŋāĻ¸āĻŋ āĻŽā§āĻŽāĻ°āĻŋāĻā§ āĻāĻāĻā§ āĻĻā§āĻŦā§āĨ¤
R-āĻ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ: tydyverse, dplyr
Đ dplyr
āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻ¸āĻžāĻ°āĻŋ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧ filter()
. āĻāĻāĻŋ āĻĒā§āĻ°āĻĨāĻŽ āĻ¯ā§āĻā§āĻ¤āĻŋ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¨ā§āĻ¯āĻŧ, āĻ¤āĻžāĻ°āĻĒāĻ°ā§ āĻāĻĒāĻ¨āĻŋ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻļāĻ°ā§āĻ¤āĻā§āĻ˛āĻŋ āĻ¤āĻžāĻ˛āĻŋāĻāĻžāĻā§āĻā§āĻ¤ āĻāĻ°ā§āĻ¨āĨ¤
āĻāĻāĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻ¯ā§āĻā§āĻ¤āĻŋāĻ āĻ āĻāĻŋāĻŦā§āĻ¯āĻā§āĻ¤āĻŋ āĻ˛ā§āĻāĻžāĻ° āĻ¸āĻŽāĻ¯āĻŧ, āĻāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§, āĻāĻĻā§āĻ§ā§āĻ¤āĻŋ āĻāĻžāĻĄāĻŧāĻž āĻāĻŦāĻ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ¨āĻžāĻŽ āĻā§āĻˇāĻŖāĻž āĻāĻžāĻĄāĻŧāĻžāĻ āĻāĻ˛āĻžāĻŽā§āĻ° āĻ¨āĻžāĻŽ āĻāĻ˛ā§āĻ˛ā§āĻ āĻāĻ°ā§āĻ¨āĨ¤
āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻāĻāĻžāĻ§āĻŋāĻ āĻ˛āĻāĻŋāĻā§āĻ¯āĻžāĻ˛ āĻāĻā§āĻ¸āĻĒā§āĻ°ā§āĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻžāĻ° āĻ¸āĻŽāĻ¯āĻŧ, āĻ¨āĻŋāĻŽā§āĻ¨āĻ˛āĻŋāĻāĻŋāĻ¤ āĻ āĻĒāĻžāĻ°ā§āĻāĻ°āĻā§āĻ˛āĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨:
- & āĻ āĻĨāĻŦāĻž āĻāĻŽāĻž - āĻ¯ā§āĻā§āĻ¤āĻŋāĻ AND
- | - āĻ¯ā§āĻā§āĻ¤āĻŋāĻ āĻŦāĻž
R āĻ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ: dplyr
# ŅиĐģŅŅŅĐ°ŅиŅ ŅŅŅĐžĐē
## dplyr
### ŅиĐģŅŅŅĐ°ŅиŅ ŅŅŅĐžĐē ĐŋĐž ОдĐŊĐžĐŧŅ ŅŅĐģОвиŅ
filter(ga_nov, source == "google")
### ŅиĐģŅŅŅ ĐŋĐž двŅĐŧ ŅŅĐģОвиŅĐŧ ŅĐžĐĩдиĐŊŅĐŊĐŊŅĐŧ ĐģĐžĐŗиŅĐĩŅĐēиĐŧ и
filter(ga_nov, source == "google" & sessions >= 10)
### ŅиĐģŅŅŅ ĐŋĐž двŅĐŧ ŅŅĐģОвиŅĐŧ ŅĐžĐĩдиĐŊŅĐŊĐŊŅĐŧ ĐģĐžĐŗиŅĐĩŅĐēиĐŧ иĐģи
filter(ga_nov, source == "google" | sessions >= 10)
R-āĻ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ: data.table
āĻāĻŽāĻŋ āĻāĻ¤āĻŋāĻŽāĻ§ā§āĻ¯ā§ āĻāĻĒāĻ°ā§ āĻ˛āĻŋāĻā§āĻāĻŋ, āĻāĻ¨ data.table
āĻĄā§āĻāĻž āĻ°ā§āĻĒāĻžāĻ¨ā§āĻ¤āĻ° āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻāĻŦāĻĻā§āĻ§āĨ¤
DT[i,j,by]
āĻ¯ā§āĻāĻžāĻ¨ā§:
i - āĻā§āĻĨāĻžāĻ¯āĻŧ, i.e. āĻ¸āĻžāĻ°āĻŋ āĻĻā§āĻŦāĻžāĻ°āĻž āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ
j - āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°ā§āĻ¨|āĻāĻĒāĻĄā§āĻ|āĻāĻ°ā§āĻ¨, āĻ¯ā§āĻŽāĻ¨ āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻŦāĻ āĻ¤āĻžāĻĻā§āĻ° āĻ°ā§āĻĒāĻžāĻ¨ā§āĻ¤āĻ°
āĻĻā§āĻŦāĻžāĻ°āĻž - āĻĄā§āĻāĻž āĻā§āĻ°ā§āĻĒāĻŋāĻ
āĻ¸āĻžāĻ°āĻŋ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻž āĻšāĻ¯āĻŧ i, āĻ¯āĻžāĻ° āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻĒā§āĻ°āĻĨāĻŽ āĻ āĻŦāĻ¸ā§āĻĨāĻžāĻ¨ āĻ°āĻ¯āĻŧā§āĻā§āĨ¤
āĻāĻĻā§āĻ§ā§āĻ¤āĻŋ āĻāĻŋāĻšā§āĻ¨ āĻāĻžāĻĄāĻŧāĻž āĻāĻŦāĻ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ¨āĻžāĻŽ āĻāĻ˛ā§āĻ˛ā§āĻ āĻ¨āĻž āĻāĻ°ā§āĻ āĻ˛āĻāĻŋāĻā§āĻ¯āĻžāĻ˛ āĻāĻā§āĻ¸āĻĒā§āĻ°ā§āĻļāĻ¨ā§ āĻāĻ˛āĻžāĻŽ āĻ ā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ¸ āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤
āĻ˛āĻāĻŋāĻā§āĻ¯āĻžāĻ˛ āĻāĻā§āĻ¸āĻĒā§āĻ°ā§āĻļāĻ¨ āĻāĻā§ āĻ
āĻĒāĻ°ā§āĻ° āĻ¸āĻžāĻĨā§ āĻāĻāĻāĻāĻžāĻŦā§ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻāĻŋāĻ¤ dplyr
& āĻāĻŦāĻ | āĻ
āĻĒāĻžāĻ°ā§āĻāĻ°āĻĻā§āĻ° āĻŽāĻžāĻ§ā§āĻ¯āĻŽā§āĨ¤
R-āĻ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ: data.table
## data.table
### ŅиĐģŅŅŅĐ°ŅиŅ ŅŅŅĐžĐē ĐŋĐž ОдĐŊĐžĐŧŅ ŅŅĐģОвиŅ
ga_nov[source == "google"]
### ŅиĐģŅŅŅ ĐŋĐž двŅĐŧ ŅŅĐģОвиŅĐŧ ŅĐžĐĩдиĐŊŅĐŊĐŊŅĐŧ ĐģĐžĐŗиŅĐĩŅĐēиĐŧ и
ga_nov[source == "google" & sessions >= 10]
### ŅиĐģŅŅŅ ĐŋĐž двŅĐŧ ŅŅĐģОвиŅĐŧ ŅĐžĐĩдиĐŊŅĐŊĐŊŅĐŧ ĐģĐžĐŗиŅĐĩŅĐēиĐŧ иĐģи
ga_nov[source == "google" | sessions >= 10]
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸ā§āĻā§āĻ°āĻŋāĻ: āĻĒāĻžāĻ¨ā§āĻĄāĻž
āĻŽāĻ§ā§āĻ¯ā§ āĻ¸āĻžāĻ°āĻŋ āĻĻā§āĻŦāĻžāĻ°āĻž āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° pandas
āĻŽāĻ§ā§āĻ¯ā§ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ
āĻ¨ā§āĻ°ā§āĻĒ data.table
, āĻāĻŦāĻ āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤
āĻāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§, āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽā§āĻ° āĻ¨āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻĻā§āĻļ āĻāĻ°ā§ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋāĻ¤ā§ āĻ
ā§āĻ¯āĻžāĻā§āĻ¸ā§āĻ¸ āĻāĻ°āĻž āĻšāĻ¯āĻŧ; āĻ¤āĻžāĻ°āĻĒāĻ° āĻāĻ˛āĻžāĻŽā§āĻ° āĻ¨āĻžāĻŽāĻāĻŋ āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻāĻĻā§āĻ§ā§āĻ¤āĻŋ āĻāĻŋāĻšā§āĻ¨āĻā§āĻ˛āĻŋāĻ¤ā§āĻ āĻ¨āĻŋāĻ°ā§āĻĻā§āĻļāĻŋāĻ¤ āĻšāĻ¤ā§ āĻĒāĻžāĻ°ā§ (āĻāĻĻāĻžāĻšāĻ°āĻŖ df['col_name']
), āĻ
āĻĨāĻŦāĻž āĻĒāĻŋāĻ°āĻŋāĻ¯āĻŧāĻĄā§āĻ° āĻĒāĻ°ā§ āĻāĻĻā§āĻ§ā§āĻ¤āĻŋ āĻāĻžāĻĄāĻŧāĻžāĻ (āĻāĻĻāĻžāĻšāĻ°āĻŖ df.col_name
).
āĻāĻĒāĻ¨āĻŋ āĻ¯āĻĻāĻŋ āĻŦā§āĻļ āĻāĻ¯āĻŧā§āĻāĻāĻŋ āĻļāĻ°ā§āĻ¤ āĻĻā§āĻŦāĻžāĻ°āĻž āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻāĻžāĻ¨ āĻ¤āĻŦā§ āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻļāĻ°ā§āĻ¤ āĻ
āĻŦāĻļā§āĻ¯āĻ āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻ¸ā§āĻĨāĻžāĻĒāĻ¨ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§āĨ¤ āĻ¯ā§āĻā§āĻ¤āĻŋāĻ āĻ
āĻŦāĻ¸ā§āĻĨāĻž āĻ
āĻĒāĻžāĻ°ā§āĻāĻ° āĻĻā§āĻŦāĻžāĻ°āĻž āĻāĻā§ āĻ
āĻĒāĻ°ā§āĻ° āĻ¸āĻžāĻĨā§ āĻ¸āĻāĻ¯ā§āĻā§āĻ¤ āĻāĻ°āĻž āĻšāĻ¯āĻŧ &
и |
.
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸ā§āĻā§āĻ°āĻŋāĻ: āĻĒāĻžāĻ¨ā§āĻĄāĻž
# ФиĐģŅŅŅĐ°ŅиŅ ŅŅŅĐžĐē ŅĐ°ĐąĐģиŅŅ
### ŅиĐģŅŅŅĐ°ŅиŅ ŅŅŅĐžĐē ĐŋĐž ОдĐŊĐžĐŧŅ ŅŅĐģОвиŅ
ga_nov[ ga_nov['source'] == "google" ]
### ŅиĐģŅŅŅ ĐŋĐž двŅĐŧ ŅŅĐģОвиŅĐŧ ŅĐžĐĩдиĐŊŅĐŊĐŊŅĐŧ ĐģĐžĐŗиŅĐĩŅĐēиĐŧ и
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### ŅиĐģŅŅŅ ĐŋĐž двŅĐŧ ŅŅĐģОвиŅĐŧ ŅĐžĐĩдиĐŊŅĐŊĐŊŅĐŧ ĐģĐžĐŗиŅĐĩŅĐēиĐŧ иĐģи
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]
āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻĄā§āĻāĻžāĻ° āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ
āĻĄā§āĻāĻž āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖā§ āĻ¸āĻ°ā§āĻŦāĻžāĻ§āĻŋāĻ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨āĻā§āĻ˛āĻŋāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻāĻāĻāĻŋ āĻšāĻ˛ āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖāĨ¤
āĻāĻ āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ˛āĻžāĻĒāĻā§āĻ˛āĻŋ āĻ¸āĻŽā§āĻĒāĻžāĻĻāĻ¨ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻāĻŽāĻ°āĻž āĻĒāĻ°ā§āĻ¯āĻžāĻ˛ā§āĻāĻ¨āĻž āĻāĻ°āĻž āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻā§āĻĄāĻŧā§ āĻāĻĄāĻŧāĻŋāĻ¯āĻŧā§ āĻāĻŋāĻāĻŋāĻ¯āĻŧā§ āĻāĻā§āĨ¤
āĻāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§, āĻāĻŽāĻ°āĻž āĻāĻāĻāĻŋ āĻāĻĻāĻžāĻšāĻ°āĻŖ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻāĻāĻāĻŋ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¨ā§āĻŦ āĻŦāĻŋāĻ°āĻžāĻāĻāĻžāĻ¯āĻŧ, āĻāĻŦāĻ āĻā§āĻŦāĻŋāĻ¨ āĻļā§āĻ°ā§āĻŖā§āĻ° āĻāĻĒāĻ° āĻ¨āĻŋāĻ°ā§āĻāĻ° āĻāĻ°ā§ āĻāĻŋāĻāĻŋāĻā§āĻ° āĻ¸āĻāĻā§āĻ¯āĻž āĻāĻŦāĻ āĻāĻĄāĻŧ āĻŽā§āĻ˛ā§āĻ¯ āĻāĻŖāĻ¨āĻž āĻāĻ°ā§āĻ¨āĨ¤
R-āĻ āĻĄā§āĻāĻžāĻ° āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ: tidyverse, dplyr
Đ dplyr
āĻĢāĻžāĻāĻļāĻ¨ āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻ¨ā§āĻ¯ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧ group_by()
, āĻāĻŦāĻ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤āĻāĻ°āĻŖā§āĻ° āĻāĻ¨ā§āĻ¯ summarise()
. āĻāĻ¸āĻ˛ā§, dplyr
āĻĢāĻžāĻāĻļāĻ¨ āĻāĻāĻāĻŋ āĻ¸āĻŽā§āĻĒā§āĻ°ā§āĻŖ āĻĒāĻ°āĻŋāĻŦāĻžāĻ° āĻāĻā§ summarise_*()
, āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻāĻ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§āĻ° āĻāĻĻā§āĻĻā§āĻļā§āĻ¯ āĻšāĻ˛ āĻŽā§āĻ˛āĻŋāĻ āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻ¤ā§āĻ˛āĻ¨āĻž āĻāĻ°āĻž, āĻ¤āĻžāĻ āĻāĻŽāĻ°āĻž āĻāĻ āĻ§āĻ°āĻ¨ā§āĻ° āĻāĻā§āĻāĻ˛ā§ āĻ¯āĻžāĻŦ āĻ¨āĻžāĨ¤
āĻŽā§āĻ˛āĻŋāĻ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ āĻĢāĻžāĻāĻļāĻ¨:
sum()
â āĻ¸āĻŽāĻˇā§āĻāĻŋmin()
/max()
- āĻ¸āĻ°ā§āĻŦāĻ¨āĻŋāĻŽā§āĻ¨ āĻāĻŦāĻ āĻ¸āĻ°ā§āĻŦā§āĻā§āĻ āĻŽāĻžāĻ¨mean()
- āĻāĻĄāĻŧmedian()
- āĻŽāĻ§ā§āĻ¯āĻŽāĻžlength()
- āĻĒāĻ°āĻŋāĻŽāĻžāĻŖ
R: dplyr-āĻ āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻ ā§āĻ¯āĻžāĻā§āĻ°āĻŋāĻā§āĻļāĻ¨
## dplyr
### ĐŗŅŅĐŋĐŋиŅОвĐēĐ° и Đ°ĐŗŅĐĩĐŗĐ°ŅиŅ ŅŅŅĐžĐē
group_by(titanic, Pclass) %>%
summarise(passangers = length(PassengerId),
avg_price = mean(Fare))
āĻāĻžāĻ āĻāĻ°āĻ¤ā§ group_by()
āĻāĻŽāĻ°āĻž āĻĒā§āĻ°āĻĨāĻŽ āĻ¯ā§āĻā§āĻ¤āĻŋ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻā§āĻŦāĻŋāĻ˛ āĻĒāĻžāĻ¸ āĻŦāĻŋāĻ°āĻžāĻāĻāĻžāĻ¯āĻŧ, āĻāĻŦāĻ āĻ¤āĻžāĻ°āĻĒāĻ° āĻā§āĻˇā§āĻ¤ā§āĻ° āĻ¨āĻŋāĻ°ā§āĻĻā§āĻļāĻŋāĻ¤ Pclass, āĻ¯āĻžāĻ° āĻĻā§āĻŦāĻžāĻ°āĻž āĻāĻŽāĻ°āĻž āĻāĻŽāĻžāĻĻā§āĻ° āĻā§āĻŦāĻŋāĻ˛ āĻā§āĻ°ā§āĻĒ āĻāĻ°āĻŦāĨ¤ āĻ
āĻĒāĻžāĻ°ā§āĻāĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻāĻ āĻ
āĻĒāĻžāĻ°ā§āĻļāĻ¨ā§āĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ %>%
āĻĢāĻžāĻāĻļāĻ¨ āĻĒā§āĻ°āĻĨāĻŽ āĻ¯ā§āĻā§āĻ¤āĻŋ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻĒāĻžāĻ¸ summarise()
, āĻāĻŦāĻ 2āĻāĻŋ āĻāĻ°āĻ āĻā§āĻˇā§āĻ¤ā§āĻ° āĻ¯ā§āĻ āĻāĻ°ā§āĻā§: āĻ¯āĻžāĻ¤ā§āĻ°ā§ и āĻāĻĄāĻŧ_āĻŽā§āĻ˛ā§āĻ¯. āĻĒā§āĻ°āĻĨāĻŽ, āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ length()
āĻāĻŋāĻāĻŋāĻā§āĻ° āĻ¸āĻāĻā§āĻ¯āĻž āĻāĻŖāĻ¨āĻž āĻāĻ°ā§ āĻāĻŦāĻ āĻĻā§āĻŦāĻŋāĻ¤ā§āĻ¯āĻŧāĻāĻŋāĻ¤ā§ āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ mean()
āĻāĻŋāĻāĻŋāĻā§āĻ° āĻāĻĄāĻŧ āĻŽā§āĻ˛ā§āĻ¯ āĻĒā§āĻ¯āĻŧā§āĻā§āĻ¨āĨ¤
R: data.table-āĻ āĻĄā§āĻāĻžāĻ° āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ
Đ data.table
āĻ¯ā§āĻā§āĻ¤āĻŋāĻāĻŋ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤āĻāĻ°āĻŖā§āĻ° āĻāĻ¨ā§āĻ¯ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧ j
āĻ¯ā§āĻāĻŋ āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻāĻŦāĻ āĻā§āĻ°ā§āĻĒāĻŋāĻāĻ¯āĻŧā§āĻ° āĻāĻ¨ā§āĻ¯ āĻĻā§āĻŦāĻŋāĻ¤ā§āĻ¯āĻŧ āĻ
āĻŦāĻ¸ā§āĻĨāĻžāĻ¨ā§ āĻ°āĻ¯āĻŧā§āĻā§ by
āĻŦāĻž keyby
āĻ¯āĻž āĻ¤ā§āĻ¤ā§āĻ¯āĻŧ āĻ
āĻŦāĻ¸ā§āĻĨāĻžāĻ¨ā§ āĻ°āĻ¯āĻŧā§āĻā§āĨ¤
āĻāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ āĻĢāĻžāĻāĻļāĻ¨āĻā§āĻ˛āĻŋāĻ° āĻ¤āĻžāĻ˛āĻŋāĻāĻžāĻāĻŋ āĻŦāĻ°ā§āĻŖāĻ¨āĻž āĻāĻ°āĻž āĻ
āĻ¨ā§āĻ°ā§āĻĒ dplyr
, āĻāĻžāĻ°āĻŖ āĻāĻ āĻŽā§āĻ˛āĻŋāĻ R āĻ¸āĻŋāĻ¨āĻā§āĻ¯āĻžāĻā§āĻ¸ āĻĨā§āĻā§ āĻĢāĻžāĻāĻļāĻ¨.
R: data.table-āĻ āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻ ā§āĻ¯āĻžāĻā§āĻ°āĻŋāĻā§āĻļāĻ¨
## data.table
### ŅиĐģŅŅŅĐ°ŅиŅ ŅŅŅĐžĐē ĐŋĐž ОдĐŊĐžĐŧŅ ŅŅĐģОвиŅ
titanic[, .(passangers = length(PassengerId),
avg_price = mean(Fare)),
by = Pclass]
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĄā§āĻāĻžāĻ° āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ: āĻĒāĻžāĻ¨ā§āĻĄāĻž
āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻ¨ pandas
āĻ
āĻ¨ā§āĻ°ā§āĻĒ, āĻāĻāĻ, āĻ¸āĻŽāĻ¤ā§āĻ˛ā§āĻ¯ dplyr
, āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻ¸āĻŽāĻˇā§āĻāĻŋ āĻ
āĻ¨ā§āĻ°ā§āĻĒ āĻ¨āĻ¯āĻŧ dplyr
āĻāĻāĻĻāĻŽāĻ āĻ¨āĻž data.table
.
āĻā§āĻ°ā§āĻĒ āĻāĻ°āĻ¤ā§, āĻĒāĻĻā§āĻ§āĻ¤āĻŋāĻāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨ groupby()
, āĻ¯ā§āĻāĻŋāĻ¤ā§ āĻāĻĒāĻ¨āĻžāĻā§ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋāĻ° āĻāĻāĻāĻŋ āĻ¤āĻžāĻ˛āĻŋāĻāĻž āĻĒāĻžāĻ¸ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§ āĻ¯āĻžāĻ° āĻĻā§āĻŦāĻžāĻ°āĻž āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽāĻāĻŋ āĻā§āĻˇā§āĻ ā§āĻŦāĻĻā§āĻ§ āĻšāĻŦā§ā§ˇ
āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤āĻāĻ°āĻŖā§āĻ° āĻāĻ¨ā§āĻ¯ āĻāĻĒāĻ¨āĻŋ āĻĒāĻĻā§āĻ§āĻ¤āĻŋāĻāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨ agg()
āĻ¯āĻž āĻāĻāĻāĻŋ āĻ
āĻāĻŋāĻ§āĻžāĻ¨ āĻā§āĻ°āĻšāĻŖ āĻāĻ°ā§āĨ¤ āĻ
āĻāĻŋāĻ§āĻžāĻ¨ āĻā§āĻā§āĻ˛āĻŋ āĻšāĻ˛ āĻ¸ā§āĻ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋ āĻ¯āĻžāĻ° āĻāĻĒāĻ° āĻāĻĒāĻ¨āĻŋ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ āĻĢāĻžāĻāĻļāĻ¨ āĻĒā§āĻ°āĻ¯āĻŧā§āĻ āĻāĻ°āĻŦā§āĻ¨ āĻāĻŦāĻ āĻŽāĻžāĻ¨āĻā§āĻ˛āĻŋ āĻšāĻ˛ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻ¨āĻžāĻŽā§ˇ
āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ āĻĢāĻžāĻāĻļāĻ¨:
sum()
â āĻ¸āĻŽāĻˇā§āĻāĻŋmin()
/max()
- āĻ¸āĻ°ā§āĻŦāĻ¨āĻŋāĻŽā§āĻ¨ āĻāĻŦāĻ āĻ¸āĻ°ā§āĻŦā§āĻā§āĻ āĻŽāĻžāĻ¨mean()
- āĻāĻĄāĻŧmedian()
- āĻŽāĻ§ā§āĻ¯āĻŽāĻžcount()
- āĻĒāĻ°āĻŋāĻŽāĻžāĻŖ
āĻā§āĻ°āĻŋāĻ¯āĻŧāĻž reset_index()
āĻ¨āĻŋāĻā§āĻ° āĻāĻĻāĻžāĻšāĻ°āĻŖā§ āĻāĻāĻŋ āĻ¨ā§āĻ¸ā§āĻā§āĻĄ āĻāĻ¨āĻĄā§āĻā§āĻ¸ āĻ°āĻŋāĻ¸ā§āĻ āĻāĻ°āĻ¤ā§ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧ pandas
āĻĄā§āĻāĻž āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤āĻāĻ°āĻŖā§āĻ° āĻĒāĻ°ā§ āĻĄāĻŋāĻĢāĻ˛ā§āĻāĨ¤
āĻĒā§āĻ°āĻ¤ā§āĻ āĻāĻĒāĻ¨āĻžāĻā§ āĻĒāĻ°āĻŦāĻ°ā§āĻ¤ā§ āĻ˛āĻžāĻāĻ¨ā§ āĻ¯ā§āĻ¤ā§ āĻĻā§āĻ¯āĻŧāĨ¤
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻ ā§āĻ¯āĻžāĻā§āĻ°āĻŋāĻā§āĻļāĻ¨: āĻĒāĻžāĻ¨ā§āĻĄāĻž
# ĐŗŅŅĐŋĐŋиŅОвĐēĐ° и Đ°ĐŗŅĐĩĐŗĐ°ŅиŅ Đ´Đ°ĐŊĐŊŅŅ
titanic.groupby(["Pclass"]).
agg({'PassengerId': 'count', 'Fare': 'mean'}).
reset_index()
āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻāĻ˛ā§āĻ˛āĻŽā§āĻŦ āĻ¯ā§āĻāĻĻāĻžāĻ¨
āĻāĻāĻāĻŋ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨ āĻ¯āĻžāĻ¤ā§ āĻāĻĒāĻ¨āĻŋ āĻāĻāĻ āĻāĻžāĻ āĻžāĻŽā§āĻ° āĻĻā§āĻ āĻŦāĻž āĻ¤āĻ¤ā§āĻ§āĻŋāĻ āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¯ā§āĻāĻĻāĻžāĻ¨ āĻāĻ°ā§āĻ¨āĨ¤ āĻāĻŽāĻ°āĻž āĻ¯ā§ āĻĄā§āĻāĻž āĻ˛ā§āĻĄ āĻāĻ°ā§āĻāĻŋ āĻ¤āĻžāĻ¤ā§ āĻā§āĻŦāĻŋāĻ˛ āĻ°āĻ¯āĻŧā§āĻā§ ga_nov и ga_dec. āĻāĻ āĻā§āĻŦāĻŋāĻ˛āĻā§āĻ˛āĻŋ āĻāĻ āĻ¨ā§ āĻ āĻāĻŋāĻ¨ā§āĻ¨, āĻ¯ā§āĻŽāĻ¨ āĻāĻāĻ āĻāĻ˛āĻžāĻŽ āĻāĻā§, āĻāĻŦāĻ āĻāĻ āĻāĻ˛āĻžāĻŽā§ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻāĻžāĻ°āĨ¤
āĻāĻāĻŋ āĻ¨āĻā§āĻŽā§āĻŦāĻ° āĻāĻŦāĻ āĻĄāĻŋāĻ¸ā§āĻŽā§āĻŦāĻ° āĻŽāĻžāĻ¸ā§āĻ° āĻāĻ¨ā§āĻ¯ Google Analytics āĻĨā§āĻā§ āĻāĻāĻāĻŋ āĻāĻĒāĻ˛ā§āĻĄ, āĻāĻ āĻŦāĻŋāĻāĻžāĻā§ āĻāĻŽāĻ°āĻž āĻāĻ āĻĄā§āĻāĻžāĻā§āĻ˛āĻŋāĻā§ āĻāĻāĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ā§ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻŦāĨ¤
āĻāĻ˛ā§āĻ˛āĻŽā§āĻŦāĻāĻžāĻŦā§ R-āĻ āĻ¸āĻžāĻ°āĻŖāĻŋ āĻ¯ā§āĻ āĻāĻ°āĻž: tidyverse, dplyr
Đ dplyr
āĻāĻĒāĻ¨āĻŋ āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ 2āĻāĻŋ āĻā§āĻŦāĻŋāĻ˛āĻā§ āĻāĻāĻāĻŋāĻ¤ā§ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨ bind_rows()
, āĻ¤āĻžāĻ° āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻā§āĻŦāĻŋāĻ˛ āĻĒāĻžāĻ¸.
R āĻ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ: dplyr
# ĐĐĩŅŅиĐēĐ°ĐģŅĐŊĐžĐĩ ОйŅĐĩдиĐŊĐĩĐŊиĐĩ ŅĐ°ĐąĐģиŅ
## dplyr
bind_rows(ga_nov, ga_dec)
R: data.table-āĻ āĻāĻ˛ā§āĻ˛āĻŽā§āĻŦāĻāĻžāĻŦā§ āĻ¯ā§āĻāĻĻāĻžāĻ¨ āĻāĻ°āĻž āĻā§āĻŦāĻŋāĻ˛
āĻāĻāĻŋāĻ āĻāĻāĻŋāĻ˛ āĻāĻŋāĻā§ āĻ¨āĻ¯āĻŧ, āĻāĻ¸ā§āĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻŋ rbind()
.
R-āĻ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ: data.table
## data.table
rbind(ga_nov, ga_dec)
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻā§āĻŦāĻŋāĻ˛ā§ āĻāĻ˛ā§āĻ˛āĻŽā§āĻŦāĻāĻžāĻŦā§ āĻ¯ā§āĻāĻĻāĻžāĻ¨ āĻāĻ°āĻž: āĻĒāĻžāĻ¨ā§āĻĄāĻž
Đ pandas
āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¯ā§āĻ āĻĻāĻŋāĻ¤ā§ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧ concat()
, āĻ¯ā§āĻāĻŋāĻ¤ā§ āĻāĻĒāĻ¨āĻžāĻā§ āĻĢā§āĻ°ā§āĻŽā§āĻ° āĻāĻāĻāĻŋ āĻ¤āĻžāĻ˛āĻŋāĻāĻž āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§āĨ¤
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸ā§āĻā§āĻ°āĻŋāĻ: āĻĒāĻžāĻ¨ā§āĻĄāĻž
# вĐĩŅŅиĐēĐ°ĐģŅĐŊĐžĐĩ ОйŅĐĩдиĐŊĐĩĐŊиĐĩ ŅĐ°ĐąĐģиŅ
pd.concat([ga_nov, ga_dec])
āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻ¯ā§āĻāĻĻāĻžāĻ¨
āĻāĻāĻāĻŋ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨ āĻ¯ā§āĻāĻžāĻ¨ā§ āĻĻā§āĻŦāĻŋāĻ¤ā§āĻ¯āĻŧ āĻĨā§āĻā§ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋ āĻā§ āĻĻā§āĻŦāĻžāĻ°āĻž āĻĒā§āĻ°āĻĨāĻŽ āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¯ā§āĻ āĻāĻ°āĻž āĻšāĻ¯āĻŧāĨ¤ āĻāĻŋāĻā§ āĻ°ā§āĻĢāĻžāĻ°ā§āĻ¨ā§āĻ¸ āĻĄā§āĻāĻž (āĻāĻĻāĻžāĻšāĻ°āĻŖāĻ¸ā§āĻŦāĻ°ā§āĻĒ, āĻāĻāĻāĻŋ āĻĒāĻŖā§āĻ¯ā§āĻ° āĻŽā§āĻ˛ā§āĻ¯) āĻ¸āĻš āĻāĻāĻāĻŋ āĻĢā§āĻ¯āĻžāĻā§āĻ āĻā§āĻŦāĻŋāĻ˛ (āĻāĻĻāĻžāĻšāĻ°āĻŖāĻ¸ā§āĻŦāĻ°ā§āĻĒ, āĻŦāĻŋāĻā§āĻ°āĻ¯āĻŧ āĻĄā§āĻāĻž āĻ¸āĻš āĻāĻāĻāĻŋ āĻā§āĻŦāĻŋāĻ˛) āĻ¸āĻŽā§āĻĻā§āĻ§ āĻāĻ°āĻžāĻ° āĻ¸āĻŽāĻ¯āĻŧ āĻāĻāĻŋ āĻĒā§āĻ°āĻžāĻ¯āĻŧāĻļāĻ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧāĨ¤
āĻ¯ā§āĻāĻĻāĻžāĻ¨ āĻŦāĻŋāĻāĻŋāĻ¨ā§āĻ¨ āĻ§āĻ°āĻ¨ā§āĻ° āĻāĻā§:
āĻĒā§āĻ°ā§āĻŦā§ āĻ˛ā§āĻĄ āĻāĻ°āĻž āĻā§āĻŦāĻŋāĻ˛ā§ āĻŦāĻŋāĻ°āĻžāĻāĻāĻžāĻ¯āĻŧ āĻāĻŽāĻžāĻĻā§āĻ° āĻāĻāĻāĻŋ āĻāĻ˛āĻžāĻŽ āĻāĻā§ āĻ˛āĻŋāĻā§āĻ, āĻ¯āĻž āĻ¯āĻžāĻ¤ā§āĻ°ā§āĻ° āĻ˛āĻŋāĻā§āĻ āĻā§āĻĄā§āĻ° āĻ¸āĻžāĻĨā§ āĻŽāĻŋāĻ˛ā§ āĻ¯āĻžāĻ¯āĻŧ:
1 - āĻŽāĻšāĻŋāĻ˛āĻž
2 - āĻĒā§āĻ°ā§āĻˇ
āĻāĻāĻžāĻĄāĻŧāĻžāĻ, āĻāĻŽāĻ°āĻž āĻāĻāĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ āĻ¤ā§āĻ°āĻŋ āĻāĻ°ā§āĻāĻŋ - āĻāĻāĻāĻŋ āĻ°ā§āĻĢāĻžāĻ°ā§āĻ¨ā§āĻ¸ āĻŦāĻ āĻ˛āĻŋāĻā§āĻ. āĻ¯āĻžāĻ¤ā§āĻ°ā§āĻĻā§āĻ° āĻ˛āĻŋāĻā§āĻ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻāĻŋāĻ¤ āĻĄā§āĻāĻžāĻ° āĻāĻ°āĻ āĻ¸ā§āĻŦāĻŋāĻ§āĻžāĻāĻ¨āĻ āĻāĻĒāĻ¸ā§āĻĨāĻžāĻĒāĻ¨āĻžāĻ° āĻāĻ¨ā§āĻ¯, āĻāĻŽāĻžāĻĻā§āĻ° āĻĄāĻŋāĻ°ā§āĻā§āĻāĻ°āĻŋ āĻĨā§āĻā§ āĻ˛āĻŋāĻā§āĻā§āĻ° āĻ¨āĻžāĻŽ āĻ¯ā§āĻ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§ āĻ˛āĻŋāĻā§āĻ āĻā§āĻŦāĻŋāĻ˛ā§ āĻŦāĻŋāĻ°āĻžāĻāĻāĻžāĻ¯āĻŧ.
āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻā§āĻŦāĻŋāĻ˛ R-āĻ āĻ¯ā§āĻ āĻĻāĻŋāĻ¨: tidyverse, dplyr
Đ dplyr
āĻ
āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻ¯ā§āĻāĻĻāĻžāĻ¨ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻĢāĻžāĻāĻļāĻ¨āĻā§āĻ˛āĻŋāĻ° āĻāĻāĻāĻŋ āĻ¸āĻŽā§āĻĒā§āĻ°ā§āĻŖ āĻĒāĻ°āĻŋāĻŦāĻžāĻ° āĻ°āĻ¯āĻŧā§āĻā§:
inner_join()
left_join()
right_join()
full_join()
semi_join()
nest_join()
anti_join()
āĻāĻŽāĻžāĻ° āĻ
āĻ¨ā§āĻļā§āĻ˛āĻ¨ā§ āĻ¸āĻŦāĻā§āĻ¯āĻŧā§ āĻŦā§āĻļāĻŋ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧ left_join()
.
āĻĒā§āĻ°āĻĨāĻŽ āĻĻā§āĻāĻŋ āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ āĻšāĻŋāĻ¸āĻžāĻŦā§, āĻāĻĒāĻ°ā§ āĻ¤āĻžāĻ˛āĻŋāĻāĻžāĻā§āĻā§āĻ¤ āĻĢāĻžāĻāĻļāĻ¨āĻā§āĻ˛āĻŋ āĻ¯ā§āĻ āĻĻāĻŋāĻ¤ā§ āĻĻā§āĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ āĻ¨ā§āĻ¯āĻŧ āĻāĻŦāĻ āĻ¤ā§āĻ¤ā§āĻ¯āĻŧ āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ āĻšāĻŋāĻ¸āĻžāĻŦā§ by āĻ¯ā§āĻāĻĻāĻžāĻ¨ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻāĻĒāĻ¨āĻžāĻā§ āĻ āĻŦāĻļā§āĻ¯āĻ āĻāĻ˛āĻžāĻŽāĻā§āĻ˛āĻŋ āĻ¨āĻŋāĻ°ā§āĻĻāĻŋāĻˇā§āĻ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§āĨ¤
āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻā§āĻŦāĻŋāĻ˛ R: dplyr-āĻ āĻ¯ā§āĻ āĻĻāĻŋāĻ¨
# ОйŅĐĩдиĐŊŅĐĩĐŧ ŅĐ°ĐąĐģиŅŅ
left_join(titanic, gender,
by = c("Sex" = "id"))
R: data.table-āĻ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻ¯ā§āĻāĻĻāĻžāĻ¨
Đ data.table
āĻāĻĒāĻ¨āĻžāĻā§ āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻā§ āĻĻā§āĻŦāĻžāĻ°āĻž āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¯ā§āĻ āĻĻāĻŋāĻ¤ā§ āĻšāĻŦā§ merge()
.
data.table āĻ āĻŽāĻžāĻ°ā§āĻ() āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ
- x, y â āĻ¯ā§āĻāĻĻāĻžāĻ¨ā§āĻ° āĻāĻ¨ā§āĻ¯ āĻā§āĻŦāĻŋāĻ˛
- āĻĻā§āĻŦāĻžāĻ°āĻž â āĻāĻ˛āĻžāĻŽ āĻ¯ā§āĻāĻŋ āĻ¯ā§āĻāĻĻāĻžāĻ¨ā§āĻ° āĻāĻžāĻŦāĻŋāĻāĻžāĻ āĻŋ āĻ¯āĻĻāĻŋ āĻāĻāĻ¯āĻŧ āĻā§āĻŦāĻŋāĻ˛ā§ āĻāĻāĻ āĻ¨āĻžāĻŽ āĻĨāĻžāĻā§
- by.x, by.y â āĻāĻ˛āĻžāĻŽā§āĻ° āĻ¨āĻžāĻŽāĻā§āĻ˛āĻŋ āĻāĻāĻ¤ā§āĻ°āĻŋāĻ¤ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§, āĻ¯āĻĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¤āĻžāĻĻā§āĻ° āĻāĻ˛āĻžāĻĻāĻž āĻ¨āĻžāĻŽ āĻĨāĻžāĻā§
- all, all.x, all.y â āĻāĻ¯āĻŧā§āĻ¨ āĻāĻžāĻāĻĒ, āĻ¸āĻŦāĻā§āĻ˛āĻŋ āĻāĻāĻ¯āĻŧ āĻā§āĻŦāĻŋāĻ˛ āĻĨā§āĻā§ āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ¸āĻžāĻ°āĻŋ āĻĢā§āĻ°āĻ¤ āĻĻā§āĻŦā§, all.x āĻŦāĻžāĻŽ āĻ¯ā§āĻāĻĻāĻžāĻ¨ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨ā§āĻ° āĻ¸āĻžāĻĨā§ āĻ¸āĻŽā§āĻĒāĻ°ā§āĻāĻŋāĻ¤ (āĻĒā§āĻ°āĻĨāĻŽ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻ¸āĻžāĻ°āĻŋ āĻā§āĻĄāĻŧā§ āĻ¯āĻžāĻŦā§), all.y â āĻāĻ° āĻ¸āĻžāĻĨā§ āĻŽāĻŋāĻ˛ā§ āĻ¯āĻžāĻ¯āĻŧ āĻ°āĻžāĻāĻ āĻāĻ¯āĻŧā§āĻ¨ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨ (āĻĻā§āĻŦāĻŋāĻ¤ā§āĻ¯āĻŧ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ¸āĻŦ āĻ¸āĻžāĻ°āĻŋ āĻā§āĻĄāĻŧā§ āĻ¯āĻžāĻŦā§)āĨ¤
R: data.table-āĻ āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻ¯ā§āĻāĻĻāĻžāĻ¨
# ОйŅĐĩдиĐŊŅĐĩĐŧ ŅĐ°ĐąĐģиŅŅ
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻā§āĻŦāĻŋāĻ˛ āĻ¯ā§āĻ āĻĻāĻŋāĻ¨: āĻĒāĻžāĻ¨ā§āĻĄāĻž
āĻĒāĻžāĻļāĻžāĻĒāĻžāĻļāĻŋ āĻāĻ¨ data.table
, āĻāĻ¨ pandas
āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¯ā§āĻ āĻĻāĻŋāĻ¤ā§ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧ merge()
.
āĻĒāĻžāĻ¨ā§āĻĄāĻžāĻ¯āĻŧ āĻŽāĻžāĻ°ā§āĻ() āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ
- āĻāĻŋāĻāĻžāĻŦā§ â āĻ¸āĻāĻ¯ā§āĻā§āĻ° āĻ§āĻ°āĻ¨: āĻŦāĻžāĻŽ, āĻĄāĻžāĻ¨, āĻŦāĻžāĻāĻ°ā§āĻ°, āĻāĻŋāĻ¤āĻ°ā§āĻ°
- on â āĻāĻ˛āĻžāĻŽ āĻ¯ā§āĻāĻŋ āĻāĻāĻāĻŋ āĻā§ āĻ¯āĻĻāĻŋ āĻāĻāĻ¯āĻŧ āĻā§āĻŦāĻŋāĻ˛ā§ āĻāĻāĻ āĻ¨āĻžāĻŽ āĻĨāĻžāĻā§
- left_on, right_on â āĻā§ āĻāĻ˛āĻžāĻŽā§āĻ° āĻ¨āĻžāĻŽ, āĻ¯āĻĻāĻŋ āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¤āĻžāĻĻā§āĻ° āĻāĻ˛āĻžāĻĻāĻž āĻ¨āĻžāĻŽ āĻĨāĻžāĻā§
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻ āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻā§āĻŦāĻŋāĻ˛ āĻ¯ā§āĻ āĻĻāĻŋāĻ¨: āĻĒāĻžāĻ¨ā§āĻĄāĻž
# ОйŅĐĩдиĐŊŅĐĩĐŧ ĐŋĐž ĐēĐģŅŅŅ
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")
āĻĒā§āĻ°āĻžāĻĨāĻŽāĻŋāĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻŦāĻ āĻāĻŖāĻ¨āĻž āĻāĻ°āĻž āĻāĻ˛āĻžāĻŽ
āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻ āĻ°ā§āĻĨā§ āĻ āĻ¨ā§āĻ°ā§āĻĒ, āĻāĻŦāĻ āĻĒā§āĻ°āĻžāĻ¯āĻŧāĻļāĻ āĻĄā§āĻāĻž āĻŦāĻŋāĻļā§āĻ˛ā§āĻˇāĻŖā§āĻ āĻŦā§āĻ¯āĻŦāĻšā§āĻ¤ āĻšāĻ¯āĻŧāĨ¤ āĻāĻŋāĻ¨ā§āĻ¤ā§ āĻāĻāĻ¤ā§āĻ°ā§āĻāĻ°āĻŖ āĻĢāĻžāĻāĻļāĻ¨ā§āĻ° āĻŦāĻŋāĻĒāĻ°ā§āĻ¤ā§, āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻāĻāĻā§āĻ¯āĻŧāĻŋāĻ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽā§āĻ° āĻ¸āĻžāĻ°āĻŋāĻ° āĻ¸āĻāĻā§āĻ¯āĻž āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨ āĻāĻ°ā§ āĻ¨āĻžāĨ¤
āĻŽā§āĻ˛āĻ¤, āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§, āĻāĻŽāĻ°āĻž āĻāĻŋāĻā§ āĻŽāĻžāĻ¨āĻĻāĻŖā§āĻĄ āĻ āĻ¨ā§āĻ¯āĻžāĻ¯āĻŧā§ āĻāĻāĻ¤ āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽāĻā§ āĻ āĻāĻļā§ āĻŦāĻŋāĻāĻā§āĻ¤ āĻāĻ°āĻŋ, āĻ¯ā§āĻŽāĻ¨ āĻāĻāĻāĻŋ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§āĻ° āĻŽāĻžāĻ¨, āĻŦāĻž āĻŦā§āĻļ āĻāĻ¯āĻŧā§āĻāĻāĻŋ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§āĻ° āĻĻā§āĻŦāĻžāĻ°āĻžāĨ¤ āĻāĻŦāĻ āĻāĻŽāĻ°āĻž āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻāĻāĻ¨ā§āĻĄā§āĻ¤ā§ āĻāĻžāĻŖāĻŋāĻ¤āĻŋāĻ āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ˛āĻžāĻĒ āĻāĻžāĻ˛āĻžāĻāĨ¤ āĻāĻ āĻ āĻĒāĻžāĻ°ā§āĻļāĻ¨āĻā§āĻ˛āĻŋāĻ° āĻĢāĻ˛āĻžāĻĢāĻ˛ āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻ˛āĻžāĻāĻ¨ā§ āĻĢā§āĻ°āĻ¤ āĻĻā§āĻāĻ¯āĻŧāĻž āĻšāĻŦā§, āĻ¯ā§āĻŽāĻ¨ āĻ¸āĻžāĻ°āĻŖā§āĻ¤ā§ āĻŽā§āĻ āĻ¸āĻžāĻ°āĻŋāĻ° āĻ¸āĻāĻā§āĻ¯āĻž āĻĒāĻ°āĻŋāĻŦāĻ°ā§āĻ¤āĻ¨ āĻ¨āĻž āĻāĻ°ā§āĨ¤
āĻāĻĻāĻžāĻšāĻ°āĻŖāĻ¸ā§āĻŦāĻ°ā§āĻĒ, āĻā§āĻŦāĻŋāĻ˛āĻāĻŋ āĻ¨ā§āĻāĻ¯āĻŧāĻž āĻ¯āĻžāĻ āĻŦāĻŋāĻ°āĻžāĻāĻāĻžāĻ¯āĻŧ. āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻāĻŋāĻāĻŋāĻā§āĻ° āĻā§āĻŦāĻŋāĻ¨ āĻā§āĻ˛āĻžāĻ¸ā§āĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻāĻ¤ āĻļāĻ¤āĻžāĻāĻļ āĻāĻ°āĻ āĻšāĻ¯āĻŧā§āĻā§ āĻ¤āĻž āĻāĻŽāĻ°āĻž āĻāĻŖāĻ¨āĻž āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°āĻŋāĨ¤
āĻāĻāĻŋ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯, āĻāĻŽāĻžāĻĻā§āĻ° āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻ˛āĻžāĻāĻ¨ā§ āĻŦāĻ°ā§āĻ¤āĻŽāĻžāĻ¨ āĻā§āĻŦāĻŋāĻ¨ āĻļā§āĻ°ā§āĻŖā§āĻ° āĻāĻāĻāĻŋ āĻāĻŋāĻāĻŋāĻā§āĻ° āĻŽā§āĻ āĻŽā§āĻ˛ā§āĻ¯ āĻĒā§āĻ¤ā§ āĻšāĻŦā§ āĻ¯ā§āĻāĻŋ āĻāĻ āĻ˛āĻžāĻāĻ¨ā§āĻ° āĻāĻŋāĻāĻŋāĻāĻāĻŋ āĻ°āĻ¯āĻŧā§āĻā§, āĻ¤āĻžāĻ°āĻĒāĻ° āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻāĻŋāĻāĻŋāĻā§āĻ° āĻŽā§āĻ˛ā§āĻ¯āĻā§ āĻāĻāĻ āĻā§āĻŦāĻŋāĻ¨ āĻļā§āĻ°ā§āĻŖā§āĻ° āĻ¸āĻŽāĻ¸ā§āĻ¤ āĻāĻŋāĻāĻŋāĻā§āĻ° āĻŽā§āĻ āĻŽā§āĻ˛ā§āĻ¯ āĻĻā§āĻŦāĻžāĻ°āĻž āĻāĻžāĻ āĻāĻ°ā§āĻ¨āĨ¤ .
R-āĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨: tidyverse, dplyr
āĻ¸āĻžāĻ°āĻŋ āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻ¨āĻž āĻāĻ°ā§ āĻ¨āĻ¤ā§āĻ¨ āĻāĻ˛āĻžāĻŽ āĻ¯ā§āĻ āĻāĻ°āĻ¤ā§, āĻāĻ¨ dplyr
āĻĢāĻžāĻāĻļāĻ¨ āĻĒāĻ°āĻŋāĻŦā§āĻļāĻ¨ āĻāĻ°ā§ mutate()
.
āĻāĻĒāĻ¨āĻŋ āĻā§āĻˇā§āĻ¤ā§āĻ° āĻ āĻ¨ā§āĻ¸āĻžāĻ°ā§ āĻĄā§āĻāĻž āĻā§āĻ°ā§āĻĒ āĻāĻ°ā§ āĻāĻĒāĻ°ā§ āĻŦāĻ°ā§āĻŖāĻŋāĻ¤ āĻ¸āĻŽāĻ¸ā§āĻ¯āĻžāĻ° āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨ Pclass āĻāĻŦāĻ āĻāĻāĻāĻŋ āĻ¨āĻ¤ā§āĻ¨ āĻāĻ˛āĻžāĻŽā§ āĻā§āĻˇā§āĻ¤ā§āĻ°āĻāĻŋāĻ° āĻ¸āĻāĻā§āĻˇāĻŋāĻĒā§āĻ¤āĻāĻ°āĻŖ āĻāĻžāĻĄāĻŧāĻž. āĻāĻ° āĻĒāĻ°ā§, āĻā§āĻŦāĻŋāĻ˛āĻāĻŋ āĻāĻ¨āĻā§āĻ°ā§āĻĒ āĻāĻ°ā§āĻ¨ āĻāĻŦāĻ āĻā§āĻˇā§āĻ¤ā§āĻ°ā§āĻ° āĻŽāĻžāĻ¨āĻā§āĻ˛āĻŋ āĻāĻžāĻ āĻāĻ°ā§āĻ¨ āĻāĻžāĻĄāĻŧāĻž āĻĒā§āĻ°ā§āĻŦāĻŦāĻ°ā§āĻ¤ā§ āĻ§āĻžāĻĒā§ āĻ¯āĻž āĻāĻā§āĻā§āĨ¤
R: dplyr-āĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨
group_by(titanic, Pclass) %>%
mutate(Pclass_cost = sum(Fare)) %>%
ungroup() %>%
mutate(ticket_fare_rate = Fare / Pclass_cost)
R-āĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨: data.table
āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ āĻ
ā§āĻ¯āĻžāĻ˛āĻāĻ°āĻŋāĻĻāĻŽ āĻšāĻŋāĻ¸āĻžāĻŦā§ āĻāĻāĻ āĻĨāĻžāĻā§ dplyr
, āĻāĻŽāĻžāĻĻā§āĻ° āĻā§āĻˇā§āĻ¤ā§āĻ° āĻ
āĻ¨ā§āĻ¸āĻžāĻ°ā§ āĻā§āĻŦāĻŋāĻ˛āĻāĻŋāĻā§ āĻāĻāĻ¨ā§āĻĄā§āĻ¤ā§ āĻŦāĻŋāĻāĻā§āĻ¤ āĻāĻ°āĻ¤ā§ āĻšāĻŦā§ Pclass. āĻāĻāĻāĻŋ āĻ¨āĻ¤ā§āĻ¨ āĻāĻ˛āĻžāĻŽā§ āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻ¸āĻžāĻ°āĻŋāĻ° āĻ¸āĻžāĻĨā§ āĻ¸āĻāĻļā§āĻ˛āĻŋāĻˇā§āĻ āĻā§āĻ°ā§āĻĒā§āĻ° āĻĒāĻ°āĻŋāĻŽāĻžāĻŖ āĻāĻāĻāĻĒā§āĻ āĻāĻ°ā§āĻ¨ āĻāĻŦāĻ āĻāĻāĻāĻŋ āĻāĻ˛āĻžāĻŽ āĻ¯ā§āĻ āĻāĻ°ā§āĻ¨ āĻ¯ā§āĻāĻžāĻ¨ā§ āĻāĻŽāĻ°āĻž āĻ¤āĻžāĻ° āĻā§āĻ°ā§āĻĒā§āĻ° āĻĒā§āĻ°āĻ¤āĻŋāĻāĻŋ āĻāĻŋāĻāĻŋāĻā§āĻ° āĻŽā§āĻ˛ā§āĻ¯ā§āĻ° āĻāĻžāĻ āĻāĻŖāĻ¨āĻž āĻāĻ°āĻŋāĨ¤
āĻ¨āĻ¤ā§āĻ¨ āĻāĻ˛āĻžāĻŽ āĻ¯ā§āĻ āĻāĻ°āĻ¤ā§ data.table
āĻ
āĻĒāĻžāĻ°ā§āĻāĻ° āĻāĻĒāĻ¸ā§āĻĨāĻŋāĻ¤ :=
. āĻ¨ā§āĻā§ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ āĻāĻāĻāĻŋ āĻ¸āĻŽāĻ¸ā§āĻ¯āĻž āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ā§āĻ° āĻāĻāĻāĻŋ āĻāĻĻāĻžāĻšāĻ°āĻŖ data.table
R-āĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨: data.table
titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost),
by = Pclass]
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨: āĻĒāĻžāĻ¨ā§āĻĄāĻž
āĻāĻāĻāĻŋ āĻ¨āĻ¤ā§āĻ¨ āĻāĻ˛āĻžāĻŽ āĻ¯ā§āĻ āĻāĻ°āĻžāĻ° āĻāĻāĻāĻŋ āĻāĻĒāĻžāĻ¯āĻŧ pandas
- āĻĢāĻžāĻāĻļāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨ assign()
. āĻ¸āĻžāĻ°āĻŋ āĻā§āĻˇā§āĻ ā§āĻā§āĻā§āĻ¤ āĻ¨āĻž āĻāĻ°ā§ āĻā§āĻŦāĻŋāĻ¨ āĻļā§āĻ°ā§āĻŖā§ āĻ
āĻ¨ā§āĻ¸āĻžāĻ°ā§ āĻāĻŋāĻāĻŋāĻā§āĻ° āĻŽā§āĻ˛ā§āĻ¯ āĻ¸āĻāĻā§āĻˇāĻŋāĻĒā§āĻ¤ āĻāĻ°āĻ¤ā§, āĻāĻŽāĻ°āĻž āĻĢāĻžāĻāĻļāĻ¨āĻāĻŋ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°āĻŦ transform()
.
āĻ¨ā§āĻā§ āĻāĻāĻāĻŋ āĻ¸āĻŽāĻžāĻ§āĻžāĻ¨ā§āĻ° āĻāĻāĻāĻŋ āĻāĻĻāĻžāĻšāĻ°āĻŖ āĻ¯ā§āĻāĻžāĻ¨ā§ āĻāĻŽāĻ°āĻž āĻā§āĻŦāĻŋāĻ˛ā§ āĻ¯ā§āĻ āĻāĻ°āĻŋ āĻŦāĻŋāĻ°āĻžāĻāĻāĻžāĻ¯āĻŧ āĻāĻāĻ 2 āĻāĻ˛āĻžāĻŽāĨ¤
āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨: āĻĒāĻžāĻ¨ā§āĻĄāĻž
titanic.assign(Pclass_cost = titanic.groupby('Pclass').Fare.transform(sum),
ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])
āĻĢāĻžāĻāĻļāĻ¨ āĻāĻŦāĻ āĻĒāĻĻā§āĻ§āĻ¤āĻŋ āĻāĻŋāĻ āĻŋāĻĒāĻ¤ā§āĻ° āĻā§āĻŦāĻŋāĻ˛
āĻ¨ā§āĻā§ āĻāĻŽāĻ°āĻž āĻŦāĻŋāĻŦā§āĻāĻ¨āĻž āĻāĻ°āĻž āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛āĻŋāĻ¤ā§ āĻĄā§āĻāĻž āĻ¸āĻš āĻŦāĻŋāĻāĻŋāĻ¨ā§āĻ¨ āĻā§āĻ°āĻŋāĻ¯āĻŧāĻžāĻāĻ˛āĻžāĻĒ āĻ¸āĻŽā§āĻĒāĻžāĻĻāĻ¨ā§āĻ° āĻĒāĻĻā§āĻ§āĻ¤āĻŋāĻā§āĻ˛āĻŋāĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻāĻŋāĻ āĻŋāĻĒāĻ¤ā§āĻ°ā§āĻ° āĻāĻāĻāĻŋ āĻ¸āĻžāĻ°āĻŖā§ āĻ°āĻ¯āĻŧā§āĻā§ā§ˇ
āĻŦāĻŋāĻŦāĻ°āĻŖ
āĻĒāĻ°āĻŋāĻĒāĻžāĻāĻŋ
āĻĄā§āĻāĻž.āĻā§āĻ¯āĻžāĻŦāĻ˛
āĻĒāĻžāĻ¨ā§āĻĄāĻžāĻ¸
āĻ¤āĻĨā§āĻ¯ āĻĒā§āĻ°āĻ¸ā§āĻ¤ā§āĻ¤ āĻšāĻā§āĻā§
vroom()
/ readr::read_csv()
/ readr::read_tsv()
fread()
read_csv()
āĻĄā§āĻāĻžāĻĢā§āĻ°ā§āĻŽ āĻ¤ā§āĻ°āĻŋ āĻāĻ°āĻž
tibble()
data.table()
dict()
+ from_dict()
āĻāĻ˛āĻžāĻŽ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻž āĻšāĻā§āĻā§
select()
āĻ¯ā§āĻā§āĻ¤āĻŋ j, āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻĻā§āĻŦāĻŋāĻ¤ā§āĻ¯āĻŧ āĻ
āĻŦāĻ¸ā§āĻĨāĻžāĻ¨
āĻāĻŽāĻ°āĻž āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§āĻ¯āĻŧ āĻāĻ˛āĻžāĻŽā§āĻ° āĻ¤āĻžāĻ˛āĻŋāĻāĻž āĻĒāĻžāĻ¸ āĻāĻ°āĻŋ / drop()
/ filter()
/ select_dtypes()
āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻ¸āĻžāĻ°āĻŋ
filter()
āĻ¯ā§āĻā§āĻ¤āĻŋ i, āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻĒā§āĻ°āĻĨāĻŽ āĻ
āĻŦāĻ¸ā§āĻĨāĻžāĻ¨
āĻāĻŽāĻ°āĻž āĻŦāĻ°ā§āĻāĻžāĻāĻžāĻ° āĻŦāĻ¨ā§āĻ§āĻ¨ā§āĻ¤ā§ āĻĢāĻŋāĻ˛ā§āĻāĻžāĻ°āĻŋāĻ āĻļāĻ°ā§āĻ¤āĻā§āĻ˛āĻŋ āĻ¤āĻžāĻ˛āĻŋāĻāĻžāĻā§āĻā§āĻ¤ āĻāĻ°āĻŋ / filter()
āĻā§āĻ°ā§āĻĒāĻŋāĻ āĻāĻŦāĻ āĻ
ā§āĻ¯āĻžāĻā§āĻ°āĻŋāĻā§āĻļāĻ¨
group_by()
+ summarise()
āĻāĻ°ā§āĻā§āĻŽā§āĻ¨ā§āĻ j + by
groupby()
+ agg()
āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻāĻ˛ā§āĻ˛āĻŽā§āĻŦ āĻāĻāĻ¨āĻŋāĻ¯āĻŧāĻ¨ (UNION)
bind_rows()
rbind()
concat()
āĻā§āĻŦāĻŋāĻ˛ā§āĻ° āĻ
āĻ¨ā§āĻā§āĻŽāĻŋāĻ āĻ¯ā§āĻāĻĻāĻžāĻ¨ (JOIN)
left_join()
/ *_join()
merge()
merge()
āĻŽā§āĻ˛āĻŋāĻ āĻāĻāĻ¨ā§āĻĄā§ āĻĢāĻžāĻāĻļāĻ¨ āĻāĻŦāĻ āĻāĻŖāĻ¨āĻž āĻāĻ°āĻž āĻāĻ˛āĻžāĻŽ āĻ¯ā§āĻ āĻāĻ°āĻž
group_by()
+ mutate()
āĻ¯ā§āĻā§āĻ¤āĻŋ j āĻ
āĻĒāĻžāĻ°ā§āĻāĻ° āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§ :=
+ āĻ¯ā§āĻā§āĻ¤āĻŋ by
transform()
+ assign()
āĻāĻĒāĻ¸āĻāĻšāĻžāĻ°
āĻ¸āĻŽā§āĻāĻŦāĻ¤ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§ āĻāĻŽāĻŋ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻ¸ā§āĻ¸āĻŋāĻāĻ¯āĻŧā§āĻ° āĻ¸āĻ°ā§āĻŦā§āĻ¤ā§āĻ¤āĻŽ āĻŦāĻžāĻ¸ā§āĻ¤āĻŦāĻžāĻ¯āĻŧāĻ¨ā§āĻ° āĻŦāĻ°ā§āĻŖāĻ¨āĻž āĻĻāĻŋāĻ¯āĻŧā§āĻāĻŋ āĻ¨āĻž, āĻ¤āĻžāĻ āĻāĻĒāĻ¨āĻŋ āĻ¯āĻĻāĻŋ āĻŽāĻ¨ā§āĻ¤āĻŦā§āĻ¯ā§ āĻāĻŽāĻžāĻ° āĻā§āĻ˛āĻā§āĻ˛āĻŋ āĻ¸āĻāĻļā§āĻ§āĻ¨ āĻāĻ°ā§āĻ¨ āĻŦāĻž āĻāĻ° / āĻĒāĻžāĻāĻĨāĻ¨ā§ āĻĄā§āĻāĻž āĻ¨āĻŋāĻ¯āĻŧā§ āĻāĻžāĻ āĻāĻ°āĻžāĻ° āĻāĻ¨ā§āĻ¯ āĻ āĻ¨ā§āĻ¯āĻžāĻ¨ā§āĻ¯ āĻā§āĻļāĻ˛āĻā§āĻ˛āĻŋāĻ° āĻ¸āĻžāĻĨā§ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§ā§ āĻĻā§āĻāĻ¯āĻŧāĻž āĻ¤āĻĨā§āĻ¯ā§āĻ° āĻĒāĻ°āĻŋāĻĒā§āĻ°āĻ āĻšāĻ˛ā§ āĻāĻŽāĻŋ āĻā§āĻļāĻŋ āĻšāĻŦāĨ¤
āĻāĻŽāĻŋ āĻāĻĒāĻ°ā§ āĻ¯ā§āĻŽāĻ¨āĻāĻŋ āĻ˛āĻŋāĻā§āĻāĻŋ, āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§āĻāĻŋāĻ° āĻāĻĻā§āĻĻā§āĻļā§āĻ¯ āĻā§āĻ¨ āĻāĻžāĻˇāĻžāĻāĻŋ āĻāĻžāĻ˛ āĻ¤āĻžāĻ° āĻāĻĒāĻ° āĻāĻžāĻ°āĻ āĻŽāĻ¤āĻžāĻŽāĻ¤ āĻāĻžāĻĒāĻžāĻ¨ā§ āĻ¨āĻ¯āĻŧ, āĻ¤āĻŦā§ āĻāĻāĻ¯āĻŧ āĻāĻžāĻˇāĻž āĻļā§āĻāĻžāĻ° āĻ¸ā§āĻ¯ā§āĻ āĻ¸āĻšāĻ āĻāĻ°āĻž, āĻŦāĻž āĻĒā§āĻ°āĻ¯āĻŧā§āĻāĻ¨ā§ āĻ¤āĻžāĻĻā§āĻ° āĻŽāĻ§ā§āĻ¯ā§ āĻ¸ā§āĻĨāĻžāĻ¨āĻžāĻ¨ā§āĻ¤āĻ° āĻāĻ°āĻžāĨ¤
āĻāĻĒāĻ¨āĻŋ āĻ¯āĻĻāĻŋ āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§āĻāĻŋ āĻĒāĻāĻ¨ā§āĻĻ āĻāĻ°ā§āĻ¨ āĻ¤āĻŦā§ āĻāĻŽāĻŋ āĻāĻŽāĻžāĻ° āĻ¨āĻ¤ā§āĻ¨ āĻā§āĻ°āĻžāĻšāĻāĻĻā§āĻ° āĻĒā§āĻ¯āĻŧā§ āĻā§āĻļāĻŋ āĻšāĻŦ
āĻ¸āĻžāĻā§āĻˇāĻžāĻ¤ā§āĻāĻžāĻ°
āĻ¨āĻŋāĻā§āĻ° āĻā§āĻ¨ āĻĒā§āĻ¯āĻžāĻā§āĻāĻā§āĻ˛ā§ āĻāĻĒāĻ¨āĻŋ āĻāĻĒāĻ¨āĻžāĻ° āĻāĻžāĻā§ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨?
āĻŽāĻ¨ā§āĻ¤āĻŦā§āĻ¯ā§ āĻāĻĒāĻ¨āĻŋ āĻāĻĒāĻ¨āĻžāĻ° āĻĒāĻāĻ¨ā§āĻĻā§āĻ° āĻāĻžāĻ°āĻŖ āĻ˛āĻŋāĻāĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨āĨ¤
āĻļā§āĻ§ā§āĻŽāĻžāĻ¤ā§āĻ° āĻ¨āĻŋāĻŦāĻ¨ā§āĻ§āĻŋāĻ¤ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°āĻāĻžāĻ°ā§āĻ°āĻž āĻāĻ°āĻŋāĻĒā§ āĻ
āĻāĻļāĻā§āĻ°āĻšāĻŖ āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°āĻŦā§āĻ¨āĨ¤
āĻāĻĒāĻ¨āĻŋ āĻā§āĻ¨ āĻĄā§āĻāĻž āĻĒā§āĻ°āĻ¸ā§āĻ¸āĻŋāĻ āĻĒā§āĻ¯āĻžāĻā§āĻ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ° āĻāĻ°ā§āĻ¨ (āĻāĻĒāĻ¨āĻŋ āĻŦā§āĻļ āĻāĻ¯āĻŧā§āĻāĻāĻŋ āĻŦāĻŋāĻāĻ˛ā§āĻĒ āĻ¨āĻŋāĻ°ā§āĻŦāĻžāĻāĻ¨ āĻāĻ°āĻ¤ā§ āĻĒāĻžāĻ°ā§āĻ¨)
-
45,2%āĻĒāĻ°āĻŋāĻĒāĻžāĻāĻŋ 19
-
33,3%data.table14
-
54,8%āĻĒāĻžāĻ¨ā§āĻĄāĻž23
42 āĻāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°āĻāĻžāĻ°ā§ āĻā§āĻ āĻĻāĻŋāĻ¯āĻŧā§āĻā§āĻ¨āĨ¤ 9 āĻāĻ¨ āĻŦā§āĻ¯āĻŦāĻšāĻžāĻ°āĻāĻžāĻ°ā§ āĻŦāĻŋāĻ°āĻ¤ āĻāĻŋāĻ˛ā§āĻ¨āĨ¤
āĻāĻ¤ā§āĻ¸: www.habr.com