เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เด‡เตปเดฑเตผเดจเต†เดฑเตเดฑเดฟเตฝ R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ Python เดŽเดจเตเดจเดคเดฟเดจเดพเดฏเดฟ เดคเดฟเดฐเดฏเตเดจเตเดจเดคเดฟเดฒเต‚เดŸเต†, เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดฑเตเดฑเดตเตเด‚ เดฎเดฟเด•เดšเตเดšเดคเตเด‚ เดตเต‡เด—เดคเดฏเต‡เดฑเดฟเดฏเดคเตเด‚ เด•เต‚เดŸเตเดคเตฝ เดธเต—เด•เดฐเตเดฏเดชเตเดฐเดฆเดตเตเดฎเดพเดฏ เดตเดฟเดทเดฏเดคเตเดคเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเตเดณเตเดณ เดฆเดถเดฒเด•เตเดทเด•เตเด•เดฃเด•เตเด•เดฟเดจเต เดฒเต‡เด–เดจเด™เตเด™เดณเตเด‚ เด•เดฟเดฒเต‹เดฎเต€เดฑเตเดฑเดฑเตเด•เดณเต‹เดณเด‚ เดšเตผเดšเตเดšเด•เดณเตเด‚ เดจเดฟเด™เตเด™เตพ เด•เดฃเตเดŸเต†เดคเตเดคเตเด‚. เดŽเดจเตเดจเดพเตฝ เดจเดฟเตผเดญเดพเด—เตเดฏเดตเดถเดพเตฝ, เดˆ เดฒเต‡เด–เดจเด™เตเด™เดณเตเด‚ เดคเตผเด•เตเด•เด™เตเด™เดณเตเด‚ เดชเตเดฐเดคเตเดฏเต‡เด•เดฟเดšเตเดšเต เด‰เดชเดฏเต‹เด—เดชเตเดฐเดฆเดฎเดฒเตเดฒ.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดฐเดฃเตเดŸเต เดญเดพเดทเด•เดณเดฟเดฒเต†เดฏเตเด‚ เดเดฑเตเดฑเดตเตเด‚ เดœเดจเดชเตเดฐเดฟเดฏเดฎเดพเดฏ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเดฟเดฒเต† เด…เดŸเดฟเดธเตเดฅเดพเดจ เดกเดพเดฑเตเดฑ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เต เดŸเต†เด•เตเดจเดฟเด•เตเด•เตเด•เตพ เดคเดพเดฐเดคเดฎเตเดฏเด‚ เดšเต†เดฏเตเดฏเตเด• เดŽเดจเตเดจเดคเดพเดฃเต เดˆ เดฒเต‡เด–เดจเดคเตเดคเดฟเดจเตเดฑเต† เด‰เดฆเตเดฆเต‡เดถเตเดฏเด‚. เด•เต‚เดŸเดพเดคเต† เด‡เดคเตเดตเดฐเต† เด…เดฑเดฟเดฏเดพเดคเตเดค เดŽเดจเตเดคเต†เด™เตเด•เดฟเดฒเตเด‚ เดตเต‡เด—เดคเตเดคเดฟเตฝ เดฎเดพเดธเตเดฑเตเดฑเตผ เดšเต†เดฏเตเดฏเดพเตป เดตเดพเดฏเดจเด•เตเด•เดพเดฐเต† เดธเดนเดพเดฏเดฟเด•เตเด•เตเด•. เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดŽเดดเตเดคเตเดจเตเดจเดตเตผเด•เตเด•เต, R-เดฒเตเด‚ เด…เดคเต‡ เด•เดพเดฐเตเดฏเด‚ เดŽเด™เตเด™เดจเต† เดšเต†เดฏเตเดฏเดพเดฎเต†เดจเตเดจเต เด•เดฃเตเดŸเต†เดคเตเดคเตเด•.

เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ R-เดฒเต† เดเดฑเตเดฑเดตเตเด‚ เดœเดจเดชเตเดฐเดฟเดฏเดฎเดพเดฏ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเตเดŸเต† เดตเดพเด•เตเดฏเด˜เดŸเดจ เดžเด™เตเด™เตพ เดตเดฟเดถเด•เดฒเดจเด‚ เดšเต†เดฏเตเดฏเตเด‚. เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเดฟเตฝ เด‰เตพเดชเตเดชเต†เดŸเตเดคเตเดคเดฟเดฏเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‡เดตเดฏเดพเดฃเต tidyverseเด•เต‚เดŸเดพเดคเต† เดชเดพเด•เตเด•เต‡เดœเตเด‚ data.table. เด…เดตเดฐเตเดŸเต† เดตเดพเด•เตเดฏเด˜เดŸเดจเดฏเตเดฎเดพเดฏเดฟ เดคเดพเดฐเดคเดฎเตเดฏเด‚ เดšเต†เดฏเตเดฏเตเด• pandas, เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดเดฑเตเดฑเดตเตเด‚ เดœเดจเดชเตเดฐเดฟเดฏเดฎเดพเดฏ เดกเดพเดฑเตเดฑ เดตเดฟเดถเด•เดฒเดจ เดชเดพเด•เตเด•เต‡เดœเต.

เดกเดพเดฑเตเดฑเดพ เดตเดฟเดถเด•เดฒเดจเด‚ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเดคเต เดฎเตเดคเตฝ เดชเตˆเดคเตเดคเตบ, เด†เตผ เดŽเดจเตเดจเดฟเดต เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด…เดจเดฒเดฟเดฑเตเดฑเดฟเด•เตเด•เตฝ เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตเดทเดจเตเด•เตพ เดจเดŸเดคเตเดคเตเดจเตเดจเดคเต เดตเดฐเต†เดฏเตเดณเตเดณ เดฎเตเดดเตเดตเตป เดชเดพเดคเดฏเดฟเดฒเต‚เดŸเต†เดฏเตเด‚ เดžเด™เตเด™เตพ เด˜เดŸเตเดŸเด‚ เด˜เดŸเตเดŸเดฎเดพเดฏเดฟ เดชเต‹เด•เตเด‚.

เด‰เดณเตเดณเดŸเด•เตเด•เด‚

เดชเดฐเดฟเด—เดฃเดจเดฏเดฟเดฒเตเดณเตเดณ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเดฟเดฒเตŠเดจเตเดจเดฟเตฝ เดšเดฟเดฒ เดกเดพเดฑเตเดฑ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เต เด“เดชเตเดชเดฑเต‡เดทเตป เดŽเด™เตเด™เดจเต† เดจเดŸเดคเตเดคเดฃเดฎเต†เดจเตเดจเต เดจเดฟเด™เตเด™เตพ เดฎเดฑเดจเตเดจเตเดชเต‹เดฏเต†เด™เตเด•เดฟเตฝ เดˆ เดฒเต‡เด–เดจเด‚ เด’เดฐเต เดšเต€เดฑเตเดฑเต เดทเต€เดฑเตเดฑเดพเดฏเดฟ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเดตเตเดจเตเดจเดคเดพเดฃเต.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

  1. R เด‰เด‚ เดชเตˆเดคเตเดคเดฃเตเด‚ เดคเดฎเตเดฎเดฟเดฒเตเดณเตเดณ เดชเตเดฐเดงเดพเดจ เดตเดพเด•เตเดฏเด˜เดŸเดจ เดตเตเดฏเดคเตเดฏเดพเดธเด™เตเด™เตพ
    1.1. เดชเดพเด•เตเด•เต‡เดœเต เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เด†เด•เตเดธเดธเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต
    1.2. เด…เดธเตˆเตปเดฎเต†เดจเตเดฑเต
    1.3. เด‡เตปเดกเต†เด•เตเดธเดฟเด‚เด—เต
    1.4. เดฐเต€เดคเดฟเด•เดณเตเด‚ OOP
    1.5. เดชเตˆเดชเตเดชเต เดฒเตˆเดจเตเด•เตพ
    1.6. เดกเดพเดฑเตเดฑ เด˜เดŸเดจเด•เตพ
  2. เดžเด™เตเด™เตพ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเต เด•เตเดฑเดšเตเดšเต เดตเดพเด•เตเด•เตเด•เตพ
    2.1. เดตเตƒเดคเตเดคเดฟเดฏเตเดณเตเดณ
    2.2. เดกเดพเดฑเตเดฑ. เดชเดŸเตเดŸเดฟเด•
    2.3. เดชเดพเดฃเตเดŸเด•เตพ
  3. เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเตเดจเตเดจเต
  4. เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต
  5. เดกเดพเดฑเตเดฑ เดซเตเดฐเต†เดฏเดฟเดฎเตเด•เตพ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต
  6. เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด†เดตเดถเตเดฏเดฎเตเดณเตเดณ เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต
  7. เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต เดตเดฐเดฟเด•เตพ
  8. เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเตเด‚
  9. เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดฒเด‚เดฌเดฎเดพเดฏ เดฏเต‚เดฃเดฟเดฏเตป (UNION)
  10. เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดคเดฟเดฐเดถเตเดšเต€เดจ เดœเต‹เดฏเดฟเตป (เดœเต‹เดฏเดฟเตป)
  11. เด…เดŸเดฟเดธเตเดฅเดพเดจ เดตเดฟเตปเดกเต‹ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเตเด‚ เด•เดฃเด•เตเด•เดพเด•เตเด•เดฟเดฏ เดจเดฟเดฐเด•เดณเตเด‚
  12. R, Python เดŽเดจเตเดจเดฟเดตเดฏเดฟเดฒเต† เดกเดพเดฑเตเดฑเดพ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เต เดฐเต€เดคเดฟเด•เตพ เดคเดฎเตเดฎเดฟเดฒเตเดณเตเดณ เด•เดฑเดธเตโ€Œเดชเต‹เดฃเตเดŸเตปเดธเต เดชเดŸเตเดŸเดฟเด•
  13. เดคเต€เดฐเตเดฎเดพเดจเด‚
  14. เดจเดฟเด™เตเด™เตพ เดเดคเต เดชเดพเด•เตเด•เต‡เดœเดพเดฃเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเต เดŽเดจเตเดจเดคเดฟเดจเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเตเดณเตเดณ เด’เดฐเต เดšเต†เดฑเดฟเดฏ เดธเตผเดตเต‡

เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดกเดพเดฑเตเดฑ เดตเดฟเดถเด•เดฒเดจเดคเตเดคเดฟเตฝ เดคเดพเตฝเดชเตเดชเดฐเตเดฏเดฎเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ, เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดŽเดจเตเดฑเต† เด•เดฃเตเดŸเต†เดคเตเดคเดพเด‚ เดŸเต†เดฒเด—เตเดฐเดพเด‚ ะธ YouTube เดšเดพเดจเดฒเตเด•เตพ. เด‰เดณเตเดณเดŸเด•เตเด•เดคเตเดคเดฟเดจเตเดฑเต† เดญเต‚เดฐเดฟเดญเดพเด—เดตเตเด‚ R เดญเดพเดทเดฏเตโ€Œเด•เตเด•เดพเดฏเดฟ เดธเดฎเตผเดชเตเดชเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต.

R เด‰เด‚ เดชเตˆเดคเตเดคเดฃเตเด‚ เดคเดฎเตเดฎเดฟเดฒเตเดณเตเดณ เดชเตเดฐเดงเดพเดจ เดตเดพเด•เตเดฏเด˜เดŸเดจ เดตเตเดฏเดคเตเดฏเดพเดธเด™เตเด™เตพ

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดจเดฟเดจเตเดจเต R เดฒเต‡เด•เตเด•เต เดฎเดพเดฑเตเดจเตเดจเดคเต เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดŽเดณเตเดชเตเดชเดฎเดพเด•เตเด•เตเดจเตเดจเดคเดฟเดจเต, เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดคเดฟเดฐเดฟเดšเตเดšเตเด‚, เดจเดฟเด™เตเด™เตพ เดถเตเดฐเดฆเตเดงเดฟเด•เตเด•เต‡เดฃเตเดŸ เดšเดฟเดฒ เดชเตเดฐเดงเดพเดจ เดชเต‹เดฏเดฟเดจเตเดฑเตเด•เตพ เดžเดพเตป เดจเตฝเด•เตเด‚.

เดชเดพเด•เตเด•เต‡เดœเต เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เด†เด•เตเดธเดธเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เด’เดฐเต เดชเดพเด•เตเด•เต‡เดœเต R-เดฒเต‡เด•เตเด•เต เดฒเต‹เดกเต เดšเต†เดฏเตเดคเตเด•เดดเดฟเดžเตเดžเดพเตฝ, เด…เดคเดฟเดจเตเดฑเต† เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ เด†เด•เตโ€Œเดธเดธเต เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต เดจเดฟเด™เตเด™เตพ เดชเดพเด•เตเด•เต‡เดœเดฟเดจเตเดฑเต† เดชเต‡เดฐเต เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เต‡เดฃเตเดŸเดคเดฟเดฒเตเดฒ. เดฎเดฟเด•เตเด• เด•เต‡เดธเตเด•เดณเดฟเดฒเตเด‚ เด‡เดคเต R-เตฝ เดธเดพเดงเดพเดฐเดฃเดฎเดฒเตเดฒ, เดชเด•เตเดทเต‡ เด‡เดคเต เดธเตเดตเต€เด•เดพเดฐเตเดฏเดฎเดพเดฃเต. เดจเดฟเด™เตเด™เดณเตเดŸเต† เด•เต‹เดกเดฟเตฝ เด…เดคเดฟเดจเตเดฑเต† เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเดฟเตฝ เด’เดจเตเดจเต เดตเต‡เดฃเดฎเต†เด™เตเด•เดฟเตฝ เดจเดฟเด™เตเด™เตพ เด’เดฐเต เดชเดพเด•เตเด•เต‡เดœเต เด‡เดฑเด•เตเด•เตเดฎเดคเดฟ เดšเต†เดฏเตเดฏเต‡เดฃเตเดŸเดคเดฟเดฒเตเดฒ, เดŽเดจเตเดจเดพเตฝ เดชเดพเด•เตเด•เต‡เดœเดฟเดจเตเดฑเต† เดชเต‡เดฐเตเด‚ เดซเด‚เด—เตโ€Œเดทเดจเตเดฑเต† เดชเต‡เดฐเตเด‚ เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เดฟ เด…เดคเดฟเดจเต† เดตเดฟเดณเดฟเด•เตเด•เตเด•. R เดฒเต† เดชเดพเด•เตเด•เต‡เดœเดฟเดจเตเด‚ เดซเด‚เด—เตโ€Œเดทเตป เดจเดพเดฎเด™เตเด™เตพเด•เตเด•เตเด‚ เด‡เดŸเดฏเดฟเดฒเตเดณเตเดณ เดธเต†เดชเตเดชเดฑเต‡เดฑเตเดฑเตผ เด’เดฐเต เด‡เดฐเดŸเตเดŸ เด•เต‹เดณเดจเดพเดฃเต. package_name::function_name().

เดชเตˆเดคเตเดคเดฃเดฟเตฝ, เดจเต‡เดฐเต†เดฎเดฑเดฟเดšเตเดšเต, เด’เดฐเต เดชเดพเด•เตเด•เต‡เดœเดฟเดจเตเดฑเต† เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเต† เด…เดคเดฟเดจเตเดฑเต† เดชเต‡เดฐเต เดตเตเดฏเด•เตเดคเดฎเดพเดฏเดฟ เดชเดฑเดžเตเดžเตเด•เตŠเดฃเตเดŸเต เดตเดฟเดณเดฟเด•เตเด•เตเดจเตเดจเดคเต เด•เตเดฒเดพเดธเดฟเด•เต เด†เดฏเดฟ เด•เดฃเด•เตเด•เดพเด•เตเด•เดชเตเดชเต†เดŸเตเดจเตเดจเต. เด’เดฐเต เดชเดพเด•เตเด•เต‡เดœเต เดกเต—เตบเดฒเต‹เดกเต เดšเต†เดฏเตเดฏเตเดฎเตเดชเต‹เตพ, เด…เดคเต เดธเดพเดงเดพเดฐเดฃเดฏเดพเดฏเดฟ เดšเตเดฐเตเด•เตเด•เดฟเดฏ เด’เดฐเต เดชเต‡เดฐเต เดจเตฝเด•เตเด‚, เด‰เดฆเดพ. pandas เดธเดพเดงเดพเดฐเดฃเดฏเดพเดฏเดฟ เด’เดฐเต เด“เดฎเดจเดชเตเดชเต‡เดฐเดพเดฃเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเต pd. เด’เดฐเต เดชเดพเด•เตเด•เต‡เดœเต เดซเด‚เด—เตโ€Œเดทเตป เด’เดฐเต เดกเต‹เดŸเตเดŸเดฟเดฒเต‚เดŸเต† เด†เด•เตโ€Œเดธเดธเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต package_name.function_name().

เด…เดธเตˆเตปเดฎเต†เดจเตเดฑเต

R-เตฝ, เด’เดฐเต เดตเดธเตเดคเตเดตเดฟเดจเต เด’เดฐเต เดฎเต‚เดฒเตเดฏเด‚ เดจเตฝเด•เตเดจเตเดจเดคเดฟเดจเต เด’เดฐเต เด…เดฎเตเดชเดŸเดฏเดพเดณเด‚ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเต เดธเดพเดงเดพเดฐเดฃเดฎเดพเดฃเต. obj_name <- value, เด’เดฐเต เดธเดฟเด‚เด—เดฟเตพ เดˆเด•เตเดตเตฝเดธเต เดธเตˆเตป เด…เดจเตเดตเดฆเดจเต€เดฏเดฎเดพเดฃเต†เด™เตเด•เดฟเดฒเตเด‚, เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเตเด•เตพ เดซเด‚เด—เตโ€Œเดทเตป เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเดพเดฏเดฟ เดฎเต‚เดฒเตเดฏเด™เตเด™เตพ เด•เตˆเดฎเดพเดฑเตเดจเตเดจเดคเดฟเดจเต R-เดฒเต† เดธเดฟเด‚เด—เดฟเตพ เดˆเด•เตเดตเตฝเดธเต เดธเตˆเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต.

เดชเตˆเดคเตเดคเดฃเดฟเตฝ, เด…เดธเตˆเตปเดฎเต†เดจเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเต เด’เดฐเตŠเดฑเตเดฑ เดคเตเดฒเตเดฏ เดšเดฟเดนเตเดจเด‚ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเดพเดฃเต obj_name = value.

เด‡เตปเดกเต†เด•เตเดธเดฟเด‚เด—เต

เด‡เดตเดฟเดŸเต†เดฏเตเด‚ เด•เดพเดฐเตเดฏเดฎเดพเดฏ เดตเตเดฏเดคเตเดฏเดพเดธเด™เตเด™เดณเตเดฃเตเดŸเต. R-เตฝ, เด‡เตปเดกเด•เตโ€Œเดธเดฟเด‚เด—เต เด’เดจเตเดจเดฟเตฝ เด†เดฐเด‚เดญเดฟเด•เตเด•เตเดจเตเดจเต, เดซเดฒเดฎเดพเดฏเตเดฃเตเดŸเดพเด•เตเดจเตเดจ เดถเตเดฐเต‡เดฃเดฟเดฏเดฟเดฒเต† เดŽเดฒเตเดฒเดพ เดจเดฟเตผเดฆเตเดฆเดฟเดทเตเดŸ เด˜เดŸเด•เด™เตเด™เดณเตเด‚ เด‰เตพเดชเตเดชเต†เดŸเตเดจเตเดจเต,

เดชเตˆเดคเตเดคเดฃเดฟเตฝ, เด‡เตปเดกเด•เตโ€Œเดธเดฟเด‚เด—เต เดชเต‚เดœเตเดฏเดคเตเดคเดฟเตฝ เดจเดฟเดจเตเดจเดพเดฃเต เด†เดฐเด‚เดญเดฟเด•เตเด•เตเดจเตเดจเดคเต, เดคเดฟเดฐเดžเตเดžเต†เดŸเตเดคเตเดค เดถเตเดฐเต‡เดฃเดฟเดฏเดฟเตฝ เดธเต‚เดšเดฟเด•เดฏเดฟเตฝ เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เดฟเดฏ เด…เดตเดธเดพเดจ เด˜เดŸเด•เด‚ เด‰เตพเดชเตเดชเต†เดŸเตเดจเตเดจเดฟเดฒเตเดฒ. เด…เดคเดฟเดจเดพเตฝ เดกเดฟเดธเตˆเตป เดšเต†เดฏเตเดฏเตเด• x[i:j] เดชเตˆเดคเตเดคเดฃเดฟเตฝ j เด˜เดŸเด•เด‚ เด‰เตพเดชเตเดชเต†เดŸเดฟเดฒเตเดฒ.

R เดจเตŠเดŸเตเดŸเต‡เดทเดจเดฟเตฝ เดจเต†เด—เดฑเตเดฑเต€เดตเต เด‡เตปเดกเด•เตโ€Œเดธเดฟเด‚เด—เดฟเดฒเตเด‚ เดตเตเดฏเดคเตเดฏเดพเดธเด™เตเด™เดณเตเดฃเตเดŸเต x[-1] เด…เดตเดธเดพเดจเดคเตเดคเต‡เดคเต เด’เดดเดฟเด•เต† เดตเต†เด•เตเดฑเตเดฑเดฑเดฟเดจเตเดฑเต† เดŽเดฒเตเดฒเดพ เด˜เดŸเด•เด™เตเด™เดณเตเด‚ เดคเดฟเดฐเดฟเด•เต† เดจเตฝเด•เตเด‚. เดชเตˆเดคเตเดคเดฃเดฟเตฝ, เดธเดฎเดพเดจเดฎเดพเดฏ เด’เดฐเต เดจเตŠเดŸเตเดŸเต‡เดทเตป เด…เดตเดธเดพเดจเดคเตเดคเต† เด˜เดŸเด•เด‚ เดฎเดพเดคเตเดฐเด‚ เดจเตฝเด•เตเด‚.

เดฐเต€เดคเดฟเด•เดณเตเด‚ OOP

R เด…เดคเดฟเดจเตเดฑเต‡เดคเดพเดฏ เดฐเต€เดคเดฟเดฏเดฟเตฝ OOP เดจเดŸเดชเตเดชเดฟเดฒเดพเด•เตเด•เตเดจเตเดจเต, เดžเดพเตป เด‡เดคเดฟเดจเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเต เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ เดŽเดดเตเดคเดฟ "R เดญเดพเดทเดฏเดฟเตฝ OOP (เดญเดพเด—เด‚ 1): S3 เด•เตเดฒเดพเดธเตเด•เตพ". เดชเตŠเดคเตเดตเต‡, R เด’เดฐเต เดซเด™เตเดทเดฃเตฝ เดญเดพเดทเดฏเดพเดฃเต, เด…เดคเดฟเดฒเต† เดŽเดฒเตเดฒเดพเด‚ เดซเด‚เด—เตเดทเดจเตเด•เดณเดฟเตฝ เดจเดฟเตผเดฎเตเดฎเดฟเดšเตเดšเดคเดพเดฃเต. เด…เดคเดฟเดจเดพเตฝ, เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต, Excel เด‰เดชเดฏเต‹เด•เตเดคเดพเด•เตเด•เตพเด•เตเด•เดพเดฏเดฟ, เดชเต‹เด•เตเด• tydiverse เด…เดคเดฟเดจเต†เด•เตเด•เดพเตพ เดŽเดณเตเดชเตเดชเดฎเดพเดฏเดฟเดฐเดฟเด•เตเด•เตเด‚ pandas. เด‡เดคเต เดŽเดจเตเดฑเต† เด†เดคเตเดฎเดจเดฟเดทเตเด เดฎเดพเดฏ เด…เดญเดฟเดชเตเดฐเดพเดฏเดฎเดพเดฃเต†เด™เตเด•เดฟเดฒเตเด‚.

เดšเตเดฐเตเด•เตเด•เดคเตเดคเดฟเตฝ, R เดฒเต† เด’เดฌเตโ€Œเดœเด•เตเดฑเตเดฑเตเด•เตพเด•เตเด•เต เดฐเต€เดคเดฟเด•เตพ เด‡เดฒเตเดฒ (เดจเดฎเตเดฎเตพ S3 เด•เตเดฒเดพเดธเตเด•เดณเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเต เดธเด‚เดธเดพเดฐเดฟเด•เตเด•เตเด•เดฏเดพเดฃเต†เด™เตเด•เดฟเตฝ, เดŽเดจเตเดจเดพเตฝ เดฎเดฑเตเดฑเต OOP เดจเดŸเดชเตเดชเดฟเดฒเดพเด•เตเด•เดฒเตเด•เตพ เดตเดณเดฐเต† เด•เตเดฑเดตเดพเดฃเต). เด’เดฌเตเดœเด•เตเดฑเตเดฑเดฟเดจเตเดฑเต† เด•เตเดฒเดพเดธเดฟเดจเต† เด†เดถเตเดฐเดฏเดฟเดšเตเดšเต เด…เดตเดฏเต† เดตเตเดฏเดคเตเดฏเดธเตเดคเดฎเดพเดฏเดฟ เดชเตเดฐเต‹เดธเดธเตเดธเต เดšเต†เดฏเตเดฏเตเดจเตเดจ เดธเดพเดฎเดพเดจเตเดฏเดตเตฝเด•เตเด•เดฐเดฟเดšเตเดš เดซเด‚เด—เตเดทเดจเตเด•เตพ เดฎเดพเดคเตเดฐเดฎเต‡เดฏเตเดณเตเดณเต‚.

เดชเตˆเดชเตเดชเต เดฒเตˆเดจเตเด•เตพ

เด’เดฐเตเดชเด•เตเดทเต‡ เด‡เดคเต เด…เดคเดฟเดจเตเดฑเต† เดชเต‡เดฐเดพเดฏเดฟเดฐเดฟเด•เตเด•เดพเด‚ pandas เด‡เดคเต เดชเต‚เตผเดฃเตเดฃเดฎเดพเดฏเตเด‚ เดถเดฐเดฟเดฏเดพเด•เดฟเดฒเตเดฒ, เดชเด•เตเดทเต‡ เดžเดพเตป เด…เตผเดคเตเดฅเด‚ เดตเดฟเดถเดฆเต€เด•เดฐเดฟเด•เตเด•เดพเตป เดถเตเดฐเดฎเดฟเด•เตเด•เตเด‚.

เด‡เดจเตเดฑเตผเดฎเต€เดกเดฟเดฏเดฑเตเดฑเต เด•เดฃเด•เตเด•เตเด•เต‚เดŸเตเดŸเดฒเตเด•เตพ เดธเด‚เดฐเด•เตเดทเดฟเด•เตเด•เดพเดคเดฟเดฐเดฟเด•เตเด•เดพเดจเตเด‚ เดœเต‹เดฒเดฟ เดšเต†เดฏเตเดฏเตเดจเตเดจ เด…เดจเตเดคเดฐเต€เด•เตเดทเดคเตเดคเดฟเตฝ เด…เดจเดพเดตเดถเตเดฏ เดตเดธเตเดคเตเด•เตเด•เตพ เดจเดฟเตผเดฎเตเดฎเดฟเด•เตเด•เดพเดคเดฟเดฐเดฟเด•เตเด•เดพเดจเตเด‚, เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด’เดฐเตเดคเดฐเด‚ เดชเตˆเดชเตเดชเตเดฒเตˆเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเด‚. เด†. เด’เดฐเต เดซเด‚เด—เตเดทเดจเดฟเตฝ เดจเดฟเดจเตเดจเต เด…เดŸเตเดคเตเดคเดคเดฟเดฒเต‡เด•เตเด•เต เด’เดฐเต เด•เดฃเด•เตเด•เตเด•เต‚เดŸเตเดŸเดฒเดฟเดจเตเดฑเต† เดซเดฒเด‚ เด•เตˆเดฎเดพเดฑเตเด•, เด•เต‚เดŸเดพเดคเต† เด‡เดจเตเดฑเตผเดฎเต€เดกเดฟเดฏเดฑเตเดฑเต เดซเดฒเด™เตเด™เตพ เดธเด‚เดฐเด•เตเดทเดฟเด•เตเด•เดฐเตเดคเต.

เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เด•เต‹เดกเต เด‰เดฆเดพเดนเดฐเดฃเด‚ เดŽเดŸเตเด•เตเด•เดพเด‚, เด…เดคเดฟเตฝ เดžเด™เตเด™เตพ เด‡เดจเตเดฑเตผเดฎเต€เดกเดฟเดฏเดฑเตเดฑเต เด•เดฃเด•เตเด•เตเด•เต‚เดŸเตเดŸเดฒเตเด•เตพ เดชเตเดฐเดคเตเดฏเต‡เด• เด’เดฌเตโ€Œเดœเด•เตเดฑเตเดฑเตเด•เดณเดฟเตฝ เดธเด‚เดญเดฐเดฟเด•เตเด•เตเดจเตเดจเต:

temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )

เดžเด™เตเด™เตพ เดคเตเดŸเตผเดšเตเดšเดฏเดพเดฏเดฟ 3 เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เดจเดŸเดคเตเดคเดฟ, เด“เดฐเต‹เดจเตเดจเดฟเดจเตเดฑเต†เดฏเตเด‚ เดซเดฒเด‚ เด’เดฐเต เดชเตเดฐเดคเตเดฏเต‡เด• เด’เดฌเตเดœเด•เตเดฑเตเดฑเดฟเตฝ เดธเด‚เดฐเด•เตเดทเดฟเดšเตเดšเต. เดŽเดจเตเดจเดพเตฝ เดตเดพเดธเตเดคเดตเดคเตเดคเดฟเตฝ, เดจเดฎเตเด•เตเด•เต เดˆ เด‡เดจเตเดฑเตผเดฎเต€เดกเดฟเดฏเดฑเตเดฑเต เด’เดฌเตเดœเด•เตเดฑเตเดฑเตเด•เตพ เด†เดตเดถเตเดฏเดฎเดฟเดฒเตเดฒ.

เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด…เดคเดฟเดฒเตเด‚ เดฎเต‹เดถเดฎเดพเดฃเต, เดŽเดจเตเดจเดพเตฝ Excel เด‰เดชเดฏเต‹เด•เตเดคเดพเด•เตเด•เตพเด•เตเด•เต เด•เต‚เดŸเตเดคเตฝ เดชเดฐเดฟเดšเดฟเดคเดฎเดพเดฃเต.

obj  <- func3(func2(func1()))

เดˆ เดธเดพเดนเดšเดฐเตเดฏเดคเตเดคเดฟเตฝ, เดžเด™เตเด™เตพ เด‡เดจเตเดฑเตผเดฎเต€เดกเดฟเดฏเดฑเตเดฑเต เด•เดฃเด•เตเด•เตเด•เต‚เดŸเตเดŸเตฝ เดซเดฒเด™เตเด™เตพ เดธเด‚เดฐเด•เตเดทเดฟเดšเตเดšเดฟเดฒเตเดฒ, เดชเด•เตเดทเต‡ เดจเต†เดธเตเดฑเตเดฑเดกเต เดซเด‚เด—เตเดทเดจเตเด•เดณเตเดณเตเดณ เด•เต‹เดกเต เดตเดพเดฏเดฟเด•เตเด•เตเดจเตเดจเดคเต เดตเดณเดฐเต† เด…เดธเต—เด•เดฐเตเดฏเดฎเดพเดฃเต.

R-เตฝ เดกเดพเดฑเตเดฑ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เดฟเดจเตเดณเตเดณ เดจเดฟเดฐเดตเดงเดฟ เดธเดฎเต€เดชเดจเด™เตเด™เตพ เดžเด™เตเด™เตพ เดชเดฐเดฟเดถเต‹เดงเดฟเด•เตเด•เตเด‚, เด…เดต เดตเตเดฏเดคเตเดฏเดธเตเดค เดฐเต€เดคเดฟเด•เดณเดฟเตฝ เดธเดฎเดพเดจ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เดจเดŸเดคเตเดคเตเดจเตเดจเต.

เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเดฟเดฒเต† เดชเตˆเดชเตเดชเต เดฒเตˆเดจเตเด•เตพ tidyverse เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเตผ เดจเดŸเดชเตเดชเดฟเดฒเดพเด•เตเด•เดฟเดฏเดคเต %>%.

obj <- func1() %>% 
            func2() %>%
            func3()

เด…เด™เตเด™เดจเต† เดžเด™เตเด™เตพ เดœเต‹เดฒเดฟเดฏเตเดŸเต† เดซเดฒเด‚ เดŽเดŸเตเด•เตเด•เตเดจเตเดจเต func1() เดŽเดจเตเดจเดคเดฟเดฒเต‡เด•เตเด•เตเดณเตเดณ เด†เดฆเตเดฏ เดตเดพเดฆเดฎเดพเดฏเดฟ เด…เดคเต เดชเดพเดธเดพเด•เตเด•เตเด• func2(), เด…เดชเตเดชเต‹เตพ เดˆ เด•เดฃเด•เตเด•เตเด•เต‚เดŸเตเดŸเดฒเดฟเดจเตเดฑเต† เดซเดฒเด‚ เด†เดฆเตเดฏ เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเดพเดฏเดฟ เดžเด™เตเด™เตพ เด•เตˆเดฎเดพเดฑเตเดจเตเดจเต func3(). เด…เดตเดธเดพเดจเด‚, เด’เดฌเตโ€Œเดœเด•เตเดฑเตเดฑเดฟเดฒเต‡เด•เตเด•เต เดจเดŸเดคเตเดคเดฟเดฏ เดŽเดฒเตเดฒเดพ เด•เดฃเด•เตเด•เตเด•เต‚เดŸเตเดŸเดฒเตเด•เดณเตเด‚ เดžเด™เตเด™เตพ เดŽเดดเตเดคเตเดจเตเดจเต obj <-.

เดฎเต‡เตฝเดชเตเดชเดฑเดžเตเดžเดตเดฏเต†เดฒเตเดฒเดพเด‚ เดˆ เดฎเต†เดฎเตเดฎเดฟเดฒเต‚เดŸเต† เดตเดพเด•เตเด•เตเด•เดณเต‡เด•เตเด•เดพเตพ เดจเดจเตเดจเดพเดฏเดฟ เดšเดฟเดคเตเดฐเต€เด•เดฐเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต:
เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

ะ’ data.table เดšเด™เตเด™เดฒเด•เตพ เดธเดฎเดพเดจเดฎเดพเดฏ เดฐเต€เดคเดฟเดฏเดฟเตฝ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต.

newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]

เด“เดฐเต‹ เดธเตเด•เตเดตเดฏเตผ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเดฒเตเด‚ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดฎเตเดฎเตเดชเดคเตเดคเต† เดชเตเดฐเดตเตผเดคเตเดคเดจเดคเตเดคเดฟเดจเตเดฑเต† เดซเดฒเด‚ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเด‚.

ะ’ pandas เด…เดคเตเดคเดฐเด‚ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เด’เดฐเต เดกเต‹เดŸเตเดŸเต เด•เตŠเดฃเตเดŸเต เดตเต‡เตผเดคเดฟเดฐเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต.

obj = df.fun1().fun2().fun3()

เด†. เดžเด™เตเด™เตพ เดžเด™เตเด™เดณเตเดŸเต† เดฎเต‡เดถ เดŽเดŸเตเด•เตเด•เตเดจเตเดจเต df เด…เดตเดณเตเดŸเต† เดฐเต€เดคเดฟ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด• fun1(), เดคเตเดŸเตผเดจเตเดจเต เดฒเดญเดฟเดšเตเดš เดซเดฒเดคเตเดคเดฟเดฒเต‡เด•เตเด•เต เดžเด™เตเด™เตพ เดฐเต€เดคเดฟ เดชเตเดฐเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต fun2()เดถเต‡เดทเด‚ fun3(). เดคเดคเตเดซเดฒเดฎเดพเดฏเตเดฃเตเดŸเดพเด•เตเดจเตเดจ เดซเดฒเด‚ เด’เดฐเต เดตเดธเตเดคเตเดตเดพเดฏเดฟ เดธเด‚เดฐเด•เตเดทเดฟเด•เตเด•เดชเตเดชเต†เดŸเตเดจเตเดจเต เด’เดฌเตเดœเด•เตเดฑเตเดฑเต .

เดกเดพเดฑเตเดฑ เด˜เดŸเดจเด•เตพ

R, Python เดŽเดจเตเดจเดฟเดตเดฏเดฟเดฒเต† เดกเดพเดฑเตเดฑเดพ เด˜เดŸเดจเด•เตพ เดธเดฎเดพเดจเดฎเดพเดฃเต, เดŽเดจเตเดจเดพเตฝ เดตเตเดฏเดคเตเดฏเดธเตเดค เดชเต‡เดฐเตเด•เดณเตเดฃเตเดŸเต.

เดตเดฟเดตเดฐเดฃเด‚
R เดฒเต† เดถเต€เตผเดทเด•เด‚
เดชเตˆเดคเตเดคเตบ/เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดชเต‡เดฐเต

เดชเดŸเตเดŸเดฟเด• เด˜เดŸเดจ
data.frame, data.table, tibble
เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเด‚

เดฎเต‚เดฒเตเดฏเด™เตเด™เดณเตเดŸเต† เดเด•เดฎเดพเดจ เดฒเดฟเดธเตเดฑเตเดฑเต
เดตเต†เด•เตเดฑเตเดฑเตผ
เดชเดพเดฃเตเดŸเด•เดณเดฟเดฒเต† เดธเต€เดฐเต€เดธเต เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดถเตเดฆเตเดงเดฎเดพเดฏ เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดฒเดฟเดธเตเดฑเตเดฑเต

เดฎเตพเดŸเตเดŸเดฟ-เดฒเต†เดตเตฝ เดจเต‹เตบ-เดŸเต‡เดฌเดฟเตพ เด˜เดŸเดจ
เดฒเดฟเดธเตเดฑเตเดฑเต
เดจเดฟเด˜เดฃเตเดŸเต (เดกเดฟเด•เตโ€Œเดฑเตเดฑเต)

เดตเดพเด•เตเดฏเด˜เดŸเดจเดฏเดฟเดฒเต† เดฎเดฑเตเดฑเต เดšเดฟเดฒ เดธเดตเดฟเดถเต‡เดทเดคเด•เดณเตเด‚ เดตเตเดฏเดคเตเดฏเดพเดธเด™เตเด™เดณเตเด‚ เดžเด™เตเด™เตพ เดšเตเดตเดŸเต† เดชเดฐเดฟเดถเต‹เดงเดฟเด•เตเด•เตเด‚.

เดžเด™เตเด™เตพ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเต เด•เตเดฑเดšเตเดšเต เดตเดพเด•เตเด•เตเด•เตพ

เด†เดฆเตเดฏเด‚, เดˆ เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดชเดฐเดฟเดšเดฟเดคเดฎเดพเด•เตเดจเตเดจ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเต เดžเดพเตป เดจเดฟเด™เตเด™เดณเต‹เดŸเต เด•เตเดฑเดšเตเดšเต เดชเดฑเดฏเตเด‚.

เดตเตƒเดคเตเดคเดฟเดฏเตเดณเตเดณ

เด”เดฆเตเดฏเต‹เด—เดฟเด• เดตเต†เดฌเตเดธเตˆเดฑเตเดฑเต: tidyverse.org
เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต
เดฒเตˆเดฌเตเดฐเดฑเดฟ tidyverse RStudio-เดฏเดฟเดฒเต† เดธเต€เดจเดฟเดฏเตผ เดฑเดฟเดธเตผเดšเตเดšเต เดธเดฏเดจเตเดฑเดฟเดธเตเดฑเตเดฑเต เดนเต†เดกเตโ€Œเดฒเดฟ เดตเดฟเด•เตเด•เดพเด‚ เดŽเดดเตเดคเดฟเดฏเดคเต. tidyverse เดกเดพเดฑเตเดฑเดพ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เต เดฒเดณเดฟเดคเดฎเดพเด•เตเด•เตเดจเตเดจ เด†เด•เตผเดทเด•เดฎเดพเดฏ เด’เดฐเต เด•เต‚เดŸเตเดŸเด‚ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‰เตพเด•เตเด•เตŠเดณเตเดณเตเดจเตเดจเต, เด…เดตเดฏเดฟเตฝ 5 เดŽเดฃเตเดฃเด‚ CRAN เดฑเดฟเดชเตเดชเต‹เดธเดฟเดฑเตเดฑเดฑเดฟเดฏเดฟเตฝ เดจเดฟเดจเตเดจเตเดณเตเดณ เดฎเดฟเด•เดšเตเดš 10 เดกเต—เตบเดฒเต‹เดกเตเด•เดณเดฟเตฝ เด‰เตพเดชเตเดชเต†เดŸเตเดคเตเดคเดฟเดฏเดฟเดŸเตเดŸเตเดฃเตเดŸเต.

เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเตเดŸเต† เด•เดพเดคเตฝ เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‰เตพเด•เตเด•เตŠเดณเตเดณเตเดจเตเดจเต: ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats. เดˆ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด“เดฐเต‹เดจเตเดจเตเด‚ เด’เดฐเต เดชเตเดฐเดคเตเดฏเต‡เด• เดชเตเดฐเดถเตเดจเด‚ เดชเดฐเดฟเดนเดฐเดฟเด•เตเด•เดพเตป เดฒเด•เตเดทเตเดฏเดฎเดฟเดŸเตเดจเตเดจเต. เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต dplyr เดกเดพเดฑเตเดฑ เด•เตƒเดคเตเดฐเดฟเดฎเดคเตเดตเดคเตเดคเดฟเดจเดพเดฏเดฟ เดธเตƒเดทเตเดŸเดฟเดšเตเดšเดคเต, tidyr เดกเดพเดฑเตเดฑ เด’เดฐเต เดตเตƒเดคเตเดคเดฟเดฏเตเดณเตเดณ เดฐเต‚เดชเดคเตเดคเดฟเดฒเต‡เด•เตเด•เต เด•เตŠเดฃเตเดŸเตเดตเดฐเดพเตป, stringr เดธเตเดŸเตเดฐเดฟเด‚เด—เตเด•เตพ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เตเดจเตเดจเดคเต เดฒเดณเดฟเดคเดฎเดพเด•เตเด•เตเดจเตเดจเต, เด•เต‚เดŸเดพเดคเต† ggplot2 เดเดฑเตเดฑเดตเตเด‚ เดœเดจเดชเตเดฐเดฟเดฏเดฎเดพเดฏ เดกเดพเดฑเตเดฑ เดตเดฟเดทเตเดตเดฒเตˆเดธเต‡เดทเตป เดŸเต‚เดณเตเด•เดณเดฟเตฝ เด’เดจเตเดจเดพเดฃเต.

เดจเต‡เดŸเตเดŸเด‚ tidyverse เดฒเดณเดฟเดคเดตเตเด‚ เดตเดพเดฏเดฟเด•เตเด•เดพเตป เดŽเดณเตเดชเตเดชเดฎเตเดณเตเดณเดคเตเดฎเดพเดฏ เดตเดพเด•เตเดฏเด˜เดŸเดจเดฏเดพเดฃเต, เด‡เดคเต SQL เด…เดจเตเดตเต‡เดทเดฃ เดญเดพเดทเดฏเตเด•เตเด•เต เดธเดฎเดพเดจเดฎเดพเดฃเต.

เดกเดพเดฑเตเดฑ. เดชเดŸเตเดŸเดฟเด•

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเตเด”เดฆเตเดฏเต‹เด—เดฟเด• เดตเต†เดฌเตเดธเตˆเดฑเตเดฑเต: r-datatable.com

เดŽเดดเตเดคเดฟเดฏเดคเต data.table H2O.ai เดฏเตเดŸเต† เดฎเดพเดฑเตเดฑเต เดกเต‹เตพ เด†เดฃเต.

2006เดฒเดพเดฃเต เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเตเดŸเต† เด†เดฆเตเดฏ เดชเตเดฐเด•เดพเดถเดจเด‚ เดจเดŸเดจเตเดจเดคเต.

เดชเดพเด•เตเด•เต‡เดœเต เดธเดฟเดจเตเดฑเดพเด•เตเดธเต เด‰เดณเตเดณเดคเตเดชเต‹เดฒเต† เดธเต—เด•เดฐเตเดฏเดชเตเดฐเดฆเดฎเดฒเตเดฒ tidyverse เด•เต‚เดŸเดพเดคเต† R เดฒเต† เด•เตเดฒเดพเดธเดฟเด•เต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเตเด•เดณเต† เด•เต‚เดŸเตเดคเตฝ เด…เดจเตเดธเตเดฎเดฐเดฟเดชเตเดชเดฟเด•เตเด•เตเดจเตเดจเต, เดŽเดจเตเดจเดพเตฝ เด…เดคเต‡ เดธเดฎเดฏเด‚ เดชเตเดฐเดตเตผเดคเตเดคเดจเด•เตเดทเดฎเดคเดฏเดฟเตฝ เด—เดฃเตเดฏเดฎเดพเดฏเดฟ เดตเดฟเด•เดธเดฟเดšเตเดšเต.

เดˆ เดชเดพเด•เตเด•เต‡เดœเดฟเดฒเต† เดชเดŸเตเดŸเดฟเด•เดฏเดฟเดฒเตเดณเตเดณ เดŽเดฒเตเดฒเดพ เด•เตƒเดคเตเดฐเดฟเดฎเดคเตเดตเด™เตเด™เดณเตเด‚ เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เดตเดฟเดตเดฐเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต, เดจเดฟเด™เตเด™เตพ เดตเดพเด•เตเดฏเด˜เดŸเดจ เดตเดฟเดตเตผเดคเตเดคเดจเด‚ เดšเต†เดฏเตเดฏเตเด•เดฏเดพเดฃเต†เด™เตเด•เดฟเตฝ data.table SQL-เตฝ, เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด‡เดคเตเดชเต‹เดฒเตŠเดจเตเดจเต เดฒเดญเดฟเด•เตเด•เตเด‚: data.table[ WHERE, SELECT, GROUP BY ]

เดตเดฒเดฟเดฏ เด…เดณเดตเดฟเดฒเตเดณเตเดณ เดกเดพเดฑเตเดฑ เดชเตเดฐเต‹เดธเดธเตเดธเต เดšเต†เดฏเตเดฏเตเดจเตเดจ เดตเต‡เด—เดคเดฏเดพเดฃเต เดˆ เดชเดพเด•เตเด•เต‡เดœเดฟเดจเตเดฑเต† เดถเด•เตเดคเดฟ.

เดชเดพเดฃเตเดŸเด•เตพ

เด”เดฆเตเดฏเต‹เด—เดฟเด• เดตเต†เดฌเตเดธเตˆเดฑเตเดฑเต: pandas.pydata.org เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

"เดชเดพเดจเตฝ เดกเดพเดฑเตเดฑ" เดŽเดจเตเดจ เด‡เด•เตเด•เดฃเต‹เดฎเต†เดŸเตเดฐเดฟเด•เต เดชเดฆเดคเตเดคเดฟเตฝ เดจเดฟเดจเตเดจเดพเดฃเต เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเตเดŸเต† เดชเต‡เดฐเต เดตเดจเตเดจเดคเต, เด‡เดคเต เดฎเตพเดŸเตเดŸเดฟ-เดกเตˆเดฎเตปเดทเดฃเตฝ เด˜เดŸเดจเดพเดชเดฐเดฎเดพเดฏ เดตเดฟเดตเดฐเด™เตเด™เตพ เดตเดฟเดตเดฐเดฟเด•เตเด•เดพเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต.

เดŽเดดเตเดคเดฟเดฏเดคเต pandas เด…เดฎเต‡เดฐเดฟเด•เตเด•เตป เดตเต†เดธเต เดฎเด•เตเด•เดฟเดจเตเดจเดฟ เด†เดฃเต.

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดกเดพเดฑเตเดฑ เดตเดฟเดถเด•เดฒเดจเด‚ เดตเดฐเตเดฎเตเดชเต‹เตพ, เดคเตเดฒเตเดฏเดฎเดพเดฃเต pandas เด‡เดฒเตเดฒ. เดเดคเต เด‰เดฑเดตเดฟเดŸเด™เตเด™เดณเดฟเตฝ เดจเดฟเดจเตเดจเตเด‚ เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเดคเต เดฎเตเดคเตฝ เดฆเตƒเดถเตเดฏเดตเตฝเด•เตเด•เดฐเดฟเด•เตเด•เตเดจเตเดจเดคเต เดตเดฐเต† เดกเดพเดฑเตเดฑ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดเดคเต เด•เตƒเดคเตเดฐเดฟเดฎเดคเตเดตเดตเตเด‚ เดจเดŸเดคเตเดคเดพเตป เดจเดฟเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเดจเตเดจ เดตเดณเดฐเต† เดฎเตพเดŸเตเดŸเดฟเดซเด™เตเดทเดฃเตฝ, เด‰เดฏเตผเดจเตเดจ เดคเดฒเดคเตเดคเดฟเดฒเตเดณเตเดณ เดชเดพเด•เตเด•เต‡เดœเต.

เด…เดงเดฟเด• เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดˆ เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ เดšเตผเดšเตเดš เดšเต†เดฏเตเดคเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด…เดŸเดฟเดธเตเดฅเดพเดจ R, Python เดตเดฟเดคเดฐเดฃเด™เตเด™เดณเดฟเตฝ เด‰เตพเดชเตเดชเต†เดŸเตเดคเตเดคเดฟเดฏเดฟเดŸเตเดŸเดฟเดฒเตเดฒ. เด’เดฐเต เดšเต†เดฑเดฟเดฏ เดฎเตเดจเตเดจเดฑเดฟเดฏเดฟเดชเตเดชเต เด‰เดฃเตเดŸเต†เด™เตเด•เดฟเดฒเตเด‚, เดจเดฟเด™เตเด™เตพ เด…เดจเด•เตเด•เต‹เดฃเตเดŸ เดกเดฟเดธเตเดŸเตเดฐเดฟเดฌเตเดฏเต‚เดทเตป เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดคเดฟเดŸเตเดŸเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ, เด…เดงเดฟเด•เดฎเดพเดฏเดฟ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเตเด• pandas เด†เดตเดถเตเดฏเดฎเดฟเดฒเตเดฒ.

R-เตฝ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดจเดฟเด™เตเด™เตพ เด’เดฐเดฟเด•เตเด•เดฒเต†เด™เตเด•เดฟเดฒเตเด‚ RStudio เดกเดตเดฒเดชเตโ€Œเดฎเต†เดจเตเดฑเต เดŽเตปเดตเดฏเต‹เตบเดฎเต†เดจเตเดฑเต เดคเตเดฑเดจเตเดจเดฟเดŸเตเดŸเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ, R-เตฝ เด†เดตเดถเตเดฏเดฎเดพเดฏ เดชเดพเด•เตเด•เต‡เดœเต เดŽเด™เตเด™เดจเต† เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเดฃเดฎเต†เดจเตเดจเต เดจเดฟเด™เตเด™เตพเด•เตเด•เดฑเดฟเดฏเดพเด‚. เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเดพเตป, เดธเตเดฑเตเดฑเดพเตปเดกเต‡เตผเดกเต เด•เดฎเดพเตปเดกเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด•. install.packages() R-เตฝ เดคเดจเตเดจเต† เดจเต‡เดฐเดฟเดŸเตเดŸเต เดชเตเดฐเดตเตผเดคเตเดคเดฟเดชเตเดชเดฟเด•เตเด•เตเดจเตเดจเดคเดฟเดฒเต‚เดŸเต†.

# ัƒัั‚ะฐะฝะพะฒะบะฐ ะฟะฐะบะตั‚ะพะฒ
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")

เด‡เตปเดธเตเดฑเตเดฑเดพเดณเต‡เดทเดจเต เดถเต‡เดทเด‚, เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เดฌเดจเตเดงเดฟเดชเตเดชเดฟเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต, เดฎเดฟเด•เตเด• เด•เต‡เดธเตเด•เดณเดฟเดฒเตเด‚ เด•เดฎเดพเตปเดกเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต library().

# ะฟะพะดะบะปัŽั‡ะตะฝะธะต ะธะปะธ ะธะผะฟะพั€ั‚ ะฟะฐะบะตั‚ะพะฒ ะฒ ั€ะฐะฑะพั‡ะตะต ะพะบั€ัƒะถะตะฝะธะต
library(vroom)
library(readr)
library(dplyr)
library(data.table)

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เด…เดคเดฟเดจเดพเตฝ, เดจเดฟเด™เตเด™เตพ เดถเตเดฆเตเดงเดฎเดพเดฏ เดชเตˆเดคเตเดคเตบ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดคเดฟเดŸเตเดŸเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ, เดชเดฟเดจเตเดจเต† pandas เดจเดฟเด™เตเด™เตพ เด‡เดคเต เดธเตเดตเดฎเต‡เดงเดฏเดพ เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดฏเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต. เดจเดฟเด™เตเด™เดณเตเดŸเต† เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเดฟเด‚เด—เต เดธเดฟเดธเตเดฑเตเดฑเดคเตเดคเต† เด†เดถเตเดฐเดฏเดฟเดšเตเดšเต เด’เดฐเต เด•เดฎเดพเตปเดกเต เดฒเตˆเตป เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดŸเต†เตผเดฎเดฟเดจเตฝ เดคเตเดฑเดจเตเดจเต เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เด•เดฎเดพเตปเดกเต เดจเตฝเด•เตเด•.

pip install pandas

เดคเตเดŸเตผเดจเตเดจเต เดจเดฎเตเดฎเตพ เดชเตˆเดคเตเดคเดฃเดฟเดฒเต‡เด•เตเด•เต เดฎเดŸเด™เตเด™เตเด•เดฏเตเด‚ เด•เดฎเดพเตปเดกเต เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด‡เตปเดธเตเดฑเตเดฑเดพเตพ เดšเต†เดฏเตเดค เดชเดพเด•เตเด•เต‡เดœเต เด‡เดฑเด•เตเด•เตเดฎเดคเดฟ เดšเต†เดฏเตเดฏเตเด•เดฏเตเด‚ เดšเต†เดฏเตเดฏเตเดจเตเดจเต import.

import pandas as pd

เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดกเดพเดฑเตเดฑเดพ เดตเดฟเดถเด•เดฒเดจเดคเตเดคเดฟเดฒเต† เดเดฑเตเดฑเดตเตเด‚ เดชเตเดฐเดงเดพเดจเดชเตเดชเต†เดŸเตเดŸ เด˜เดŸเตเดŸเด™เตเด™เดณเดฟเดฒเตŠเดจเตเดจเดพเดฃเต เดกเดพเดฑเตเดฑ เดฎเตˆเดจเดฟเด‚เด—เต. Python เด‰เด‚ R เด‰เด‚, เด†เดตเดถเตเดฏเดฎเต†เด™เตเด•เดฟเตฝ, เดเดคเต เด‰เดฑเดตเดฟเดŸเด™เตเด™เดณเดฟเตฝ เดจเดฟเดจเตเดจเตเด‚ เดกเดพเดฑเตเดฑ เดจเต‡เดŸเตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดตเดฟเดชเตเดฒเดฎเดพเดฏ เด…เดตเดธเดฐเด™เตเด™เตพ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดจเตฝเด•เตเดจเตเดจเต: เดชเตเดฐเดพเดฆเต‡เดถเดฟเด• เดซเดฏเดฒเตเด•เตพ, เด‡เดจเตเดฑเตผเดจเต†เดฑเตเดฑเดฟเตฝ เดจเดฟเดจเตเดจเตเดณเตเดณ เดซเดฏเดฒเตเด•เตพ, เดตเต†เดฌเตเดธเตˆเดฑเตเดฑเตเด•เตพ, เดŽเดฒเตเดฒเดพเดคเตเดคเดฐเด‚ เดกเดพเดฑเตเดฑเดพเดฌเต‡เดธเตเด•เดณเตเด‚.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดฒเต‡เด–เดจเดคเตเดคเดฟเดฒเตเดŸเดจเต€เดณเด‚ เดžเด™เตเด™เตพ เดจเดฟเดฐเดตเดงเดฟ เดกเดพเดฑเตเดฑเดพเดธเต†เดฑเตเดฑเตเด•เตพ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด‚:

  1. Google Analytics-เตฝ เดจเดฟเดจเตเดจเต เดฐเดฃเตเดŸเต เดกเต—เตบเดฒเต‹เดกเตเด•เตพ.
  2. เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต เดชเดพเดธเดžเตเดšเตผ เดกเดพเดฑเตเดฑเดพเดธเต†เดฑเตเดฑเต.

เดŽเดฒเตเดฒเดพ เดกเดพเดฑเตเดฑเดฏเตเด‚ เดŽเดจเตเดฑเต† เดชเด•เตเด•เดฒเตเดฃเตเดŸเต เดธเดพเดฎเต‚เดนเดฟเด•เด‚ csv, tsv เดซเดฏเดฒเตเด•เดณเตเดŸเต† เดฐเต‚เดชเดคเตเดคเดฟเตฝ. เดžเด™เตเด™เตพ เด…เดตเดฐเต‹เดŸเต เดŽเดตเดฟเดŸเต† เดจเดฟเดจเตเดจเต เด…เดญเตเดฏเตผเดคเตเดฅเดฟเด•เตเด•เตเด‚?

R-เดฒเต‡เด•เตเด•เต เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต: เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเต, เดตเตเดฑเต‚เด‚, เดฑเต€เดกเตผ

เด’เดฐเต เดฒเตˆเดฌเตเดฐเดฑเดฟเดฏเดฟเดฒเต‡เด•เตเด•เต เดกเดพเดฑเตเดฑ เดฒเต‹เดกเต เดšเต†เดฏเตเดฏเดพเตป tidyverse เดฐเดฃเตเดŸเต เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด‰เดฃเตเดŸเต: vroom, readr. vroom เด•เต‚เดŸเตเดคเตฝ เด†เดงเตเดจเดฟเด•เดฎเดพเดฃเต, เดŽเดจเตเดจเดพเตฝ เดญเดพเดตเดฟเดฏเดฟเตฝ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เดธเด‚เดฏเต‹เดœเดฟเดชเตเดชเดฟเดšเตเดšเต‡เด•เตเด•เดพเด‚.

เด‰เดฆเตเดงเดฐเดฃเดฟ เด”เดฆเตเดฏเต‹เด—เดฟเด• เดกเต‹เด•เตเดฏเตเดฎเต†เดจเตเดฑเต‡เดทเตป vroom.

vroom vs เดฑเต€เดกเตผ
เดŽเดจเตเดคเดพเดฃเต เดฑเดฟเดฒเต€เดธเต เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเต vroom เด…เตผเดคเตเดฅเดฎเดพเด•เตเด•เตเดจเตเดจเดคเต readr? เด‡เดชเตเดชเต‹เตพ เดฐเดฃเตเดŸเต เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเตเด‚ เดตเต†เดตเตเดตเต‡เดฑเต† เดตเดฟเด•เดธเดฟเดชเตเดชเดฟเด•เตเด•เดพเตป เดžเด™เตเด™เตพ เดชเดฆเตเดงเดคเดฟเดฏเดฟเดŸเตเดจเตเดจเต, เดŽเดจเตเดจเดพเตฝ เดญเดพเดตเดฟเดฏเดฟเตฝ เดžเด™เตเด™เตพ เดชเดพเด•เตเด•เต‡เดœเตเด•เตพ เด’เดจเตเดจเดฟเดชเตเดชเดฟเด•เตเด•เตเด‚. Vroom-เดจเตเดฑเต† เด…เดฒเดธเดฎเดพเดฏ เดตเดพเดฏเดจเดฏเตเดŸเต† เด’เดฐเต เดชเต‹เดฐเดพเดฏเตเดฎ, เดšเดฟเดฒ เดกเดพเดฑเตเดฑเดพ เดชเตเดฐเดถเตโ€Œเดจเด™เตเด™เตพ เดฎเตเตปเด•เต‚เดŸเตเดŸเดฟ เดฑเดฟเดชเตเดชเต‹เตผเดŸเตเดŸเต เดšเต†เดฏเตเดฏเดพเตป เด•เดดเดฟเดฏเดฟเดฒเตเดฒ เดŽเดจเตเดจเดคเดพเดฃเต, เด…เดคเดฟเดจเดพเตฝ เด…เดตเดฏเต† เดŽเด™เตเด™เดจเต† เดเด•เต€เด•เดฐเดฟเด•เตเด•เดพเด‚ เดŽเดจเตเดจเดคเดฟเดจเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเต เด•เตเดฑเดšเตเดšเต เดšเดฟเดจเตเดคเดฟเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต.

vroom vs เดฑเต€เดกเตผ
เดฑเดฟเดฒเต€เดธเต เดŽเดจเตเดคเดพเดฃเต เด…เตผเดคเตเดฅเดฎเดพเด•เตเด•เตเดจเตเดจเดคเต? vroom เดตเต‡เดฃเตเดŸเดฟ readr? เด‡เดชเตเดชเต‹เตพ เดฐเดฃเตเดŸเต เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเตเด‚ เดตเต†เดตเตเดตเต‡เดฑเต† เดตเดฟเด•เดธเดฟเดชเตเดชเดฟเด•เตเด•เดพเตป เดžเด™เตเด™เตพ เดชเดฆเตเดงเดคเดฟเดฏเดฟเดŸเตเดจเตเดจเต, เดชเด•เตเดทเต‡ เดญเดพเดตเดฟเดฏเดฟเตฝ เดžเด™เตเด™เตพ เด…เดต เดธเด‚เดฏเต‹เดœเดฟเดชเตเดชเดฟเดšเตเดšเต‡เด•เตเด•เดพเด‚. เด…เดฒเดธเดฎเดพเดฏ เดตเดพเดฏเดจเดฏเตเดŸเต† เดชเต‹เดฐเดพเดฏเตเดฎเด•เดณเดฟเตฝ เด’เดจเตเดจเต vroom เดšเดฟเดฒ เดกเดพเดฑเตเดฑ เดชเตเดฐเดถเตเดจเด™เตเด™เตพ เดฎเตเตปเด•เต‚เดŸเตเดŸเดฟ เดฑเดฟเดชเตเดชเต‹เตผเดŸเตเดŸเต เดšเต†เดฏเตเดฏเดพเตป เด•เดดเดฟเดฏเดฟเดฒเตเดฒ, เด…เดคเดฟเดจเดพเตฝ เด…เดต เดŽเด™เตเด™เดจเต† เดฎเดฟเด•เดšเตเดš เดฐเต€เดคเดฟเดฏเดฟเตฝ เดธเด‚เดฏเต‹เดœเดฟเดชเตเดชเดฟเด•เตเด•เดพเดฎเต†เดจเตเดจเต เดจเดฟเด™เตเด™เตพ เดšเดฟเดจเตเดคเดฟเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต.

เดˆ เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ เดžเด™เตเด™เตพ เดฐเดฃเตเดŸเต เดกเดพเดฑเตเดฑ เดฒเต‹เดกเดฟเด‚เด—เต เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเตเด‚ เดจเต‹เด•เตเด•เตเด‚:

R: vroom เดชเดพเด•เตเด•เต‡เดœเดฟเดฒเต‡เด•เตเด•เต เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต

# install.packages("vroom")
library(vroom)

# ะงั‚ะตะฝะธะต ะดะฐะฝะฝั‹ั…
## vroom
ga_nov  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

R: เดฑเต€เดกเดฑเดฟเดฒเต‡เด•เตเด•เต เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต

# install.packages("readr")
library(readr)

# ะงั‚ะตะฝะธะต ะดะฐะฝะฝั‹ั…
## readr
ga_nov  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

เดชเดพเด•เตเด•เต‡เดœเดฟเตฝ vroom, csv / tsv เดกเดพเดฑเตเดฑ เดซเต‹เตผเดฎเดพเดฑเตเดฑเต เดชเดฐเดฟเด—เดฃเดฟเด•เตเด•เดพเดคเต† เดคเดจเตเดจเต†, เด…เดคเต‡ เดชเต‡เดฐเดฟเดจเตเดฑเต† เดชเตเดฐเดตเตผเดคเตเดคเดจเดคเตเดคเดฟเดฒเต‚เดŸเต†เดฏเดพเดฃเต เดฒเต‹เดกเต เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเต vroom(), เดชเดพเด•เตเด•เต‡เดœเดฟเตฝ readr เด“เดฐเต‹ เดซเต‹เตผเดฎเดพเดฑเตเดฑเดฟเดจเตเด‚ เดžเด™เตเด™เตพ เดตเตเดฏเดคเตเดฏเดธเตเดค เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต read_tsv() ะธ read_csv().

R-เดฒเต‡เด•เตเด•เต เดกเดพเดฑเตเดฑ เดฒเต‹เดกเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต: data.table

ะ’ data.table เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต เด’เดฐเต เดซเด‚เด—เตเดทเตป เด‰เดฃเตเดŸเต fread().

R-เดฒเต‡เด•เตเด•เต เดกเดพเดฑเตเดฑ เดฒเต‹เดกเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต: data.table เดชเดพเด•เตเด•เต‡เดœเต

# install.packages("data.table")
library(data.table)

## data.table
ga_nov  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต: เดชเดพเดฃเตเดŸเด•เตพ

เดจเดฎเตเดฎเตพ R เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเตเดฎเดพเดฏเดฟ เดคเดพเดฐเดคเดฎเตเดฏเด‚ เดšเต†เดฏเตเดคเดพเตฝ, เดˆ เดธเดพเดนเดšเดฐเตเดฏเดคเตเดคเดฟเตฝ เดตเดพเด•เตเดฏเด˜เดŸเดจ เดเดฑเตเดฑเดตเตเด‚ เด…เดŸเตเดคเตเดคเดพเดฃเต pandas เด†เดฏเดฟเดฐเดฟเด•เตเด•เตเด‚ readr, เด•เดพเดฐเดฃเด‚ pandas เดŽเดตเดฟเดŸเต†เดจเดฟเดจเตเดจเตเด‚ เดกเดพเดฑเตเดฑ เด…เดญเตเดฏเตผเดคเตเดฅเดฟเด•เตเด•เดพเตป เด•เดดเดฟเดฏเตเด‚, เด•เต‚เดŸเดพเดคเต† เดˆ เดชเดพเด•เตเด•เต‡เดœเดฟเตฝ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเตเดŸเต† เด’เดฐเต เด•เตเดŸเตเด‚เดฌเด‚ เดฎเตเดดเตเดตเดจเตเด‚ เด‰เดฃเตเดŸเต read_*().

  • read_csv()
  • read_excel()
  • read_sql()
  • read_json()
  • read_html()

เดตเดฟเดตเดฟเดง เดซเต‹เตผเดฎเดพเดฑเตเดฑเตเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเตเดณเตเดณ เดกเดพเดฑเตเดฑ เดตเดพเดฏเดฟเด•เตเด•เดพเตป เดฐเต‚เดชเด•เตฝเดชเตเดชเดจ เดšเต†เดฏเตเดคเดฟเดŸเตเดŸเตเดณเตเดณ เดฎเดฑเตเดฑเต เดจเดฟเดฐเดตเดงเดฟ เดซเด‚เด—เตเดทเดจเตเด•เดณเตเด‚. เดŽเดจเตเดจเดพเตฝ เดžเด™เตเด™เดณเตเดŸเต† เด†เดตเดถเตเดฏเด™เตเด™เตพเด•เตเด•เต เด‡เดคเต เดฎเดคเดฟเดฏเดพเด•เตเด‚ read_table() เด…เดฅเดตเดพ read_csv() เดตเดพเดฆเด‚ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดธเต†เดชเตเดฑเตเดฑเด‚เดฌเตผ เด•เต‹เดณเด‚ เดธเต†เดชเตเดชเดฑเต‡เดฑเตเดฑเตผ เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เดพเตป.

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต: เดชเดพเดฃเตเดŸเด•เตพ

import pandas as pd

ga_nov  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")

เดกเดพเดฑเตเดฑ เดซเตเดฐเต†เดฏเดฟเดฎเตเด•เตพ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต

เดฎเต‡เดถ เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต, เดžเด™เตเด™เตพ เดฒเต‹เดกเต เดšเต†เดฏเตเดค, เด’เดฐเต เดซเต€เตฝเดกเต เด‰เดฃเตเดŸเต เดธเต†เด•เตเดธเต, เด‡เดคเต เดฏเดพเดคเตเดฐเด•เตเด•เดพเดฐเดจเตเดฑเต† เดฒเดฟเด‚เด— เดเดกเดจเตเดฑเดฟเดซเดฏเตผ เดธเด‚เดญเดฐเดฟเด•เตเด•เตเดจเตเดจเต.

เดŽเดจเตเดจเดพเตฝ เดฏเดพเดคเตเดฐเด•เตเด•เดพเดฐเตเดŸเต† เดฒเดฟเด‚เด—เดญเต‡เดฆเด‚ เด…เดจเตเดธเดฐเดฟเดšเตเดšเต เดกเดพเดฑเตเดฑเดฏเตเดŸเต† เด•เต‚เดŸเตเดคเตฝ เดธเต—เด•เดฐเตเดฏเดชเตเดฐเดฆเดฎเดพเดฏ เด…เดตเดคเดฐเดฃเดคเตเดคเดฟเดจเต, เดจเดฟเด™เตเด™เตพ เดฒเดฟเด‚เด— เด•เต‹เดกเดฟเดจเต‡เด•เตเด•เดพเตพ เดชเต‡เดฐเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดฃเด‚.

เด‡เดคเต เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต, เดžเด™เตเด™เตพ เด’เดฐเต เดšเต†เดฑเดฟเดฏ เดกเดฏเดฑเด•เตเดŸเดฑเดฟ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเด‚, เด…เดคเดฟเตฝ เดฏเดฅเดพเด•เตเดฐเดฎเด‚ 2 เดจเดฟเดฐเด•เดณเตเด‚ (เด•เต‹เดกเตเด‚ เดฒเดฟเด‚เด— เดจเดพเดฎเดตเตเด‚) 2 เดตเดฐเดฟเด•เดณเตเด‚ เดฎเดพเดคเตเดฐเดฎเตเดณเตเดณ เด’เดฐเต เดชเดŸเตเดŸเดฟเด•.

R: tidyverse, dplyr-เตฝ เด’เดฐเต เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต

เดšเตเดตเดŸเต†เดฏเตเดณเตเดณ เด•เต‹เดกเต เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเตฝ, เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดžเด™เตเด™เตพ เด†เดตเดถเตเดฏเดฎเตเดณเตเดณ เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเด‚ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต tibble() .

R: dplyr-เตฝ เด’เดฐเต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเด‚ เด‰เดฃเตเดŸเดพเด•เตเด•เตเดจเตเดจเต

## dplyr
### ัะพะทะดะฐั‘ะผ ัะฟั€ะฐะฒะพั‡ะฝะธะบ
gender <- tibble(id = c(1, 2),
                 gender = c("female", "male"))

R-เตฝ เด’เดฐเต เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต: data.table

R-เตฝ เด’เดฐเต เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต: data.table

## data.table
### ัะพะทะดะฐั‘ะผ ัะฟั€ะฐะฒะพั‡ะฝะธะบ
gender <- data.table(id = c(1, 2),
                    gender = c("female", "male"))

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เด’เดฐเต เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต: เดชเดพเดฃเตเดŸเด•เตพ

ะ’ pandas เดซเตเดฐเต†เดฏเดฟเดฎเตเด•เดณเตเดŸเต† เดจเดฟเตผเดฎเตเดฎเดพเดฃเด‚ เดชเดฒ เด˜เดŸเตเดŸเด™เตเด™เดณเดฟเดฒเดพเดฏเดพเดฃเต เดจเดŸเดคเตเดคเตเดจเตเดจเดคเต, เด†เดฆเตเดฏเด‚ เดžเด™เตเด™เตพ เด’เดฐเต เดจเดฟเด˜เดฃเตเดŸเต เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต, เดคเตเดŸเตผเดจเตเดจเต เดžเด™เตเด™เตพ เดจเดฟเด˜เดฃเตเดŸเตเดตเดฟเดจเต† เด’เดฐเต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเดพเด•เตเด•เดฟ เดฎเดพเดฑเตเดฑเตเดจเตเดจเต.

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เด’เดฐเต เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต: เดชเดพเดฃเตเดŸเด•เตพ

# ัะพะทะดะฐั‘ะผ ะดะฐั‚ะฐ ั„ั€ะตะนะผ
gender_dict = {'id': [1, 2],
               'gender': ["female", "male"]}
# ะฟั€ะตะพะฑั€ะฐะทัƒะตะผ ัะปะพะฒะฐั€ัŒ ะฒ ะดะฐั‚ะฐั„ั€ะตะนะผ
gender = pd.DataFrame.from_dict(gender_dict)

เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต

เดจเดฟเด™เตเด™เตพ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เตเดจเตเดจ เดŸเต‡เดฌเดฟเดณเตเด•เดณเดฟเตฝ เดกเดธเตป เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดจเต‚เดฑเตเด•เดฃเด•เตเด•เดฟเดจเต เด•เต‹เดณเด™เตเด™เตพ เดกเดพเดฑเตเดฑ เด…เดŸเด™เตเด™เดฟเดฏเดฟเดฐเดฟเด•เตเด•เดพเด‚. เดŽเดจเตเดจเดพเตฝ เดตเดฟเดถเด•เดฒเดจเด‚ เดจเดŸเดคเตเดคเดพเตป, เด’เดฐเต เดšเดŸเตเดŸเด‚ เดชเต‹เดฒเต†, เด‰เดฑเดตเดฟเดŸ เดชเดŸเตเดŸเดฟเด•เดฏเดฟเตฝ เดฒเดญเตเดฏเดฎเดพเดฏ เดŽเดฒเตเดฒเดพ เดจเดฟเดฐเด•เดณเตเด‚ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด†เดตเดถเตเดฏเดฎเดฟเดฒเตเดฒ.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เด…เดคเดฟเดจเดพเตฝ, เดธเต‹เดดเตโ€Œเดธเต เดŸเต‡เดฌเดฟเตพ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดจเดฟเด™เตเด™เตพ เดšเต†เดฏเตเดฏเตเดจเตเดจ เด†เดฆเตเดฏ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเดฟเดฒเตŠเดจเตเดจเต เด…เดจเดพเดตเดถเตเดฏเดฎเดพเดฏ เดตเดฟเดตเดฐเด™เตเด™เตพ เดฎเดพเดฏเตโ€Œเด•เตเด•เตเด•เดฏเตเด‚ เดˆ เดตเดฟเดตเดฐเด™เตเด™เตพ เด‰เตพเด•เตเด•เตŠเดณเตเดณเตเดจเตเดจ เดฎเต†เดฎเตเดฎเดฑเดฟ เดธเตเดตเดคเดจเตเดคเตเดฐเดฎเดพเด•เตเด•เตเด•เดฏเตเด‚ เดšเต†เดฏเตเดฏเตเด• เดŽเดจเตเดจเดคเดพเดฃเต.

R เดฒเต† เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต: tidyverse, dplyr

เดตเดพเด•เตเดฏเด˜เดŸเดจ dplyr SQL เด…เดจเตเดตเต‡เดทเดฃ เดญเดพเดทเดฏเตเดฎเดพเดฏเดฟ เดตเดณเดฐเต† เดธเดพเดฎเตเดฏเดฎเตเดณเตเดณเดคเดพเดฃเต, เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด‡เดคเต เดชเดฐเดฟเดšเดฟเดคเดฎเดพเดฃเต†เด™เตเด•เดฟเตฝ, เดˆ เดชเดพเด•เตเด•เต‡เดœเต เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดตเต‡เด—เดคเตเดคเดฟเตฝ เดฎเดพเดธเตเดฑเตเดฑเตผ เดšเต†เดฏเตเดฏเตเด‚.

เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเดคเดฟเดจเต, เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด• select().

เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เดฐเต€เดคเดฟเด•เดณเดฟเตฝ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด•เต‹เดณเด™เตเด™เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เดพเตป เด•เดดเดฟเดฏเตเดจเตเดจ เด•เต‹เดกเดฟเดจเตเดฑเต† เด‰เดฆเดพเดนเดฐเดฃเด™เตเด™เตพ เดšเตเดตเดŸเต†เดฏเตเดฃเตเดŸเต:

  • เด†เดตเดถเตเดฏเดฎเดพเดฏ เดจเดฟเดฐเด•เดณเตเดŸเต† เดชเต‡เดฐเตเด•เตพ เดฒเดฟเดธเตเดฑเตเดฑเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต
  • เดธเดพเดงเดพเดฐเดฃ เดชเดฆเดชเตเดฐเดฏเต‹เด—เด™เตเด™เตพ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดจเดฟเดฐเดฏเตเดŸเต† เดชเต‡เดฐเตเด•เตพ เด•เดพเดฃเตเด•
  • เดกเดพเดฑเตเดฑ เดคเดฐเด‚ เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด•เต‹เดณเดคเตเดคเดฟเตฝ เด…เดŸเด™เตเด™เดฟเดฏเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจ เดกเดพเดฑเตเดฑเดฏเตเดŸเต† เดฎเดฑเตเดฑเต‡เดคเต†เด™เตเด•เดฟเดฒเตเด‚ เดชเตเดฐเต‹เดชเตเดชเตผเดŸเตเดŸเดฟ เดชเตเดฐเด•เดพเดฐเด‚

R: dplyr-เตฝ เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต

# ะ’ั‹ะฑะพั€ ะฝัƒะถะฝั‹ั… ัั‚ะพะปะฑั†ะพะฒ
## dplyr
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
select(ga_nov, date, source, sessions)
### ะธัะบะปัŽั‡ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
select(ga_nov, -medium, -bounces)
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ, ัั‚ะพะฑั†ั‹ ะธะผะตะฝะฐ ะบะพั‚ะพั€ั‹ั… ะทะฐะบะฐะฝั‡ะธะฒะฐัŽั‚ัั ะฝะฐ s
select(ga_nov, matches("s$"))
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ัƒัะปะพะฒะธัŽ, ะฒั‹ะฑะธั€ะฐะตะผ ั‚ะพะปัŒะบะพ ั†ะตะปะพั‡ะธัะปะตะฝะฝั‹ะต ัั‚ะพะปะฑั†ั‹
select_if(ga_nov, is.integer)

R เดฒเต† เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต: data.table

เด‡เดคเต‡ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ data.table เด•เตเดฑเดšเตเดšเต เดตเตเดฏเดคเตเดฏเดธเตเดคเดฎเดพเดฏเดฟ เดจเดŸเดชเตเดชเดฟเดฒเดพเด•เตเด•เตเดจเตเดจเต, เดฒเต‡เด–เดจเดคเตเดคเดฟเดจเตเดฑเต† เดคเตเดŸเด•เตเด•เดคเตเดคเดฟเตฝ เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เตพเด•เตเด•เตเดณเตเดณเดฟเดฒเต† เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเตเด•เตพ เดŽเดจเตเดคเดพเดฃเต†เดจเตเดจเต เดžเดพเตป เด’เดฐเต เดตเดฟเดตเดฐเดฃเด‚ เดจเตฝเด•เดฟ data.table.

DT[i,j,by]

เดŽเดตเดฟเดŸเต†เดฏเดพเดฃเต:
เดžเดพเตป - เดŽเดตเดฟเดŸเต†, เด…เดคเดพเดฏเดคเต. เดตเดฐเดฟเด•เตพ เดตเดดเดฟ เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต
j - เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเด•|เด…เดชเตเดกเต‡เดฑเตเดฑเต|เดšเต†เดฏเตเดฏเตเด•, เด…เดคเดพเดฏเดคเต. เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเดคเตเดคเต เด…เดตเดฏเต† เดชเดฐเดฟเดตเตผเดคเตเดคเดจเด‚ เดšเต†เดฏเตเดฏเตเดจเตเดจเต
เดชเตเดฐเด•เดพเดฐเด‚ - เดกเดพเดฑเตเดฑ เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เต

R เดฒเต† เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต: data.table

## data.table
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
ga_nov[ , .(date, source, sessions) ]
### ะธัะบะปัŽั‡ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ
ga_nov[, .SD, .SDcols = patterns("s$")]

เดตเต‡เดฐเดฟเดฏเดฌเดฟเตพ .SD เดŽเดฒเตเดฒเดพ เด•เต‹เดณเด™เตเด™เดณเตเด‚ เด†เด•เตเดธเดธเต เดšเต†เดฏเตเดฏเดพเตป เดจเดฟเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเดจเตเดจเต, เด•เต‚เดŸเดพเดคเต† .SDcols เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด†เดตเดถเตเดฏเดฎเตเดณเตเดณ เดจเดฟเดฐเด•เดณเตเดŸเต† เดชเต‡เดฐเตเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต เดฑเต†เด—เตเดฒเตผ เดŽเด•เตเดธเตเดชเตเดฐเดทเดจเตเด•เตพ เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดฎเดฑเตเดฑเต เดซเด‚เด—เตเดทเดจเตเด•เตพ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด†เดตเดถเตเดฏเดฎเดพเดฏ เดจเดฟเดฐเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเด•.

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต, เดชเดพเดฃเตเดŸเด•เตพ

เดชเต‡เดฐเต เดชเตเดฐเด•เดพเดฐเด‚ เด•เต‹เดณเด™เตเด™เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เดพเตป pandas เด…เดตเดฐเตเดŸเต† เดชเต‡เดฐเตเด•เดณเตเดŸเต† เด’เดฐเต เดฒเดฟเดธเตเดฑเตเดฑเต เดจเตฝเด•เดฟเดฏเดพเตฝ เดฎเดคเดฟเดฏเดพเด•เตเด‚. เดธเดพเดงเดพเดฐเดฃ เดŽเด•เตโ€Œเดธเตโ€Œเดชเตเดฐเดทเดจเตเด•เตพ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด•เต‹เดณเด™เตเด™เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เดพเดจเต‹ เด’เดดเดฟเดตเดพเด•เตเด•เดพเดจเต‹, เดจเดฟเด™เตเด™เตพ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต drop() ะธ filter(), เดตเดพเดฆเด‚ เด…เด•เตเดทเด‚ = 1, เดจเดฟเดฐเด•เดณเต‡เด•เตเด•เดพเตพ เดจเดฟเดฐเด•เตพ เดชเตเดฐเต‹เดธเดธเตเดธเต เดšเต†เดฏเตเดฏเต‡เดฃเตเดŸเดคเต เด†เดตเดถเตเดฏเดฎเดพเดฃเต†เดจเตเดจเต เดจเดฟเด™เตเด™เตพ เดธเต‚เดšเดฟเดชเตเดชเดฟเด•เตเด•เตเดจเตเดจเต.

เดกเดพเดฑเตเดฑ เดคเดฐเด‚ เด…เดจเตเดธเดฐเดฟเดšเตเดšเต เด’เดฐเต เดซเต€เตฝเดกเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เดพเตป, เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด• select_dtypes(), เด’เดชเตเดชเด‚ เดตเดพเดฆเดชเตเดฐเดคเดฟเดตเดพเดฆเด™เตเด™เดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เด‰เตพเดชเตเดชเต†เดŸเตเดจเตเดจเต เด…เดฅเดตเดพ เดชเต†เดŸเตเดคเตเดคเดฟเดฏเดฟเดŸเตเดŸเดฟเดฒเตเดฒ เดจเดฟเด™เตเด™เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸ เดซเต€เตฝเดกเตเด•เดณเตเดฎเดพเดฏเดฟ เดฌเดจเตเดงเดชเตเดชเต†เดŸเตเดŸ เดกเดพเดฑเตเดฑ เดคเดฐเด™เตเด™เดณเตเดŸเต† เด’เดฐเต เดฒเดฟเดธเตเดฑเตเดฑเต เด•เตˆเดฎเดพเดฑเตเด•.

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต: เดชเดพเดฃเตเดŸเด•เตพ

# ะ’ั‹ะฑะพั€ ะฟะพะปะตะน ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ
ga_nov[['date', 'source', 'sessions']]
# ะ˜ัะบะปัŽั‡ะธั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ
ga_nov.drop(['medium', 'bounces'], axis=1)
# ะ’ั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ
ga_nov.filter(regex="s$", axis=1)
# ะ’ั‹ะฑั€ะฐั‚ัŒ ั‡ะธัะปะพะฒั‹ะต ะฟะพะปั
ga_nov.select_dtypes(include=['number'])
# ะ’ั‹ะฑั€ะฐั‚ัŒ ั‚ะตะบัั‚ะพะฒั‹ะต ะฟะพะปั
ga_nov.select_dtypes(include=['object'])

เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต เดตเดฐเดฟเด•เตพ

เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต, เด‰เดฑเดตเดฟเดŸ เดชเดŸเตเดŸเดฟเด•เดฏเดฟเตฝ เดจเดฟเดฐเดตเดงเดฟ เดตเตผเดทเดคเตเดคเต† เดกเดพเดฑเตเดฑ เด…เดŸเด™เตเด™เดฟเดฏเดฟเดฐเดฟเด•เตเด•เดพเด‚, เดŽเดจเตเดจเดพเตฝ เดจเดฟเด™เตเด™เตพ เด•เดดเดฟเดžเตเดž เดฎเดพเดธเด‚ เดฎเดพเดคเตเดฐเด‚ เดตเดฟเดถเด•เดฒเดจเด‚ เดšเต†เดฏเตเดฏเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต. เดตเต€เดฃเตเดŸเตเด‚, เด…เดงเดฟเด• เดฒเตˆเดจเตเด•เตพ เดกเดพเดฑเตเดฑ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เต เดชเตเดฐเด•เตเดฐเดฟเดฏเดฏเต† เดฎเดจเตเดฆเด—เดคเดฟเดฏเดฟเดฒเดพเด•เตเด•เตเด•เดฏเตเด‚ เดชเดฟเดธเดฟ เดฎเต†เดฎเตเดฎเดฑเดฟ เดคเดŸเดธเตเดธเดชเตเดชเต†เดŸเตเดคเตเดคเตเด•เดฏเตเด‚ เดšเต†เดฏเตเดฏเตเด‚.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

R-เตฝ เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเต: tydyverse, dplyr

ะ’ dplyr เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเดพเตป เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต filter(). เด‡เดคเต เด†เดฆเตเดฏเดคเตเดคเต† เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเดพเดฏเดฟ เด’เดฐเต เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เดŽเดŸเตเด•เตเด•เตเดจเตเดจเต, เดคเตเดŸเตผเดจเตเดจเต เดจเดฟเด™เตเด™เตพ เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต เดตเตเดฏเดตเดธเตเดฅเด•เตพ เดฒเดฟเดธเตเดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต.

เด’เดฐเต เดชเดŸเตเดŸเดฟเด• เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต เดฒเต‹เดœเดฟเด•เตเด•เตฝ เดŽเด•เตเดธเตเดชเตเดฐเดทเดจเตเด•เตพ เดŽเดดเตเดคเตเดฎเตเดชเต‹เตพ, เดˆ เดธเดพเดนเดšเดฐเตเดฏเดคเตเดคเดฟเตฝ, เด‰เดฆเตเดงเดฐเดฃเดฟเด•เดณเดฟเดฒเตเดฒเดพเดคเต†เดฏเตเด‚ เดชเดŸเตเดŸเดฟเด•เดฏเตเดŸเต† เดชเต‡เดฐเต เดชเตเดฐเด–เตเดฏเดพเดชเดฟเด•เตเด•เดพเดคเต†เดฏเตเด‚ เดจเดฟเดฐเดฏเตเดŸเต† เดชเต‡เดฐเตเด•เตพ เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เตเด•.

เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต เด’เดจเตเดจเดฟเดฒเดงเดฟเด•เด‚ เดฒเต‹เดœเดฟเด•เตเด•เตฝ เดŽเด•เตเดธเตเดชเตเดฐเดทเดจเตเด•เตพ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดฎเตเดชเต‹เตพ, เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเตผเดฎเดพเดฐเต† เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด•:

  • & เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด•เต‹เดฎ - เดฒเต‹เดœเดฟเด•เตเด•เตฝ AND
  • | - เดฒเต‹เดœเดฟเด•เตเด•เตฝ เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ

R: dplyr-เตฝ เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเต

# ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ
## dplyr
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
filter(ga_nov, source == "google")
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
filter(ga_nov, source == "google" & sessions >= 10)
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
filter(ga_nov, source == "google" | sessions >= 10)

R-เตฝ เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเต: data.table

เดžเดพเตป เด‡เดคเดฟเดจเด•เด‚ เดฎเตเด•เดณเดฟเตฝ เดŽเดดเตเดคเดฟเดฏเดคเตเดชเต‹เดฒเต†, เด‡เตป data.table เดกเดพเดฑเตเดฑเดพ เดชเดฐเดฟเดตเตผเดคเตเดคเดจ เดตเดพเด•เตเดฏเด˜เดŸเดจ เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เด‰เตพเดชเตเดชเต†เดŸเตเดคเตเดคเดฟเดฏเดฟเดŸเตเดŸเตเดฃเตเดŸเต.

DT[i,j,by]

เดŽเดตเดฟเดŸเต†เดฏเดพเดฃเต:
เดžเดพเตป - เดŽเดตเดฟเดŸเต†, เด…เดคเดพเดฏเดคเต. เดตเดฐเดฟเด•เตพ เดตเดดเดฟ เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต
j - เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเด•|เด…เดชเตเดกเต‡เดฑเตเดฑเต|เดšเต†เดฏเตเดฏเตเด•, เด…เดคเดพเดฏเดคเต. เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเดคเตเดคเต เด…เดตเดฏเต† เดชเดฐเดฟเดตเตผเดคเตเดคเดจเด‚ เดšเต†เดฏเตเดฏเตเดจเตเดจเต
เดชเตเดฐเด•เดพเดฐเด‚ - เดกเดพเดฑเตเดฑ เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เต

เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเดพเตป เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต i, เดธเตเด•เตเดตเดฏเตผ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เด’เดจเตเดจเดพเด‚ เดธเตเดฅเดพเดจเดฎเตเดณเตเดณเดคเต.

เด‰เดฆเตเดงเดฐเดฃเดฟ เดšเดฟเดนเตเดจเด™เตเด™เตพ เด‡เดฒเตเดฒเดพเดคเต†เดฏเตเด‚ เดชเดŸเตเดŸเดฟเด•เดฏเตเดŸเต† เดชเต‡เดฐเต เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เดพเดคเต†เดฏเตเด‚ เดฒเต‹เดœเดฟเด•เตเด•เตฝ เดŽเด•เตเดธเตเดชเตเดฐเดทเดจเตเด•เดณเดฟเตฝ เดจเดฟเดฐเด•เตพ เด†เด•เตเดธเดธเต เดšเต†เดฏเตเดฏเดชเตเดชเต†เดŸเตเดจเตเดจเต.

เดฒเต‹เดœเดฟเด•เตเด•เตฝ เดŽเด•เตเดธเตเดชเตเดฐเดทเดจเตเด•เตพ เดชเดฐเดธเตเดชเดฐเด‚ เดฌเดจเตเดงเดชเตเดชเต†เดŸเตเดŸเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเดคเตเดชเต‹เดฒเต† เดคเดจเตเดจเต† dplyr เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเตผเดฎเดพเตผ เดตเดดเดฟ.

R-เตฝ เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเต: data.table

## data.table
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
ga_nov[source == "google"]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
ga_nov[source == "google" & sessions >= 10]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
ga_nov[source == "google" | sessions >= 10]

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดธเตเดŸเตเดฐเดฟเด‚เด—เตเด•เตพ เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต: เดชเดพเดฃเตเดŸเด•เตพ

เดตเดฐเดฟเด•เตพ เด…เดจเตเดธเดฐเดฟเดšเตเดšเต เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเด• pandas เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต เดธเดฎเดพเดจเดฎเดพเดฃเต data.table, เดธเตเด•เตเดตเดฏเตผ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เดšเต†เดฏเตเดฏเตเดจเตเดจเต.

เดˆ เดธเดพเดนเดšเดฐเตเดฏเดคเตเดคเดฟเตฝ, เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเดฟเดจเตเดฑเต† เดชเต‡เดฐเต เดธเต‚เดšเดฟเดชเตเดชเดฟเดšเตเดšเตเด•เตŠเดฃเตเดŸเต เดจเดฟเดฐเด•เดณเดฟเดฒเต‡เด•เตเด•เตเดณเตเดณ เดชเตเดฐเดตเต‡เดถเดจเด‚ เด…เดจเดฟเดตเดพเดฐเตเดฏเดฎเดพเดฃเต; เดคเตเดŸเตผเดจเตเดจเต เดจเดฟเดฐเดฏเตเดŸเต† เดชเต‡เดฐเต เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเดฒเต† เด‰เดฆเตเดงเดฐเดฃเดฟ เดšเดฟเดนเตเดจเด™เตเด™เดณเดฟเดฒเตเด‚ เดธเต‚เดšเดฟเดชเตเดชเดฟเด•เตเด•เดพเด‚ (เด‰เดฆเดพเดนเดฐเดฃเด‚ df['col_name']), เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด•เดพเดฒเดฏเดณเดตเดฟเดจเต เดถเต‡เดทเด‚ เด‰เดฆเตเดงเดฐเดฃเดฟเด•เตพ เด‡เดฒเตเดฒเดพเดคเต† (เด‰เดฆเดพเดนเดฐเดฃเด‚ df.col_name).

เดจเดฟเด™เตเด™เตพเด•เตเด•เต เด’เดฐเต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเด‚ เดจเดฟเดฐเดตเดงเดฟ เดตเตเดฏเดตเดธเตเดฅเด•เตพ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเดฃเดฎเต†เด™เตเด•เดฟเตฝ, เด“เดฐเต‹ เดตเตเดฏเดตเดธเตเดฅเดฏเตเด‚ เดชเดฐเดพเตปเดคเต€เดธเดฟเดธเดฟเตฝ เดธเตเดฅเดพเดชเดฟเด•เตเด•เดฃเด‚. เดฒเต‹เดœเดฟเด•เตเด•เตฝ เด…เดตเดธเตเดฅเด•เตพ เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเตผเดฎเดพเตผ เดชเดฐเดธเตเดชเดฐเด‚ เดฌเดจเตเดงเดฟเดชเตเดชเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต & ะธ |.

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดธเตเดŸเตเดฐเดฟเด‚เด—เตเด•เตพ เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต: เดชเดพเดฃเตเดŸเด•เตพ

# ะคะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ั‚ะฐะฑะปะธั†ั‹
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
ga_nov[ ga_nov['source'] == "google" ]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]

เดกเดพเดฑเตเดฑเดฏเตเดŸเต† เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเตเด‚

เดกเดพเดฑเตเดฑเดพ เดตเดฟเดถเด•เดฒเดจเดคเตเดคเดฟเตฝ เดเดฑเตเดฑเดตเตเด‚ เดธเดพเดงเดพเดฐเดฃเดฏเดพเดฏเดฟ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเดฟเดฒเตŠเดจเตเดจเต เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด…เด—เตเดฐเด—เต‡เดทเดจเตเดฎเดพเดฃเต.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดˆ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เดจเดŸเดคเตเดคเตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดตเดพเด•เตเดฏเด˜เดŸเดจ เดžเด™เตเด™เตพ เด…เดตเดฒเต‹เด•เดจเด‚ เดšเต†เดฏเตเดฏเตเดจเตเดจ เดŽเดฒเตเดฒเดพ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเดฟเดฒเตเด‚ เดšเดฟเดคเดฑเดฟเด•เตเด•เดฟเดŸเด•เตเด•เตเดจเตเดจเต.

เดˆ เดธเดพเดนเดšเดฐเตเดฏเดคเตเดคเดฟเตฝ, เดžเด™เตเด™เตพ เด’เดฐเต เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เด‰เดฆเดพเดนเดฐเดฃเดฎเดพเดฏเดฟ เดŽเดŸเตเด•เตเด•เตเด‚ เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต, เด•เตเดฏเดพเดฌเดฟเตป เด•เตเดฒเดพเดธเต เด…เดจเตเดธเดฐเดฟเดšเตเดšเต เดŸเดฟเด•เตเด•เดฑเตเดฑเตเด•เดณเตเดŸเต† เดŽเดฃเตเดฃเดตเตเด‚ เดถเดฐเดพเดถเดฐเดฟ เดตเดฟเดฒเดฏเตเด‚ เด•เดฃเด•เตเด•เดพเด•เตเด•เตเด•.

R: tidyverse, dplyr เดŽเดจเตเดจเดคเดฟเดฒเต† เดกเดพเดฑเตเดฑเดฏเตเดŸเต† เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเตเด‚

ะ’ dplyr เดซเด‚เด—เตเดทเตป เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เดฟเดจเดพเดฏเดฟ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต group_by(), เด’เดชเตเดชเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเดฟเดจเตเด‚ summarise(). เดธเดคเตเดฏเดคเตเดคเดฟเตฝ, dplyr เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเตเดŸเต† เด’เดฐเต เด•เตเดŸเตเด‚เดฌเด‚ เดฎเตเดดเตเดตเตป เด‰เดฃเตเดŸเต summarise_*(), เดŽเดจเตเดจเดพเตฝ เดˆ เดฒเต‡เด–เดจเดคเตเดคเดฟเดจเตเดฑเต† เด‰เดฆเตเดฆเต‡เดถเตเดฏเด‚ เด…เดŸเดฟเดธเตเดฅเดพเดจ เดตเดพเด•เตเดฏเด˜เดŸเดจ เดคเดพเดฐเดคเดฎเตเดฏเด‚ เดšเต†เดฏเตเดฏเตเด• เดŽเดจเตเดจเดคเดพเดฃเต, เด…เดคเดฟเดจเดพเตฝ เดžเด™เตเด™เตพ เด…เดคเตเดคเดฐเด‚ เด•เดพเดŸเตเดŸเดฟเดฒเต‡เด•เตเด•เต เดชเต‹เด•เดฟเดฒเตเดฒ.

เด…เดŸเดฟเดธเตเดฅเดพเดจ เด…เด—เตเดฐเด—เต‡เดทเตป เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ:

  • sum() - เดธเด‚เด—เตเดฐเดนเด‚
  • min() / max() - เดเดฑเตเดฑเดตเตเด‚ เด•เตเดฑเดžเตเดžเดคเตเด‚ เด•เต‚เดŸเดฟเดฏเดคเตเดฎเดพเดฏ เดฎเต‚เดฒเตเดฏเด‚
  • mean() - เดถเดฐเดพเดถเดฐเดฟ
  • median() - เด‡เดŸเดคเตเดคเดฐเด‚
  • length() - เด…เดณเดตเต

R: dplyr-เตฝ เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด…เด—เตเดฐเด—เต‡เดทเดจเตเด‚

## dplyr
### ะณั€ัƒะฟะฟะธั€ะพะฒะบะฐ ะธ ะฐะณั€ะตะณะฐั†ะธั ัั‚ั€ะพะบ
group_by(titanic, Pclass) %>%
  summarise(passangers = length(PassengerId),
            avg_price  = mean(Fare))

เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป group_by() เด†เดฆเตเดฏเดคเตเดคเต† เดตเดพเดฆเดฎเดพเดฏเดฟ เดžเด™เตเด™เตพ เดฎเต‡เดถ เด•เดŸเดจเตเดจเต เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต, เดคเตเดŸเตผเดจเตเดจเต เดซเต€เตฝเดกเต เดธเต‚เดšเดฟเดชเตเดชเดฟเดšเตเดšเต เดชเดฟ เด•เตเดฒเดพเดธเต, เด…เดคเดฟเดฒเต‚เดŸเต† เดžเด™เตเด™เตพ เดžเด™เตเด™เดณเตเดŸเต† เดŸเต‡เดฌเดฟเตพ เด—เตเดฐเต‚เดชเตเดชเตเดšเต†เดฏเตเดฏเตเด‚. เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเตผ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเตเดณเตเดณ เดˆ เดชเตเดฐเดตเตผเดคเตเดคเดจเดคเตเดคเดฟเดจเตเดฑเต† เดซเดฒเด‚ %>% เดซเด‚เด—เตโ€Œเดทเดจเดฟเดฒเต‡เด•เตเด•เตเดณเตเดณ เด†เดฆเตเดฏ เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเดพเดฏเดฟ เดชเดพเดธเตเดธเดพเดฏเดฟ summarise(), เด•เต‚เดŸเดพเดคเต† 2 เดซเต€เตฝเดกเตเด•เตพ เด•เต‚เดŸเดฟ เดšเต‡เตผเดคเตเดคเต: เดฏเดพเดคเตเดฐเด•เตเด•เดพเตผ ะธ เดถเดฐเดพเดถเดฐเดฟ_เดตเดฟเดฒ. เด†เดฆเตเดฏเดคเตเดคเต‡เดคเดฟเตฝ, เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต length() เดŸเดฟเด•เตเด•เดฑเตเดฑเตเด•เดณเตเดŸเต† เดŽเดฃเตเดฃเด‚ เด•เดฃเด•เตเด•เดพเด•เตเด•เดฟ, เดฐเดฃเตเดŸเดพเดฎเดคเตเดคเต‡เดคเดฟเตฝ เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต mean() เดถเดฐเดพเดถเดฐเดฟ เดŸเดฟเด•เตเด•เดฑเตเดฑเต เดจเดฟเดฐเด•เตเด•เต เดฒเดญเดฟเดšเตเดšเต.

R-เดฒเต† เดกเดพเดฑเตเดฑเดฏเตเดŸเต† เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเตเด‚: data.table

ะ’ data.table เดธเด‚เด—เตเดฐเดนเดคเตเดคเดฟเดจเดพเดฏเดฟ เดตเดพเดฆเด‚ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต j เดธเตเด•เตเดตเดฏเตผ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเดฒเตเด‚ เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เดฟเดจเตเด‚ เดฐเดฃเตเดŸเดพเด‚ เดธเตเดฅเดพเดจเดฎเตเดฃเตเดŸเต by เด…เดฅเดตเดพ keyby, เด…เดตเดฏเตเด•เตเด•เต เดฎเต‚เดจเตเดจเดพเด‚ เดธเตเดฅเดพเดจเดฎเตเดฃเตเดŸเต.

เดˆ เด•เต‡เดธเดฟเตฝ เด…เด—เตเดฐเด—เต‡เดทเตป เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเตเดŸเต† เดฒเดฟเดธเตเดฑเตเดฑเต เดตเดฟเดตเดฐเดฟเดšเตเดšเดคเดฟเดจเต เดธเดฎเดพเดจเดฎเดพเดฃเต dplyr, เด•เดพเดฐเดฃเด‚ เด‡เดต เด…เดŸเดฟเดธเตเดฅเดพเดจ R เดตเดพเด•เตเดฏเด˜เดŸเดจเดฏเดฟเตฝ เดจเดฟเดจเตเดจเตเดณเตเดณ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเดพเดฃเต.

R-เตฝ เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเตเด‚: data.table

## data.table
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
titanic[, .(passangers = length(PassengerId),
            avg_price  = mean(Fare)),
        by = Pclass]

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดกเดพเดฑเตเดฑเดฏเตเดŸเต† เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเตเด‚: เดชเดพเดฃเตเดŸเด•เตพ

เด—เตเดฐเต‚เดชเตเดชเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต pandas เดธเดฎเดพเดจเดฎเดพเดฏ dplyr, เดŽเดจเตเดจเดพเตฝ เดธเดฎเดพเดนเดฐเดฃเด‚ เดธเดฎเดพเดจเดฎเดฒเตเดฒ dplyr เด’เดฐเดฟเด•เตเด•เดฒเตเดฎเดฟเดฒเตเดฒ data.table.

เด—เตเดฐเต‚เดชเตเดชเตเดšเต†เดฏเตเดฏเดพเตป, เดฐเต€เดคเดฟ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด• groupby(), เดกเดพเดฑเตเดฑเดซเตเดฐเต†เดฏเดฟเด‚ เด—เตเดฐเต‚เดชเตเดชเตเดšเต†เดฏเตเดฏเตเดจเตเดจ เดจเดฟเดฐเด•เดณเตเดŸเต† เด’เดฐเต เดฒเดฟเดธเตเดฑเตเดฑเต เดจเดฟเด™เตเด™เตพ เด•เตˆเดฎเดพเดฑเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต.

เดธเดฎเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเดพเดฏเดฟ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดฐเต€เดคเดฟ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเด‚ agg()เด’เดฐเต เดจเดฟเด˜เดฃเตเดŸเต เดธเตเดตเต€เด•เดฐเดฟเด•เตเด•เตเดจเตเดจเต. เดจเดฟเด™เตเด™เตพ เด…เด—เตเดฐเด—เต‡เดทเตป เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ เดชเตเดฐเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจ เดจเดฟเดฐเด•เดณเดพเดฃเต เดจเดฟเด˜เดฃเตเดŸเต เด•เต€เด•เตพ, เดฎเต‚เดฒเตเดฏเด™เตเด™เตพ เด…เด—เตเดฐเด—เต‡เดทเตป เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเตเดŸเต† เดชเต‡เดฐเตเด•เดณเดพเดฃเต.

เด…เด—เตเดฐเด—เต‡เดทเตป เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ:

  • sum() - เดธเด‚เด—เตเดฐเดนเด‚
  • min() / max() - เดเดฑเตเดฑเดตเตเด‚ เด•เตเดฑเดžเตเดžเดคเตเด‚ เด•เต‚เดŸเดฟเดฏเดคเตเดฎเดพเดฏ เดฎเต‚เดฒเตเดฏเด‚
  • mean() - เดถเดฐเดพเดถเดฐเดฟ
  • median() - เด‡เดŸเดคเตเดคเดฐเด‚
  • count() - เด…เดณเดตเต

เดซเด‚เด—เตเดทเตป reset_index() เดšเตเดตเดŸเต†เดฏเตเดณเตเดณ เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเตฝ เดจเต†เดธเตเดฑเตเดฑเดกเต เดธเต‚เดšเดฟเด•เด•เตพ เดชเตเดจเดƒเดธเดœเตเดœเดฎเดพเด•เตเด•เดพเตป เด‡เดคเต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต pandas เดกเดพเดฑเตเดฑ เดธเดฎเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต เดถเต‡เดทเดฎเตเดณเตเดณ เดธเตเดฅเดฟเดฐเดธเตเดฅเดฟเดคเดฟเด•เตพ.

ะกะธะผะฒะพะป เด…เดŸเตเดคเตเดค เดตเดฐเดฟเดฏเดฟเดฒเต‡เด•เตเด•เต เดจเต€เด™เตเด™เดพเตป เดจเดฟเด™เตเด™เดณเต† เด…เดจเตเดตเดฆเดฟเด•เตเด•เตเดจเตเดจเต.

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด…เด—เตเดฐเด—เต‡เดทเดจเตเด‚: เดชเดพเดฃเตเดŸเด•เตพ

# ะณั€ัƒะฟะฟะธั€ะพะฒะบะฐ ะธ ะฐะณั€ะตะณะฐั†ะธั ะดะฐะฝะฝั‹ั…
titanic.groupby(["Pclass"]).
    agg({'PassengerId': 'count', 'Fare': 'mean'}).
        reset_index()

เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดฒเด‚เดฌเดฎเดพเดฏ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เตฝ

เด’เดฐเต‡ เด˜เดŸเดจเดฏเดฟเดฒเตเดณเตเดณ เดฐเดฃเตเดŸเต‹ เด…เดคเดฟเดฒเดงเดฟเด•เดฎเต‹ เดชเดŸเตเดŸเดฟเด•เด•เตพ เดจเดฟเด™เตเด™เตพ เดšเต‡เดฐเตเดจเตเดจ เด’เดฐเต เดชเตเดฐเดตเตผเดคเตเดคเดจเด‚. เดžเด™เตเด™เตพ เดฒเต‹เดกเต เดšเต†เดฏเตเดค เดกเดพเดฑเตเดฑเดฏเดฟเตฝ เดชเดŸเตเดŸเดฟเด•เด•เตพ เด…เดŸเด™เตเด™เดฟเดฏเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเต ga_nov ะธ ga_dec. เดˆ เดชเดŸเตเดŸเดฟเด•เด•เตพ เด˜เดŸเดจเดฏเดฟเตฝ เดธเดฎเดพเดจเดฎเดพเดฃเต, เด…เดคเดพเดฏเดคเต. เด’เดฐเต‡ เดจเดฟเดฐเด•เดณเตเด‚ เดˆ เด•เต‹เดณเด™เตเด™เดณเดฟเดฒเต† เดกเดพเดฑเตเดฑ เดคเดฐเด™เตเด™เดณเตเด‚ เด‰เดฃเตเดŸเต.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดจเดตเด‚เดฌเตผ, เดกเดฟเดธเด‚เดฌเตผ เดฎเดพเดธเด™เตเด™เดณเดฟเดฒเต† Google Analytics-เตฝ เดจเดฟเดจเตเดจเตเดณเตเดณ เด…เดชเตโ€Œเดฒเต‹เดกเดพเดฃเดฟเดคเต, เดˆ เดตเดฟเดญเดพเด—เดคเตเดคเดฟเตฝ เดžเด™เตเด™เตพ เดˆ เดกเดพเดฑเตเดฑ เด’เดฐเต เดชเดŸเตเดŸเดฟเด•เดฏเดฟเดฒเต‡เด•เตเด•เต เดธเด‚เดฏเต‹เดœเดฟเดชเตเดชเดฟเด•เตเด•เตเด‚.

R-เตฝ เดฒเด‚เดฌเดฎเดพเดฏเดฟ เดšเต‡เดฐเตเดจเตเดจ เดชเดŸเตเดŸเดฟเด•เด•เตพ: tidyverse, dplyr

ะ’ dplyr เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดจเดฟเด™เตเด™เตพเด•เตเด•เต 2 เดชเดŸเตเดŸเดฟเด•เด•เตพ เด’เดจเตเดจเดพเดฏเดฟ เดธเด‚เดฏเต‹เดœเดฟเดชเตเดชเดฟเด•เตเด•เดพเด‚ bind_rows(), เดŸเต‡เดฌเดฟเดณเตเด•เตพ เด…เดคเดฟเดจเตเดฑเต† เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเตเด•เดณเดพเดฏเดฟ เด•เดŸเดจเตเดจเตเดชเต‹เด•เตเดจเตเดจเต.

R: dplyr-เตฝ เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเต

# ะ’ะตั€ั‚ะธะบะฐะปัŒะฝะพะต ะพะฑัŠะตะดะธะฝะตะฝะธะต ั‚ะฐะฑะปะธั†
## dplyr
bind_rows(ga_nov, ga_dec)

R-เตฝ เดชเดŸเตเดŸเดฟเด•เด•เตพ เดฒเด‚เดฌเดฎเดพเดฏเดฟ เดšเต‡เดฐเตเดจเตเดจเต: data.table

เด‡เดคเต เดธเด™เตเด•เต€เตผเดฃเตเดฃเดฎเดพเดฏ เด’เดจเตเดจเตเดฎเดฒเตเดฒ, เดจเดฎเตเด•เตเด•เต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเด‚ rbind().

R-เตฝ เดตเดฐเดฟเด•เตพ เดซเดฟเตฝเดŸเตเดŸเตผ เดšเต†เดฏเตเดฏเตเดจเตเดจเต: data.table

## data.table
rbind(ga_nov, ga_dec)

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดฒเด‚เดฌเดฎเดพเดฏเดฟ เดšเต‡เดฐเตเดจเตเดจ เดชเดŸเตเดŸเดฟเด•เด•เตพ: เดชเดพเดฃเตเดŸเด•เตพ

ะ’ pandas เดŸเต‡เดฌเดฟเดณเดฟเตฝ เดšเต‡เดฐเดพเตป เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต concat(), เด…เดต เดธเด‚เดฏเต‹เดœเดฟเดชเตเดชเดฟเด•เตเด•เตเดจเตเดจเดคเดฟเดจเต เดจเดฟเด™เตเด™เตพ เดซเตเดฐเต†เดฏเดฟเดฎเตเด•เดณเตเดŸเต† เด’เดฐเต เดฒเดฟเดธเตเดฑเตเดฑเต เด•เตˆเดฎเดพเดฑเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต.

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดธเตเดŸเตเดฐเดฟเด‚เด—เตเด•เตพ เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต: เดชเดพเดฃเตเดŸเด•เตพ

# ะฒะตั€ั‚ะธะบะฐะปัŒะฝะพะต ะพะฑัŠะตะดะธะฝะตะฝะธะต ั‚ะฐะฑะปะธั†
pd.concat([ga_nov, ga_dec])

เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดคเดฟเดฐเดถเตเดšเต€เดจ เดœเต‹เดฏเดฟเตป

เดฐเดฃเตเดŸเดพเดฎเดคเตเดคเต‡เดคเดฟเตฝ เดจเดฟเดจเตเดจเตเดณเตเดณ เดจเดฟเดฐเด•เตพ เด•เต€ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด†เดฆเตเดฏ เดชเดŸเตเดŸเดฟเด•เดฏเดฟเดฒเต‡เด•เตเด•เต เดšเต‡เตผเด•เตเด•เตเดจเตเดจ เด’เดฐเต เดชเตเดฐเดตเตผเดคเตเดคเดจเด‚. เดšเดฟเดฒ เดฑเดซเดฑเตปเดธเต เดกเดพเดฑเตเดฑ (เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต, เด’เดฐเต เด‰เตฝเดชเตเดชเดจเตเดจเดคเตเดคเดฟเดจเตเดฑเต† เดตเดฟเดฒ) เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด’เดฐเต เดตเดธเตเดคเตเดค เดชเดŸเตเดŸเดฟเด• (เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต, เดตเดฟเตฝเดชเตเดชเดจ เดกเดพเดฑเตเดฑเดฏเตเดณเตเดณ เด’เดฐเต เดชเดŸเตเดŸเดฟเด•) เดธเดฎเตเดชเตเดทเตเดŸเดฎเดพเด•เตเด•เตเดฎเตเดชเต‹เตพ เด‡เดคเต เดชเดฒเดชเตเดชเต‹เดดเตเด‚ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเดฑเตเดฃเตเดŸเต.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดจเดฟเดฐเดตเดงเดฟ เดคเดฐเด‚ เดšเต‡เดฐเดฒเตเด•เตพ เด‰เดฃเตเดŸเต:

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เดฎเตเดฎเตเดชเต เดฒเต‹เดกเต เดšเต†เดฏเตเดค เดชเดŸเตเดŸเดฟเด•เดฏเดฟเตฝ เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต เดžเด™เตเด™เตพเด•เตเด•เต เด’เดฐเต เด•เต‹เดณเด‚ เด‰เดฃเตเดŸเต เดธเต†เด•เตเดธเต, เด‡เดคเต เดฏเดพเดคเตเดฐเด•เตเด•เดพเดฐเดจเตเดฑเต† เดฒเดฟเด‚เด— เด•เต‹เดกเตเดฎเดพเดฏเดฟ เดฏเต‹เดœเดฟเด•เตเด•เตเดจเตเดจเต:

1 - เดธเตเดคเตเดฐเต€
2 - เดชเตเดฐเตเดทเตป

เด•เต‚เดŸเดพเดคเต†, เดžเด™เตเด™เตพ เด’เดฐเต เดชเดŸเตเดŸเดฟเด• เดธเตƒเดทเตเดŸเดฟเดšเตเดšเต - เด’เดฐเต เดฑเดซเดฑเตปเดธเต เดชเตเดธเตเดคเด•เด‚ เดฒเดฟเด‚เด—เดญเต‡เดฆเด‚. เดฏเดพเดคเตเดฐเด•เตเด•เดพเดฐเตเดŸเต† เดฒเดฟเด‚เด—เดญเต‡เดฆเดคเตเดคเต†เด•เตเด•เตเดฑเดฟเดšเตเดšเตเดณเตเดณ เดกเดพเดฑเตเดฑเดฏเตเดŸเต† เด•เต‚เดŸเตเดคเตฝ เดธเต—เด•เดฐเตเดฏเดชเตเดฐเดฆเดฎเดพเดฏ เด…เดตเดคเดฐเดฃเดคเตเดคเดฟเดจเต, เดžเด™เตเด™เตพ เดกเดฏเดฑเด•เตเดŸเดฑเดฟเดฏเดฟเตฝ เดจเดฟเดจเตเดจเต เดฒเดฟเด‚เด—เดคเตเดคเดฟเดจเตเดฑเต† เดชเต‡เดฐเต เดšเต‡เตผเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต เดฒเดฟเด‚เด—เดญเต‡เดฆเด‚ เดฎเต‡เดถเดฏเดฟเดฒเต‡เด•เตเด•เต เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต.

เดคเดฟเดฐเดถเตเดšเต€เดจเดฎเดพเดฏ เดชเดŸเตเดŸเดฟเด• R-เตฝ เดšเต‡เดฐเตเดจเตเดจเต: tidyverse, dplyr

ะ’ dplyr เดคเดฟเดฐเดถเตเดšเต€เดจเดฎเดพเดฏเดฟ เดšเต‡เดฐเตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเตเดŸเต† เด’เดฐเต เด•เตเดŸเตเด‚เดฌเด‚ เดฎเตเดดเตเดตเดจเตเด‚ เด‰เดฃเตเดŸเต:

  • inner_join()
  • left_join()
  • right_join()
  • full_join()
  • semi_join()
  • nest_join()
  • anti_join()

เดŽเดจเตเดฑเต† เดชเดฐเดฟเดถเต€เดฒเดจเดคเตเดคเดฟเตฝ เดเดฑเตเดฑเดตเตเด‚ เดธเดพเดงเดพเดฐเดฃเดฏเดพเดฏเดฟ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเต left_join().

เด†เดฆเตเดฏเดคเตเดคเต† เดฐเดฃเตเดŸเต เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเตเด•เตพ เดชเต‹เดฒเต†, เดฎเตเด•เดณเดฟเตฝ เดฒเดฟเดธเตเดฑเตเดฑเต เดšเต†เดฏเตเดคเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ เดšเต‡เดฐเตเดจเตเดจเดคเดฟเดจเต เดฐเดฃเตเดŸเต เดŸเต‡เดฌเดฟเดณเตเด•เตพ เดŽเดŸเตเด•เตเด•เตเดจเตเดจเต, เด•เต‚เดŸเดพเดคเต† เดฎเต‚เดจเตเดจเดพเดฎเดคเตเดคเต† เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเดพเดฏเดฟ by เดšเต‡เดฐเตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดจเดฟเดฐเด•เตพ เดจเดฟเด™เตเด™เตพ เดตเตเดฏเด•เตเดคเดฎเดพเด•เตเด•เดฃเด‚.

R: dplyr-เตฝ เดคเดฟเดฐเดถเตเดšเต€เดจ เดชเดŸเตเดŸเดฟเด• เดšเต‡เดฐเตเด•

# ะพะฑัŠะตะดะธะฝัะตะผ ั‚ะฐะฑะปะธั†ั‹
left_join(titanic, gender,
          by = c("Sex" = "id"))

R-เดฒเต† เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดคเดฟเดฐเดถเตเดšเต€เดจ เดœเต‹เดฏเดฟเตป: data.table

ะ’ data.table เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด•เต€ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดจเดฟเด™เตเด™เตพ เดชเดŸเตเดŸเดฟเด•เด•เดณเดฟเตฝ เดšเต‡เดฐเต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต merge().

data.table-เตฝ เดฒเดฏเดฟเดชเตเดชเดฟเด•เตเด•เดพเดจเตเดณเตเดณ () เดซเด‚เด—เตโ€Œเดทเดจเตเดณเตเดณ เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเตเด•เตพ

  • x, y - เดšเต‡เดฐเตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดชเดŸเตเดŸเดฟเด•เด•เตพ
  • by โ€” เดฐเดฃเตเดŸเต เดชเดŸเตเดŸเดฟเด•เด•เดณเดฟเดฒเตเด‚ เด’เดฐเต‡ เดชเต‡เดฐเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ เดšเต‡เดฐเตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดคเดพเด•เตเด•เต‹เดฒเดพเดฃเต เด•เต‹เดณเด‚
  • by.x, by.y โ€” เดชเดŸเตเดŸเดฟเด•เด•เดณเดฟเตฝ เดตเตเดฏเดคเตเดฏเดธเตเดค เดชเต‡เดฐเตเด•เดณเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ เด•เต‹เดณเด‚ เดชเต‡เดฐเตเด•เตพ เดฒเดฏเดฟเดชเตเดชเดฟเด•เตเด•เตเด‚
  • all, all.x, all.y โ€” เดœเต‹เดฏเดฟเตป เดŸเตˆเดชเตเดชเต, เดŽเดฒเตเดฒเดพเด‚ เดฐเดฃเตเดŸเต เดŸเต‡เดฌเดฟเดณเตเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเตเด‚ เดŽเดฒเตเดฒเดพ เดตเดฐเดฟเด•เดณเตเด‚ เดคเดฟเดฐเดฟเด•เต† เดจเตฝเด•เตเด‚, all.x เดฒเต†เดซเตเดฑเตเดฑเต เดœเต‹เดฏเดฟเตป เด“เดชเตเดชเดฑเต‡เดทเดจเตเดฎเดพเดฏเดฟ เดฏเต‹เดœเดฟเด•เตเด•เตเดจเตเดจเต (เด†เดฆเตเดฏเดคเตเดคเต† เดชเดŸเตเดŸเดฟเด•เดฏเตเดŸเต† เดŽเดฒเตเดฒเดพ เดตเดฐเดฟเด•เดณเตเด‚ เดตเดฟเดŸเตเด‚), all.y โ€” เดฑเตˆเดฑเตเดฑเต เดœเต‹เดฏเดฟเตป เด“เดชเตเดชเดฑเต‡เดทเตป (เดฐเดฃเตเดŸเดพเดฎเดคเตเดคเต† เดชเดŸเตเดŸเดฟเด•เดฏเตเดŸเต† เดŽเดฒเตเดฒเดพ เดตเดฐเดฟเด•เดณเตเด‚ เด‰เดชเต‡เด•เตเดทเดฟเด•เตเด•เตเด‚).

R-เดฒเต† เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดคเดฟเดฐเดถเตเดšเต€เดจ เดœเต‹เดฏเดฟเตป: data.table

# ะพะฑัŠะตะดะธะฝัะตะผ ั‚ะฐะฑะปะธั†ั‹
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดคเดฟเดฐเดถเตเดšเต€เดจ เดชเดŸเตเดŸเดฟเด• เดšเต‡เดฐเตเดจเตเดจเต: เดชเดพเดฃเตเดŸเด•เตพ

เด…เดคเตเดชเต‹เดฒเต† เด…เด•เดคเตเดคเตเด‚ data.tableเด…เด•เดคเตเดคเต pandas เดŸเต‡เดฌเดฟเดณเดฟเตฝ เดšเต‡เดฐเดพเตป เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต merge().

เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดฒเดฏเดจเด‚() เดซเด‚เด—เตโ€Œเดทเดจเตเดฑเต† เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเตเด•เตพ

  • เดŽเด™เตเด™เดจเต† - เด•เดฃเด•เตเดทเตป เดคเดฐเด‚: เด‡เดŸเดคเต, เดตเดฒเดคเต, เดชเตเดฑเด‚, เด…เด•เด‚
  • on โ€” เดฐเดฃเตเดŸเต เดชเดŸเตเดŸเดฟเด•เด•เดณเดฟเดฒเตเด‚ เด’เดฐเต‡ เดชเต‡เดฐเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ เด…เดคเต เด’เดฐเต เด•เต€เดฏเดพเดฃเต เด•เต‹เดณเด‚
  • left_on, right_on โ€” เดชเดŸเตเดŸเดฟเด•เด•เดณเดฟเตฝ เดตเตเดฏเดคเตเดฏเดธเตเดค เดชเต‡เดฐเตเด•เดณเตเดฃเตเดŸเต†เด™เตเด•เดฟเตฝ เด•เต€ เด•เต‹เดณเด™เตเด™เดณเตเดŸเต† เดชเต‡เดฐเตเด•เตพ

เดชเตˆเดคเตเดคเดฃเดฟเตฝ เดคเดฟเดฐเดถเตเดšเต€เดจ เดชเดŸเตเดŸเดฟเด• เดšเต‡เดฐเตเดจเตเดจเต: เดชเดพเดฃเตเดŸเด•เตพ

# ะพะฑัŠะตะดะธะฝัะตะผ ะฟะพ ะบะปัŽั‡ัƒ
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")

เด…เดŸเดฟเดธเตเดฅเดพเดจ เดตเดฟเตปเดกเต‹ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเตเด‚ เด•เดฃเด•เตเด•เดพเด•เตเด•เดฟเดฏ เดจเดฟเดฐเด•เดณเตเด‚

เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ เด…เด—เตเดฐเด—เต‡เดทเตป เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพเด•เตเด•เต เดธเดฎเดพเดจเดฎเดพเดฃเต, เดฎเดพเดคเตเดฐเดฎเดฒเตเดฒ เดกเดพเดฑเตเดฑ เดตเดฟเดถเด•เดฒเดจเดคเตเดคเดฟเดฒเตเด‚ เดชเดฒเดชเตเดชเต‹เดดเตเด‚ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเดฑเตเดฃเตเดŸเต. เดŽเดจเตเดจเดพเตฝ เด…เด—เตเดฐเด—เต‡เดทเตป เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดตเตเดฏเดคเตเดฏเดธเตเดคเดฎเดพเดฏเดฟ, เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ เด”เดŸเตเดŸเตโ€Œเด—เต‹เดฏเดฟเด‚เด—เต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเดฟเดจเตเดฑเต† เดตเดฐเดฟเด•เดณเตเดŸเต† เดŽเดฃเตเดฃเด‚ เดฎเดพเดฑเตเดฑเดฟเดฒเตเดฒ.

เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เดพเตป เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เต‡เดฃเตเดŸเดคเต - R เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดชเตˆเดคเตเดคเตบ? เดฐเดฃเตเดŸเตเด‚! เดชเดพเดฃเตเดŸเด•เดณเดฟเตฝ เดจเดฟเดจเตเดจเต เดŸเตˆเดกเตˆเดตเต‡เดดเตเดธเดฟเดฒเต‡เด•เตเด•เตเด‚ เดกเดพเดฑเตเดฑ.เดŸเต‡เดฌเดฟเดณเดฟเดฒเต‡เด•เตเด•เตเด‚ เดชเตเดฑเด•เดฟเดฒเต‡เด•เตเด•เตเด‚ เดฎเตˆเด—เตเดฐเต‡เดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต

เด…เดŸเดฟเดธเตเดฅเดพเดจเดชเดฐเดฎเดพเดฏเดฟ, เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต, เดžเด™เตเด™เตพ เด‡เตปเด•เดฎเดฟเด‚เด—เต เดกเดพเดฑเตเดฑเดพเดซเตเดฐเต†เดฏเดฟเดฎเดฟเดจเต† เดšเดฟเดฒ เดฎเดพเดจเดฆเดฃเตเดกเด™เตเด™เตพเด•เตเด•เดจเตเดธเดฐเดฟเดšเตเดšเต เดญเดพเด—เด™เตเด™เดณเดพเดฏเดฟ เดตเดฟเดญเดœเดฟเด•เตเด•เตเดจเตเดจเต, เด…เดคเดพเดฏเดคเต. เด’เดฐเต เดซเต€เตฝเดกเดฟเดจเตเดฑเต† เดฎเต‚เดฒเตเดฏเด‚ เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เดจเดฟเดฐเดตเดงเดฟ เดซเต€เตฝเดกเตเด•เตพ เดชเตเดฐเด•เดพเดฐเด‚. เด“เดฐเต‹ เดตเดฟเตปเดกเต‹เดฏเดฟเดฒเตเด‚ เดžเด™เตเด™เตพ เด—เดฃเดฟเดค เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เดจเดŸเดคเตเดคเตเดจเตเดจเต. เดˆ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเตเดŸเต† เดซเดฒเด‚ เด“เดฐเต‹ เดตเดฐเดฟเดฏเดฟเดฒเตเด‚ เดคเดฟเดฐเดฟเด•เต† เดจเตฝเด•เตเด‚, เด…เดคเดพเดฏเดคเต. เดชเดŸเตเดŸเดฟเด•เดฏเดฟเดฒเต† เดฎเตŠเดคเตเดคเด‚ เดตเดฐเดฟเด•เดณเตเดŸเต† เดŽเดฃเตเดฃเด‚ เดฎเดพเดฑเตเดฑเดพเดคเต†.

เด‰เดฆเดพเดนเดฐเดฃเดคเตเดคเดฟเดจเต, เดจเดฎเตเด•เตเด•เต เดชเดŸเตเดŸเดฟเด• เดŽเดŸเตเด•เตเด•เดพเด‚ เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต. เด“เดฐเต‹ เดŸเดฟเด•เตเด•เดฑเตเดฑเดฟเดจเตเด‚ เด…เดคเดฟเดจเตเดฑเต† เด•เตเดฏเดพเดฌเดฟเตป เด•เตเดฒเดพเดธเดฟเดจเตเดณเตเดณเดฟเตฝ เดŽเดคเตเดฐ เดถเดคเดฎเดพเดจเด‚ เดตเดฟเดฒเดฏเตเดฃเตเดŸเต†เดจเตเดจเต เดจเดฎเตเด•เตเด•เต เด•เดฃเด•เตเด•เดพเด•เตเด•เดพเด‚.

เด‡เดคเต เดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดจเต, เด“เดฐเต‹ เดฒเตˆเดจเดฟเดฒเตเด‚ เดˆ เดฒเตˆเดจเดฟเดฒเต† เดŸเดฟเด•เตเด•เดฑเตเดฑเต เด‰เตพเดชเตเดชเต†เดŸเตเดจเตเดจ เดจเดฟเดฒเดตเดฟเดฒเต† เด•เตเดฏเดพเดฌเดฟเตป เด•เตเดฒเดพเดธเดฟเดจเตเดฑเต† เดŸเดฟเด•เตเด•เดฑเตเดฑเดฟเดจเตเดฑเต† เด†เด•เต† เดตเดฟเดฒ เดจเดฎเตเด•เตเด•เต เดฒเดญเดฟเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต, เดคเตเดŸเตผเดจเตเดจเต เด“เดฐเต‹ เดŸเดฟเด•เตเด•เดฑเตเดฑเดฟเดจเตเดฑเต†เดฏเตเด‚ เดตเดฟเดฒ เด…เดคเต‡ เด•เตเดฏเดพเดฌเดฟเตป เด•เตเดฒเดพเดธเดฟเดฒเต† เดŽเดฒเตเดฒเดพ เดŸเดฟเด•เตเด•เดฑเตเดฑเตเด•เดณเตเดŸเต†เดฏเตเด‚ เด†เด•เต† เดตเดฟเดฒ เด•เตŠเดฃเตเดŸเต เดนเดฐเดฟเด•เตเด•เตเด• .

R-เตฝ เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ: tidyverse, dplyr

เดชเตเดคเดฟเดฏ เดจเดฟเดฐเด•เตพ เดšเต‡เตผเด•เตเด•เตเดจเตเดจเดคเดฟเดจเต, เดตเดฐเดฟ เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เต เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เดพเดคเต†, เด‡เตป dplyr เดชเตเดฐเดตเตผเดคเตเดคเดจเด‚ เดจเตฝเด•เตเดจเตเดจเต mutate().

เดซเต€เตฝเดกเต เด…เดจเตเดธเดฐเดฟเดšเตเดšเต เดกเดพเดฑเตเดฑ เด—เตเดฐเต‚เดชเตเดชเตเดšเต†เดฏเตเดฏเตเดจเตเดจเดคเดฟเดฒเต‚เดŸเต† เดฎเตเด•เดณเดฟเตฝ เดตเดฟเดตเดฐเดฟเดšเตเดš เดชเตเดฐเดถเตเดจเด‚ เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดชเดฐเดฟเดนเดฐเดฟเด•เตเด•เดพเดจเดพเด•เตเด‚ เดชเดฟ เด•เตเดฒเดพเดธเต เด’เดฐเต เดชเตเดคเดฟเดฏ เด•เต‹เดณเดคเตเดคเดฟเตฝ เดซเต€เตฝเดกเต เดธเด‚เด—เตเดฐเดนเดฟเด•เตเด•เตเด•เดฏเตเด‚ เดšเต†เดฏเตเดฏเตเดจเตเดจเต เด•เต‚เดฒเดฟ. เด…เดŸเตเดคเตเดคเดคเดพเดฏเดฟ, เดชเดŸเตเดŸเดฟเด• เด…เตบเด—เตเดฐเต‚เดชเตเดชเต เดšเต†เดฏเตเดคเต เดซเต€เตฝเดกเต เดฎเต‚เดฒเตเดฏเด™เตเด™เตพ เดตเดฟเดญเดœเดฟเด•เตเด•เตเด• เด•เต‚เดฒเดฟ เดฎเตเดฎเตเดชเดคเตเดคเต† เด˜เดŸเตเดŸเดคเตเดคเดฟเตฝ เดŽเดจเตเดคเดพเดฃเต เดธเด‚เดญเดตเดฟเดšเตเดšเดคเต†เดจเตเดจเต.

R: dplyr-เตฝ เดตเดฟเตปเดกเต‹ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ

group_by(titanic, Pclass) %>%
  mutate(Pclass_cost = sum(Fare)) %>%
  ungroup() %>%
  mutate(ticket_fare_rate = Fare / Pclass_cost)

R เดฒเต† เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ: data.table

เดชเดฐเดฟเดนเดพเดฐ เด…เตฝเด—เต‹เดฐเดฟเดคเด‚ เด‰เดณเตเดณเดคเตเดชเต‹เดฒเต† เดคเดจเตเดจเต† เดคเตเดŸเดฐเตเดจเตเดจเต dplyr, เดžเด™เตเด™เตพ เดซเต€เตฝเดกเต เดชเตเดฐเด•เดพเดฐเด‚ เดตเดฟเตปเดกเต‹เด•เดณเดพเดฏเดฟ เดชเดŸเตเดŸเดฟเด• เดตเดฟเดญเดœเดฟเด•เตเด•เต‡เดฃเตเดŸเดคเตเดฃเตเดŸเต เดชเดฟ เด•เตเดฒเดพเดธเต. เด“เดฐเต‹ เดตเดฐเดฟเดฏเตเดฎเดพเดฏเดฟ เดฌเดจเตเดงเดชเตเดชเต†เดŸเตเดŸ เด—เตเดฐเต‚เดชเตเดชเดฟเดจเตเดณเตเดณ เดคเตเด• เด’เดฐเต เดชเตเดคเดฟเดฏ เด•เต‹เดณเดคเตเดคเดฟเตฝ เด”เดŸเตเดŸเตเดชเตเดŸเตเดŸเต เดšเต†เดฏเตเดฏเตเด•, เด•เต‚เดŸเดพเดคเต† เด…เดคเดฟเดจเตเดฑเต† เด—เตเดฐเต‚เดชเตเดชเดฟเดฒเต† เด“เดฐเต‹ เดŸเดฟเด•เตเด•เดฑเตเดฑเดฟเดจเตเดฑเต†เดฏเตเด‚ เดตเดฟเดฒเดฏเตเดŸเต† เดตเดฟเดนเดฟเดคเด‚ เดžเด™เตเด™เตพ เด•เดฃเด•เตเด•เดพเด•เตเด•เตเดจเตเดจ เด’เดฐเต เด•เต‹เดณเด‚ เดšเต‡เตผเด•เตเด•เตเด•.

เด‡เดคเดฟเดฒเต‡เด•เตเด•เต เดชเตเดคเดฟเดฏ เด•เต‹เดณเด™เตเด™เตพ เดšเต‡เตผเด•เตเด•เดพเตป data.table เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเตผ เด‰เดฃเตเดŸเต :=. เดชเดพเด•เตเด•เต‡เดœเต เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เด’เดฐเต เดชเตเดฐเดถเตเดจเด‚ เดชเดฐเดฟเดนเดฐเดฟเด•เตเด•เตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เด’เดฐเต เด‰เดฆเดพเดนเดฐเดฃเด‚ เดšเตเดตเดŸเต†เดฏเตเดฃเตเดŸเต data.table

R เดฒเต† เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เตพ: data.table

titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost), 
        by = Pclass]

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดตเดฟเตปเดกเต‹ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ: เดชเดพเดฃเตเดŸเด•เตพ

เด’เดฐเต เดชเตเดคเดฟเดฏ เด•เต‹เดณเด‚ เดšเต‡เตผเด•เตเด•เตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เด’เดฐเต เดตเดดเดฟ pandas - เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด• assign(). เด•เตเดฏเดพเดฌเดฟเตป เด•เตเดฒเดพเดธเต เดชเตเดฐเด•เดพเดฐเด‚ เดŸเดฟเด•เตเด•เดฑเตเดฑเตเด•เดณเตเดŸเต† เดตเดฟเดฒ เดธเด‚เด—เตเดฐเดนเดฟเด•เตเด•เดพเตป, เดตเดฐเดฟเด•เตพ เด—เตเดฐเต‚เดชเตเดชเตเดšเต†เดฏเตเดฏเดพเดคเต†, เดžเด™เตเด™เตพ เดซเด‚เด—เตเดทเตป เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเด‚ transform().

เดžเด™เตเด™เตพ เดชเดŸเตเดŸเดฟเด•เดฏเดฟเดฒเต‡เด•เตเด•เต เดšเต‡เตผเด•เตเด•เตเดจเตเดจ เด’เดฐเต เดชเดฐเดฟเดนเดพเดฐเดคเตเดคเดฟเดจเตเดฑเต† เด’เดฐเต เด‰เดฆเดพเดนเดฐเดฃเด‚ เดšเตเดตเดŸเต†เดฏเตเดฃเตเดŸเต เดŸเตˆเดฑเตเดฑเดพเดจเดฟเด•เต เด…เดคเต‡ 2 เดจเดฟเดฐเด•เตพ.

เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดตเดฟเตปเดกเต‹ เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ: เดชเดพเดฃเตเดŸเด•เตพ

titanic.assign(Pclass_cost      =  titanic.groupby('Pclass').Fare.transform(sum),
               ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])

เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เดณเตเด‚ เดฐเต€เดคเดฟเด•เดณเตเด‚ เด•เดคเตเดคเดฟเดŸเดชเดพเดŸเตเด•เตพ เดชเดŸเตเดŸเดฟเด•

เดžเด™เตเด™เตพ เดชเดฐเดฟเด—เดฃเดฟเดšเตเดš เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเดฟเดฒเต† เดกเดพเดฑเตเดฑ เด‰เดชเดฏเต‹เด—เดฟเดšเตเดšเต เดตเดฟเดตเดฟเดง เดชเตเดฐเดตเตผเดคเตเดคเดจเด™เตเด™เตพ เดจเดŸเดคเตเดคเตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดฐเต€เดคเดฟเด•เตพ เดคเดฎเตเดฎเดฟเดฒเตเดณเตเดณ เด•เดคเตเดคเดฟเดŸเดชเดพเดŸเตเด•เดณเตเดŸเต† เด’เดฐเต เดชเดŸเตเดŸเดฟเด• เดšเตเดตเดŸเต†เดฏเตเดฃเตเดŸเต.

เดตเดฟเดตเดฐเดฃเด‚
เดตเตƒเดคเตเดคเดฟเดฏเตเดณเตเดณ
เดกเดพเดฑเตเดฑ. เดชเดŸเตเดŸเดฟเด•
เดชเดพเดฃเตเดŸเด•เตพ

เดกเดพเดฑเตเดฑ เดฒเต‹เดกเตเดšเต†เดฏเตเดฏเตเดจเตเดจเต
vroom()/ readr::read_csv() / readr::read_tsv()
fread()
read_csv()

เดกเดพเดฑเตเดฑ เดซเตเดฐเต†เดฏเดฟเดฎเตเด•เตพ เดธเตƒเดทเตเดŸเดฟเด•เตเด•เตเดจเตเดจเต
tibble()
data.table()
dict() + from_dict()

เดจเดฟเดฐเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เตเดจเตเดจเต
select()
เดตเดพเดฆเด‚ j, เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เดฐเดฃเตเดŸเดพเด‚ เดธเตเดฅเดพเดจเด‚
เด†เดตเดถเตเดฏเดฎเดพเดฏ เดจเดฟเดฐเด•เดณเตเดŸเต† เดฒเดฟเดธเตเดฑเตเดฑเต เดžเด™เตเด™เตพ เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เด•เตˆเดฎเดพเดฑเตเดจเตเดจเต / drop() / filter() / select_dtypes()

เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต เดตเดฐเดฟเด•เตพ
filter()
เดตเดพเดฆเด‚ i, เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เด’เดจเตเดจเดพเด‚ เดธเตเดฅเดพเดจเด‚
เดžเด™เตเด™เตพ เดšเดคเตเดฐ เดฌเตเดฐเดพเด•เตเด•เดฑเตเดฑเตเด•เดณเดฟเตฝ เดซเดฟเตฝเดŸเตเดŸเดฑเดฟเด‚เด—เต เดตเตเดฏเดตเดธเตเดฅเด•เตพ เดฒเดฟเดธเตเดฑเตเดฑเต เดšเต†เดฏเตเดฏเตเดจเตเดจเต / filter()

เด—เตเดฐเต‚เดชเตเดชเดฟเด‚เด—เตเด‚ เด•เต‚เดŸเตเดŸเดฟเดšเตเดšเต‡เตผเด•เตเด•เดฒเตเด‚
group_by() + summarise()
เด†เตผเด—เตเดฏเตเดฎเต†เดจเตเดฑเตเด•เตพ j + by
groupby() + agg()

เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดฒเด‚เดฌเดฎเดพเดฏ เดฏเต‚เดฃเดฟเดฏเตป (UNION)
bind_rows()
rbind()
concat()

เดชเดŸเตเดŸเดฟเด•เด•เดณเตเดŸเต† เดคเดฟเดฐเดถเตเดšเต€เดจ เดœเต‹เดฏเดฟเตป (เดœเต‹เดฏเดฟเตป)
left_join() / *_join()
merge()
merge()

เด…เดŸเดฟเดธเตเดฅเดพเดจ เดตเดฟเตปเดกเต‹ เดซเด‚เด—เตโ€Œเดทเดจเตเด•เดณเตเด‚ เด•เดฃเด•เตเด•เดพเด•เตเด•เดฟเดฏ เดจเดฟเดฐเด•เตพ เดšเต‡เตผเด•เตเด•เดฒเตเด‚
group_by() + mutate()
เดตเดพเดฆเด‚ j เด“เดชเตเดชเดฑเต‡เดฑเตเดฑเตผ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเต := + เดตเดพเดฆเด‚ by
transform() + assign()

เดคเต€เดฐเตเดฎเดพเดจเด‚

เด’เดฐเตเดชเด•เตเดทเต‡ เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ เดžเดพเตป เดตเดฟเดตเดฐเดฟเดšเตเดšเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจเดคเต เดกเดพเดฑเตเดฑเดพ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เดฟเดจเตเดฑเต† เดเดฑเตเดฑเดตเตเด‚ เด’เดชเตเดฑเตเดฑเดฟเดฎเตฝ เดจเดŸเดชเตเดชเดพเด•เตเด•เดฒเตเด•เดณเดฒเตเดฒ, เด…เดคเดฟเดจเดพเตฝ เด…เดญเดฟเดชเตเดฐเดพเดฏเด™เตเด™เดณเดฟเดฒเต† เดŽเดจเตเดฑเต† เดคเต†เดฑเตเดฑเตเด•เตพ เดจเดฟเด™เตเด™เตพ เดคเดฟเดฐเตเดคเตเดคเตเด•เดฏเต‹ เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด†เตผ / เดชเตˆเดคเตเดคเดฃเดฟเดฒเต† เดกเดพเดฑเตเดฑเดฏเตเดฎเดพเดฏเดฟ เดชเตเดฐเดตเตผเดคเตเดคเดฟเด•เตเด•เตเดจเตเดจเดคเดฟเดจเตเดณเตเดณ เดฎเดฑเตเดฑเต เดธเดพเด™เตเด•เต‡เดคเดฟเด• เดตเดฟเดฆเตเดฏเด•เดณเตเดฎเดพเดฏเดฟ เดฒเต‡เด–เดจเดคเตเดคเดฟเตฝ เดจเตฝเด•เดฟเดฏเดฟเดฐเดฟเด•เตเด•เตเดจเตเดจ เดตเดฟเดตเดฐเด™เตเด™เตพ เด…เดจเตเดฌเดจเตเดงเดฎเดพเดฏเดฟ เดจเตฝเด•เตเด•เดฏเต‹ เดšเต†เดฏเตเดคเดพเตฝ เดžเดพเตป เดธเดจเตเดคเต‹เดทเดฟเด•เตเด•เตเด‚.

เดžเดพเตป เดฎเตเด•เดณเดฟเตฝ เดŽเดดเตเดคเดฟเดฏเดคเตเดชเต‹เดฒเต†, เดฒเต‡เด–เดจเดคเตเดคเดฟเดจเตเดฑเต† เด‰เดฆเตเดฆเต‡เดถเด‚, เดเดคเต เดญเดพเดทเดฏเดพเดฃเต เดฎเดฟเด•เดšเตเดšเดคเต†เดจเตเดจเต เด’เดฐเดพเดณเตเดŸเต† เด…เดญเดฟเดชเตเดฐเดพเดฏเด‚ เด…เดŸเดฟเดšเตเดšเต‡เตฝเดชเตเดชเดฟเด•เตเด•เตเด•เดฏเดฒเตเดฒ, เดฎเดฑเดฟเดšเตเดšเต เดฐเดฃเตเดŸเต เดญเดพเดทเด•เดณเตเด‚ เดชเด เดฟเด•เตเด•เดพเดจเตเดณเตเดณ เด…เดตเดธเดฐเด‚ เดฒเดณเดฟเดคเดฎเดพเด•เตเด•เตเด•, เด…เดฒเตเดฒเต†เด™เตเด•เดฟเตฝ เด†เดตเดถเตเดฏเดฎเต†เด™เตเด•เดฟเตฝ เด…เดตเดฏเตเด•เตเด•เดฟเดŸเดฏเดฟเตฝ เด•เตเดŸเดฟเดฏเต‡เดฑเตเด•.

เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดฒเต‡เด–เดจเด‚ เด‡เดทเตเดŸเดชเตเดชเต†เดŸเตเดŸเต†เด™เตเด•เดฟเตฝ, เดŽเดจเตเดฑเต† เดชเตเดคเดฟเดฏ เดธเดฌเตโ€Œเดธเตโ€Œเด•เตเดฐเตˆเดฌเตผเดฎเดพเดฐเต† เดฒเดญเดฟเดšเตเดšเดคเดฟเตฝ เดžเดพเตป เดธเดจเตเดคเตเดทเตเดŸเดจเดพเดฃเต YouTube ะธ เดŸเต†เดฒเด—เตเดฐเดพเด‚ เดšเดพเดจเดฒเตเด•เตพ.

เดตเต‹เดŸเตเดŸเตเดจเต‡เดŸเตฝ

เด‡เดจเดฟเดชเตเดชเดฑเดฏเตเดจเตเดจ เดชเดพเด•เตเด•เต‡เดœเตเด•เดณเดฟเตฝ เดเดคเดพเดฃเต เดจเดฟเด™เตเด™เดณเตเดŸเต† เดœเต‹เดฒเดฟเดฏเดฟเตฝ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเต?

เด…เดญเดฟเดชเตเดฐเดพเดฏเด™เตเด™เดณเดฟเตฝ เดจเดฟเด™เตเด™เดณเตเดŸเต† เดคเดฟเดฐเดžเตเดžเต†เดŸเตเดชเตเดชเดฟเดจเตเดฑเต† เด•เดพเดฐเดฃเด‚ เดŽเดดเตเดคเดพเด‚.

เดฐเดœเดฟเดธเตเดฑเตเดฑเตผ เดšเต†เดฏเตเดค เด‰เดชเดฏเต‹เด•เตเดคเดพเด•เตเด•เตพเด•เตเด•เต เดฎเดพเดคเตเดฐเดฎเต‡ เดธเตผเดตเต‡เดฏเดฟเตฝ เดชเด™เตเด•เต†เดŸเตเด•เตเด•เดพเตป เด•เดดเดฟเดฏเต‚. เดธเตˆเตป เด‡เตปเดฆเดฏเดตเดพเดฏเดฟ.

เดเดคเต เดกเดพเดฑเตเดฑเดพ เดชเตเดฐเต‹เดธเดธเตเดธเดฟเด‚เด—เต เดชเดพเด•เตเด•เต‡เดœเดพเดฃเต เดจเดฟเด™เตเด™เตพ เด‰เดชเดฏเต‹เด—เดฟเด•เตเด•เตเดจเตเดจเดคเต (เดจเดฟเด™เตเด™เตพเด•เตเด•เต เดจเดฟเดฐเดตเดงเดฟ เด“เดชเตเดทเดจเตเด•เตพ เดคเดฟเดฐเดžเตเดžเต†เดŸเตเด•เตเด•เดพเด‚)

  • 45,2%เด•เตเดฐเดฎเด‚19

  • 33,3%data.table14

  • 54,8%เดชเดพเดฃเตเดŸเด•เตพ23

42 เด‰เดชเดฏเต‹เด•เตเดคเดพเด•เตเด•เตพ เดตเต‹เดŸเตเดŸเต เดšเต†เดฏเตเดคเต. 9 เด‰เดชเดฏเต‹เด•เตเดคเดพเด•เตเด•เตพ เดตเดฟเดŸเตเดŸเตเดจเดฟเดจเตเดจเต.

เด…เดตเดฒเด‚เดฌเด‚: www.habr.com

เด’เดฐเต เด…เดญเดฟเดชเตเดฐเดพเดฏเด‚ เดšเต‡เตผเด•เตเด•เตเด•