เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจ‡เฉฐเจŸเจฐเจจเฉˆเฉฑเจŸ 'เจคเฉ‡ เจ†เจฐ เจœเจพเจ‚ เจชเจพเจˆเจฅเจจ เจฆเฉ€ เจ–เฉ‹เจœ เจ•เจฐเจจ เจจเจพเจฒ, เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‡เจธ เจตเจฟเจธเจผเฉ‡ 'เจคเฉ‡ เจฒเฉฑเจ–เจพเจ‚ เจฒเฉ‡เจ– เจ…เจคเฉ‡ เจ•เจฟเจฒเฉ‹เจฎเฉ€เจŸเจฐ เจตเจฟเจšเจพเจฐ-เจตเจŸเจพเจ‚เจฆเจฐเฉ‡ เจฎเจฟเจฒเจฃเจ—เฉ‡ เจœเจฟเจจเฉเจนเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ‡เฉฑเจ• เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจฌเจฟเจนเจคเจฐ, เจคเฉ‡เจœเจผ เจ…เจคเฉ‡ เจตเจงเฉ‡เจฐเฉ‡ เจธเฉเจตเจฟเจงเจพเจœเจจเจ• เจนเฉˆเฅค เจชเจฐ เจฌเจฆเจ•เจฟเจธเจฎเจคเฉ€ เจจเจพเจฒ, เจ‡เจน เจธเจพเจฐเฉ‡ เจฒเฉ‡เจ– เจ…เจคเฉ‡ เจตเจฟเจตเจพเจฆ เจ–เจพเจธ เจคเฉŒเจฐ 'เจคเฉ‡ เจ‰เจชเจฏเฉ‹เจ—เฉ€ เจจเจนเฉ€เจ‚ เจนเจจ.

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจ‡เจธ เจฒเฉ‡เจ– เจฆเจพ เจ‰เจฆเฉ‡เจธเจผ เจฆเฉ‹เจตเจพเจ‚ เจญเจพเจธเจผเจพเจตเจพเจ‚ เจฆเฉ‡ เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจตเจฟเฉฑเจš เจฌเฉเจจเจฟเจ†เจฆเฉ€ เจกเจพเจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจคเจ•เจจเฉ€เจ•เจพเจ‚ เจฆเฉ€ เจคเฉเจฒเจจเจพ เจ•เจฐเจจเจพ เจนเฉˆเฅค เจ…เจคเฉ‡ เจชเจพเจ เจ•เจพเจ‚ เจจเฉ‚เฉฐ เจ•เจฟเจธเฉ‡ เจ…เจœเจฟเจนเฉ€ เจšเฉ€เจœเจผ เจตเจฟเฉฑเจš เจœเจฒเจฆเฉ€ เจฎเฉเจนเจพเจฐเจค เจนเจพเจธเจฒ เจ•เจฐเจจ เจตเจฟเฉฑเจš เจฎเจฆเจฆ เจ•เจฐเฉ‹ เจœเจฟเจธ เจฌเจพเจฐเฉ‡ เจ‰เจน เจ…เจœเฉ‡ เจคเฉฑเจ• เจจเจนเฉ€เจ‚ เจœเจพเจฃเจฆเฉ‡ เจนเจจเฅค เจ‰เจนเจจเจพเจ‚ เจฒเจˆ เจœเฉ‹ เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจฒเจฟเจ–เจฆเฉ‡ เจนเจจ, เจ‡เจน เจชเจคเจพ เจฒเจ—เจพเจ“ เจ•เจฟ R เจตเจฟเฉฑเจš เจ‰เจนเฉ€ เจ•เฉฐเจฎ เจ•เจฟเจตเฉ‡เจ‚ เจ•เจฐเจจเจพ เจนเฉˆ, เจ…เจคเฉ‡ เจ‡เจธเจฆเฉ‡ เจ‰เจฒเจŸ.

เจฒเฉ‡เจ– เจฆเฉ‡ เจฆเฉŒเจฐเจพเจจ เจ…เจธเฉ€เจ‚ เจ†เจฐ เจตเจฟเฉฑเจš เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจฆเฉ‡ เจธเฉฐเจŸเฉˆเจ•เจธ เจฆเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจ•เจฐเจพเจ‚เจ—เฉ‡เฅค เจ‡เจน เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจชเฉˆเจ•เฉ‡เจœ เจนเจจ tidyverseเจ…เจคเฉ‡ เจชเฉˆเจ•เฉ‡เจœ เจตเฉ€ data.table. เจ…เจคเฉ‡ เจ‰เจนเจจเจพเจ‚ เจฆเฉ‡ เจธเฉฐเจŸเฉˆเจ•เจธ เจจเจพเจฒ เจคเฉเจฒเจจเจพ เจ•เจฐเฉ‹ pandas, เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจกเจพเจŸเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจชเฉˆเจ•เฉ‡เจœเฅค

เจ…เจธเฉ€เจ‚ เจชเจพเจ‡เจฅเจจ เจ…เจคเฉ‡ เจ†เจฐ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹เจ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃเจพเจคเจฎเจ• เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจจเฉ‚เฉฐ เจฒเฉ‹เจก เจ•เจฐเจจ เจคเฉ‹เจ‚ เจฒเฉˆ เจ•เฉ‡ เจกเฉ‡เจŸเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจฆเฉ‡ เจชเฉ‚เจฐเฉ‡ เจฎเจพเจฐเจ— เจฆเฉเจ†เจฐเจพ เจ•เจฆเจฎ-เจฆเจฐ-เจ•เจฆเจฎ เจ…เฉฑเจ—เฉ‡ เจตเจงเจพเจ‚เจ—เฉ‡เฅค

เจธเจฎเฉฑเจ—เจฐเฉ€

เจ‡เจธ เจฒเฉ‡เจ– เจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจšเฉ€เจŸ เจธเจผเฉ€เจŸ เจตเจœเฉ‹เจ‚ เจตเจฐเจคเจฟเจ† เจœเจพ เจธเจ•เจฆเจพ เจนเฉˆ เจœเฉ‡เจ•เจฐ เจคเฉเจธเฉ€เจ‚ เจญเฉเฉฑเจฒ เจ—เจ เจนเฉ‹ เจ•เจฟ เจตเจฟเจšเจพเจฐ เจ…เจงเฉ€เจจ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ‡เฉฑเจ• เจตเจฟเฉฑเจš เจ•เฉเจ เจกเจพเจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจ•เจพเจฐเจตเจพเจˆ เจ•เจฟเจตเฉ‡เจ‚ เจ•เจฐเจจเฉ€ เจนเฉˆเฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

  1. R เจ…เจคเฉ‡ Python เจตเจฟเจšเจ•เจพเจฐ เจฎเฉเฉฑเจ– เจธเฉฐเจŸเฉˆเจ•เจธ เจ…เฉฐเจคเจฐ
    1.1. เจชเฉˆเจ•เฉ‡เจœ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจจเฉ‚เฉฐ เจเจ•เจธเฉˆเจธ เจ•เจฐเจจเจพ
    1.2. เจ…เจธเจพเจˆเจจเจฎเฉˆเจ‚เจŸ
    1.3. เจ‡เฉฐเจกเฉˆเจ•เจธเจฟเฉฐเจ—
    1.4. เจขเฉฐเจ— เจ…เจคเฉ‡ เจ“.เจ“.เจชเฉ€
    1.5. เจชเจพเจˆเจชเจฒเจพเจˆเจจเจพเจ‚
    1.6. เจกเจพเจŸเจพ เจฌเจฃเจคเจฐ
  2. เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจฌเจพเจฐเฉ‡ เจ•เฉเจ เจธเจผเจฌเจฆ เจœเฉ‹ เจ…เจธเฉ€เจ‚ เจตเจฐเจคเจพเจ‚เจ—เฉ‡
    2.1. เจธเฉเจฅเจฐเจพ
    2.2. เจกเฉ‡เจŸเจพ.เจŸเฉˆเจฌเจฒ
    2.3. เจชเฉฐเจกเจพเจธ
  3. เจชเฉˆเจ•เฉ‡เจœ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐ เจฐเจฟเจนเจพ เจนเฉˆ
  4. เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ
  5. เจกเจพเจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ
  6. เจคเฉเจนเจพเจจเฉ‚เฉฐ เจฒเฉ‹เฉœเฉ€เจ‚เจฆเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ€ เจšเฉ‹เจฃ เจ•เจฐเจจเจพ
  7. เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ
  8. เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ
  9. เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจฒเฉฐเจฌเจ•เจพเจฐเฉ€ เจธเฉฐเจ˜ (UNION)
  10. เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจนเจฐเฉ€เจœเฉฑเจŸเจฒ เจœเฉ‹เฉœ (เจธเจผเจพเจฎเจฒ)
  11. เจฎเฉ‚เจฒ เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ เจ…เจคเฉ‡ เจ—เจฃเจจเจพ เจ•เฉ€เจคเฉ‡ เจ•เจพเจฒเจฎ
  12. R เจ…เจคเฉ‡ Python เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจตเจฟเจงเฉ€เจ†เจ‚ เจตเจฟเจšเจ•เจพเจฐ เจชเฉฑเจคเจฐ เจตเจฟเจนเจพเจฐ เจธเจพเจฐเจฃเฉ€
  13. เจธเจฟเฉฑเจŸเจพ
  14. เจคเฉเจธเฉ€เจ‚ เจ•เจฟเจธ เจชเฉˆเจ•เฉ‡เจœ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹ เจ‡เจธ เจฌเจพเจฐเฉ‡ เจ‡เฉฑเจ• เจ›เฉ‹เจŸเจพ เจธเจฐเจตเฉ‡เจ–เจฃ

เจœเฉ‡ เจคเฉเจธเฉ€เจ‚ เจกเฉ‡เจŸเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจตเจฟเฉฑเจš เจฆเจฟเจฒเจšเจธเจชเฉ€ เจฐเฉฑเจ–เจฆเฉ‡ เจนเฉ‹, เจคเจพเจ‚ เจคเฉเจธเฉ€เจ‚ เจฎเฉ‡เจฐเจพ เจฒเฉฑเจญ เจธเจ•เจฆเฉ‡ เจนเฉ‹ เจคเจพเจฐ ะธ YouTube เจšเฉˆเจจเจฒเฅค เจœเจผเจฟเจ†เจฆเจพเจคเจฐ เจธเจฎเฉฑเจ—เจฐเฉ€ เจ†เจฐ เจญเจพเจธเจผเจพ เจจเฉ‚เฉฐ เจธเจฎเจฐเจชเจฟเจค เจนเฉˆเฅค

R เจ…เจคเฉ‡ Python เจตเจฟเจšเจ•เจพเจฐ เจฎเฉเฉฑเจ– เจธเฉฐเจŸเฉˆเจ•เจธ เจ…เฉฐเจคเจฐ

เจคเฉเจนเจพเจกเฉ‡ เจฒเจˆ Python เจคเฉ‹เจ‚ R เจตเจฟเฉฑเจš เจธเจตเจฟเจš เจ•เจฐเจจเจพ เจ†เจธเจพเจจ เจฌเจฃเจพเจ‰เจฃ เจฒเจˆ, เจœเจพเจ‚ เจ‡เจธเจฆเฉ‡ เจ‰เจฒเจŸ, เจฎเฉˆเจ‚ เจ•เฉเจ เจฎเฉเฉฑเจ– เจจเฉเจ•เจคเฉ‡ เจฆเฉ‡เจตเจพเจ‚เจ—เจพ เจœเจฟเจจเฉเจนเจพเจ‚ เจตเฉฑเจฒ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจงเจฟเจ†เจจ เจฆเฉ‡เจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆเฅค

เจชเฉˆเจ•เฉ‡เจœ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจจเฉ‚เฉฐ เจเจ•เจธเฉˆเจธ เจ•เจฐเจจเจพ

เจ‡เฉฑเจ• เจตเจพเจฐ เจ‡เฉฑเจ• เจชเฉˆเจ•เฉ‡เจœ เจจเฉ‚เฉฐ R เจตเจฟเฉฑเจš เจฒเฉ‹เจก เจ•เจฐเจจ เจคเฉ‹เจ‚ เจฌเจพเจ…เจฆ, เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‡เจธเจฆเฉ‡ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจจเฉ‚เฉฐ เจเจ•เจธเฉˆเจธ เจ•เจฐเจจ เจฒเจˆ เจชเฉˆเจ•เฉ‡เจœ เจฆเจพ เจจเจพเจฎ เจฆเฉ‡เจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจจเจนเฉ€เจ‚ เจนเฉˆเฅค เจœเจผเจฟเจ†เจฆเจพเจคเจฐ เจฎเจพเจฎเจฒเจฟเจ†เจ‚ เจตเจฟเฉฑเจš เจ‡เจน เจ†เจฐ เจตเจฟเฉฑเจš เจ†เจฎ เจจเจนเฉ€เจ‚ เจนเฉˆ, เจชเจฐ เจ‡เจน เจธเจตเฉ€เจ•เจพเจฐเจฏเฉ‹เจ— เจนเฉˆเฅค เจœเฉ‡เจ•เจฐ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ†เจชเจฃเฉ‡ เจ•เฉ‹เจก เจตเจฟเฉฑเจš เจ‡เจธเจฆเฉ‡ เจ•เจฟเจธเฉ‡ เจ‡เฉฑเจ• เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจœเจผเจฐเฉ‚เจฐเจค เจนเฉˆ เจคเจพเจ‚ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจชเฉˆเจ•เฉ‡เจœ เจจเฉ‚เฉฐ เจ†เจฏเจพเจค เจ•เจฐเจจ เจฆเฉ€ เจœเจผเจฐเฉ‚เจฐเจค เจจเจนเฉ€เจ‚ เจนเฉˆ, เจชเจฐ เจชเฉˆเจ•เฉ‡เจœ เจฆเจพ เจจเจพเจฎ เจ…เจคเฉ‡ เจซเฉฐเจ•เจธเจผเจจ เจฆเจพ เจจเจพเจฎ เจจเจฟเจฐเจงเจพเจฐเจค เจ•เจฐเจ•เฉ‡ เจ‡เจธเจจเฉ‚เฉฐ เจ•เจพเจฒ เจ•เจฐเฉ‹เฅค R เจตเจฟเฉฑเจš เจชเฉˆเจ•เฉ‡เจœ เจ…เจคเฉ‡ เจซเฉฐเจ•เจธเจผเจจ เจจเจพเจฎเจพเจ‚ เจตเจฟเจšเจ•เจพเจฐ เจตเจฟเจญเจพเจœเจ• เจ‡เฉฑเจ• เจกเจฌเจฒ เจ•เฉ‹เจฒเฉ‹เจจ เจนเฉˆเฅค package_name::function_name().

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš, เจ‡เจธเจฆเฉ‡ เจ‰เจฒเจŸ, เจ‡เฉฑเจ• เจชเฉˆเจ•เฉ‡เจœ เจฆเฉ‡ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจจเฉ‚เฉฐ เจธเจชเจธเจผเจŸ เจคเฉŒเจฐ เจคเฉ‡ เจ‡เจธเจฆเจพ เจจเจพเจฎ เจฆเฉฑเจธ เจ•เฉ‡ เจ•เจพเจฒ เจ•เจฐเจจเจพ เจ•เจฒเจพเจธเจฟเจ• เจฎเฉฐเจจเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค เจœเจฆเฉ‹เจ‚ เจ‡เฉฑเจ• เจชเฉˆเจ•เฉ‡เจœ เจกเจพเจŠเจจเจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆ, เจคเจพเจ‚ เจ‡เจธเจจเฉ‚เฉฐ เจ†เจฎ เจคเฉŒเจฐ 'เจคเฉ‡ เจ‡เฉฑเจ• เจ›เฉ‹เจŸเจพ เจจเจพเจฎ เจฆเจฟเฉฑเจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆ, เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆ. pandas เจ†เจฎ เจคเฉŒเจฐ 'เจคเฉ‡ เจ‡เฉฑเจ• เจ‰เจชเจจเจพเจฎ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ pd. เจ‡เฉฑเจ• เจชเฉˆเจ•เฉ‡เจœ เจซเฉฐเจ•เจธเจผเจจ เจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจฌเจฟเฉฐเจฆเฉ€ เจฆเฉเจ†เจฐเจพ เจเจ•เจธเฉˆเจธ เจ•เฉ€เจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆ package_name.function_name().

เจ…เจธเจพเจˆเจจเจฎเฉˆเจ‚เจŸ

R เจตเจฟเฉฑเจš, เจ•เจฟเจธเฉ‡ เจตเจธเจคเฉ‚ เจจเฉ‚เฉฐ เจฎเฉเฉฑเจฒ เจจเจฟเจฐเจงเจพเจฐเจค เจ•เจฐเจจ เจฒเจˆ เจ‡เฉฑเจ• เจคเฉ€เจฐ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจเจพ เจ†เจฎ เจ—เฉฑเจฒ เจนเฉˆเฅค obj_name <- value, เจนเจพเจฒเจพเจ‚เจ•เจฟ เจ‡เฉฑเจ• เจธเจฟเฉฐเจ—เจฒ เจฌเจฐเจพเจฌเจฐ เจšเจฟเฉฐเจจเฉเจน เจฆเฉ€ เจ‡เจœเจพเจœเจผเจค เจนเฉˆ, R เจตเจฟเฉฑเจš เจธเจฟเฉฐเจ—เจฒ เจฌเจฐเจพเจฌเจฐ เจšเจฟเฉฐเจจเฉเจน เจฎเฉเฉฑเจ– เจคเฉŒเจฐ 'เจคเฉ‡ เจซเฉฐเจ•เจธเจผเจจ เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸเจพเจ‚ เจจเฉ‚เฉฐ เจฎเฉเฉฑเจฒ เจชเจพเจธ เจ•เจฐเจจ เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš, เจ…เจธเจพเจˆเจจเจฎเฉˆเจ‚เจŸ เจตเจฟเจธเจผเฉ‡เจธเจผ เจคเฉŒเจฐ 'เจคเฉ‡ เจธเจฟเฉฐเจ—เจฒ เจฌเจฐเจพเจฌเจฐ เจšเจฟเฉฐเจจเฉเจน เจจเจพเจฒ เจ•เฉ€เจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆ obj_name = value.

เจ‡เฉฐเจกเฉˆเจ•เจธเจฟเฉฐเจ—

เจ‡เฉฑเจฅเฉ‡ เจตเฉ€ เจ•เจพเจซเจผเฉ€ เจฎเจนเฉฑเจคเจตเจชเฉ‚เจฐเจจ เจ…เฉฐเจคเจฐ เจนเจจ. R เจตเจฟเฉฑเจš, เจ‡เฉฐเจกเฉˆเจ•เจธเจฟเฉฐเจ— เจ‡เฉฑเจ• เจคเฉ‹เจ‚ เจธเจผเฉเจฐเฉ‚ เจนเฉเฉฐเจฆเฉ€ เจนเฉˆ เจ…เจคเฉ‡ เจจเจคเฉ€เจœเฉ‡ เจตเจพเจฒเฉ€ เจฐเฉ‡เจ‚เจœ เจตเจฟเฉฑเจš เจธเจพเจฐเฉ‡ เจจเจฟเจฐเจงเจพเจฐเจค เจคเฉฑเจค เจธเจผเจพเจฎเจฒ เจ•เจฐเจฆเฉ€ เจนเฉˆ,

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš, เจ‡เฉฐเจกเฉˆเจ•เจธเจฟเฉฐเจ— เจœเจผเฉ€เจฐเฉ‹ เจคเฉ‹เจ‚ เจธเจผเฉเจฐเฉ‚ เจนเฉเฉฐเจฆเฉ€ เจนเฉˆ เจ…เจคเฉ‡ เจšเฉเจฃเฉ€ เจ—เจˆ เจฐเฉ‡เจ‚เจœ เจตเจฟเฉฑเจš เจธเฉ‚เจšเจ•เจพเจ‚เจ• เจตเจฟเฉฑเจš เจจเจฟเจฐเจงเจพเจฐเจค เจ†เจ–เจฐเฉ€ เจคเฉฑเจค เจธเจผเจพเจฎเจฒ เจจเจนเฉ€เจ‚ เจนเฉเฉฐเจฆเจพ เจนเฉˆเฅค เจ‡เจธ เจฒเจˆ เจกเจฟเจœเจผเจพเจˆเจจ x[i:j] เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจœเฉ‡ เจเจฒเฉ€เจฎเฉˆเจ‚เจŸ เจธเจผเจพเจฎเจฒ เจจเจนเฉ€เจ‚ เจนเฉ‹เจตเฉ‡เจ—เจพเฅค

เจ†เจฐ เจจเฉ‹เจŸเฉ‡เจธเจผเจจ เจตเจฟเฉฑเจš, เจจเจ•เจพเจฐเจพเจคเจฎเจ• เจธเฉ‚เจšเจ•เจพเจ‚เจ• เจตเจฟเฉฑเจš เจตเฉ€ เจ…เฉฐเจคเจฐ เจนเจจ x[-1] เจ†เจ–เจฐเฉ€ เจจเฉ‚เฉฐ เจ›เฉฑเจก เจ•เฉ‡ เจตเฉˆเจ•เจŸเจฐ เจฆเฉ‡ เจธเจพเจฐเฉ‡ เจคเฉฑเจค เจตเจพเจชเจธ เจ•เจฐ เจฆเฉ‡เจตเฉ‡เจ—เจพเฅค เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš, เจ‡เฉฑเจ• เจธเจฎเจพเจจ เจธเฉฐเจ•เฉ‡เจค เจ•เฉ‡เจตเจฒ เจ†เจ–เจฐเฉ€ เจคเฉฑเจค เจตเจพเจชเจธ เจ•เจฐเฉ‡เจ—เจพเฅค

เจขเฉฐเจ— เจ…เจคเฉ‡ เจ“.เจ“.เจชเฉ€

เจ†เจฐ เจ“เจ“เจชเฉ€ เจจเฉ‚เฉฐ เจ†เจชเจฃเฉ‡ เจคเจฐเฉ€เจ•เฉ‡ เจจเจพเจฒ เจฒเจพเจ—เฉ‚ เจ•เจฐเจฆเจพ เจนเฉˆ, เจฎเฉˆเจ‚ เจ‡เจธ เจฌเจพเจฐเฉ‡ เจฒเฉ‡เจ– เจตเจฟเฉฑเจš เจฒเจฟเจ–เจฟเจ† เจธเฉ€ "เจ†เจฐ เจญเจพเจธเจผเจพ เจตเจฟเฉฑเจš OOP (เจญเจพเจ— 1): S3 เจ•เจฒเจพเจธเจพเจ‚". เจ†เจฎ เจคเฉŒเจฐ 'เจคเฉ‡, R เจ‡เฉฑเจ• เจ•เจพเจฐเจœเจธเจผเฉ€เจฒ เจญเจพเจธเจผเจพ เจนเฉˆ, เจ…เจคเฉ‡ เจ‡เจธ เจตเจฟเฉฑเจš เจนเจฐ เจšเฉ€เจœเจผ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ 'เจคเฉ‡ เจฌเจฃเฉ€ เจนเฉ‹เจˆ เจนเฉˆเฅค เจ‡เจธ เจฒเจˆ, เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆ, เจเจ•เจธเจฒ เจ‰เจชเจญเฉ‹เจ—เจคเจพเจตเจพเจ‚ เจฒเจˆ, 'เจคเฉ‡ เจœเจพเจ“ tydiverse เจ‡เจธ เจจเฉ‚เฉฐ เจตเฉฑเจง เจ†เจธเจพเจจ เจนเฉ‹ เจœเจพเจตเฉ‡เจ—เจพ pandas. เจนเจพเจฒเจพเจ‚เจ•เจฟ เจ‡เจน เจฎเฉ‡เจฐเฉ€ เจตเจฟเจ…เจ•เจคเฉ€เจ—เจค เจฐเจพเจ เจนเฉ‹ เจธเจ•เจฆเฉ€ เจนเฉˆเฅค

เจธเฉฐเจ–เฉ‡เจช เจฐเฉ‚เจช เจตเจฟเฉฑเจš, เจ†เจฐ เจตเจฟเฉฑเจš เจตเจธเจคเฉ‚เจ†เจ‚ เจตเจฟเฉฑเจš เจตเจฟเจงเฉ€เจ†เจ‚ เจจเจนเฉ€เจ‚ เจนเฉเฉฐเจฆเฉ€เจ†เจ‚ เจนเจจ (เจœเฉ‡ เจ…เจธเฉ€เจ‚ S3 เจ•เจฒเจพเจธเจพเจ‚ เจฌเจพเจฐเฉ‡ เจ—เฉฑเจฒ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚, เจชเจฐ เจนเฉ‹เจฐ OOP เจฒเจพเจ—เฉ‚เจ•เจฐเจจ เจนเจจ เจœเฉ‹ เจฌเจนเฉเจค เจ˜เฉฑเจŸ เจ†เจฎ เจนเจจ)เฅค เจ‡เฉฑเจฅเฉ‡ เจธเจฟเจฐเจซ เจ†เจฎ เจซเฉฐเจ•เจธเจผเจจ เจนเจจ เจœเฉ‹ เจ†เจฌเจœเฉˆเจ•เจŸ เจฆเฉ€ เจธเจผเฉเจฐเฉ‡เจฃเฉ€ เจฆเฉ‡ เจ…เจงเจพเจฐ เจคเฉ‡ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจตเฉฑเจ–เจฐเฉ‡ เจคเฉŒเจฐ 'เจคเฉ‡ เจชเฉเจฐเจ•เจฟเจฐเจฟเจ† เจ•เจฐเจฆเฉ‡ เจนเจจเฅค

เจชเจพเจˆเจชเจฒเจพเจˆเจจเจพเจ‚

เจธเจผเจพเจ‡เจฆ เจ‡เจน เจ‡เจธ เจฒเจˆ เจจเจพเจฎ เจนเฉˆ pandas เจ‡เจน เจชเฉ‚เจฐเฉ€ เจคเจฐเฉเจนเจพเจ‚ เจธเจนเฉ€ เจจเจนเฉ€เจ‚ เจนเฉ‹เจตเฉ‡เจ—เจพ, เจชเจฐ เจฎเฉˆเจ‚ เจ‡เจธเจฆเจพ เจฎเจคเจฒเจฌ เจธเจฎเจเจพเจ‰เจฃ เจฆเฉ€ เจ•เฉ‹เจธเจผเจฟเจธเจผ เจ•เจฐเจพเจ‚เจ—เจพเฅค

เจตเจฟเจšเจ•เจพเจฐเจฒเฉ‡ เจ—เจฃเจจเจพเจตเจพเจ‚ เจจเฉ‚เฉฐ เจฌเจšเจพเจ‰เจฃ เจ…เจคเฉ‡ เจ•เฉฐเจฎ เจ•เจฐเจจ เจตเจพเจฒเฉ‡ เจตเจพเจคเจพเจตเจฐเจฃ เจตเจฟเฉฑเจš เจฌเฉ‡เจฒเฉ‹เฉœเฉ€เจ†เจ‚ เจตเจธเจคเฉ‚เจ†เจ‚ เจจเฉ‚เฉฐ เจชเฉˆเจฆเจพ เจจเจพ เจ•เจฐเจจ เจฒเจˆ, เจคเฉเจธเฉ€เจ‚ เจ‡เฉฑเจ• เจ•เจฟเจธเจฎ เจฆเฉ€ เจชเจพเจˆเจชเจฒเจพเจˆเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเฉ‹. เจ‰เจน. เจ‡เฉฑเจ• เจ—เจฃเจจเจพ เจฆเฉ‡ เจจเจคเฉ€เจœเฉ‡ เจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจซเฉฐเจ•เจธเจผเจจ เจคเฉ‹เจ‚ เจ…เจ—เจฒเฉ‡ เจตเจฟเฉฑเจš เจชเจพเจธ เจ•เจฐเฉ‹, เจ…เจคเฉ‡ เจตเจฟเจšเจ•เจพเจฐเจฒเฉ‡ เจจเจคเฉ€เจœเจฟเจ†เจ‚ เจจเฉ‚เฉฐ เจธเฉเจฐเฉฑเจ–เจฟเจ…เจค เจจเจพ เจ•เจฐเฉ‹เฅค

เจ†เจ‰ เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ‡ เจ•เฉ‹เจก เจฆเฉ€ เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆเจ, เจœเจฟเฉฑเจฅเฉ‡ เจ…เจธเฉ€เจ‚ เจตเฉฑเจ–เจฐเฉ‡ เจ†เจฌเจœเฉˆเจ•เจŸ เจตเจฟเฉฑเจš เจตเจฟเจšเจ•เจพเจฐเจฒเฉ‡ เจ—เจฃเจจเจพเจตเจพเจ‚ เจจเฉ‚เฉฐ เจธเจŸเฉ‹เจฐ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚:

temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )

เจ…เจธเฉ€เจ‚ เจ•เฉเจฐเจฎเจตเจพเจฐ 3 เจ“เจชเจฐเฉ‡เจธเจผเจจ เจ•เฉ€เจคเฉ‡, เจ…เจคเฉ‡ เจนเจฐเฉ‡เจ• เจฆเจพ เจจเจคเฉ€เจœเจพ เจ‡เฉฑเจ• เจตเฉฑเจ–เจฐเฉ€ เจตเจธเจคเฉ‚ เจตเจฟเฉฑเจš เจธเฉเจฐเฉฑเจ–เจฟเจ…เจค เจ•เฉ€เจคเจพ เจ—เจฟเจ† เจธเฉ€เฅค เจชเจฐ เจ…เจธเจฒ เจตเจฟเฉฑเจš, เจธเจพเจจเฉ‚เฉฐ เจ‡เจนเจจเจพเจ‚ เจตเจฟเจšเจ•เจพเจฐเจฒเฉ‡ เจตเจธเจคเฉ‚เจ†เจ‚ เจฆเฉ€ เจฒเฉ‹เฉœ เจจเจนเฉ€เจ‚ เจนเฉˆเฅค

เจœเจพเจ‚ เจ‡เจธ เจคเฉ‹เจ‚ เจตเฉ€ เจฎเจพเฉœเจพ, เจชเจฐ เจเจ•เจธเจฒ เจ‰เจชเจญเฉ‹เจ—เจคเจพเจตเจพเจ‚ เจฒเจˆ เจตเจงเฉ‡เจฐเฉ‡ เจœเจพเจฃเฉ‚เฅค

obj  <- func3(func2(func1()))

เจ‡เจธ เจธเจฅเจฟเจคเฉ€ เจตเจฟเฉฑเจš, เจ…เจธเฉ€เจ‚ เจตเจฟเจšเจ•เจพเจฐเจฒเฉ‡ เจ—เจฃเจจเจพ เจฆเฉ‡ เจจเจคเฉ€เจœเจฟเจ†เจ‚ เจจเฉ‚เฉฐ เจธเฉเจฐเฉฑเจ–เจฟเจ…เจค เจจเจนเฉ€เจ‚ เจ•เฉ€เจคเจพ, เจชเจฐ เจจเฉ‡เจธเจŸเจก เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเฉ‡ เจจเจพเจฒ เจ•เฉ‹เจก เจจเฉ‚เฉฐ เจชเฉœเฉเจนเจจเจพ เจฌเจนเฉเจค เจ…เจธเฉเจตเจฟเจงเจพเจœเจจเจ• เจนเฉˆเฅค

เจ…เจธเฉ€เจ‚ R เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจฒเจˆ เจ•เจˆ เจชเจนเฉเฉฐเจšเจพเจ‚ เจจเฉ‚เฉฐ เจฆเฉ‡เจ–เจพเจ‚เจ—เฉ‡, เจ…เจคเฉ‡ เจ‰เจน เจตเฉฑเจ–-เจตเฉฑเจ– เจคเจฐเฉ€เจ•เจฟเจ†เจ‚ เจจเจพเจฒ เจธเจฎเจพเจจ เจ•เจพเจฐเจตเจพเจˆเจ†เจ‚ เจ•เจฐเจฆเฉ‡ เจนเจจเฅค

เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจตเจฟเฉฑเจš เจชเจพเจˆเจชเจฒเจพเจˆเจจเจพเจ‚ tidyverse เจ†เจชเจฐเฉ‡เจŸเจฐ เจฆเฉเจ†เจฐเจพ เจฒเจพเจ—เฉ‚ เจ•เฉ€เจคเจพ เจ—เจฟเจ† เจนเฉˆ %>%.

obj <- func1() %>% 
            func2() %>%
            func3()

เจ‡เจธ เจคเจฐเฉเจนเจพเจ‚ เจ…เจธเฉ€เจ‚ เจ•เฉฐเจฎ เจฆเจพ เจจเจคเฉ€เจœเจพ เจฒเฉˆเจ‚เจฆเฉ‡ เจนเจพเจ‚ func1() เจ…เจคเฉ‡ เจ‡เจธเจจเฉ‚เฉฐ เจชเจนเจฟเจฒเฉ€ เจฆเจฒเฉ€เจฒ เจตเจœเฉ‹เจ‚ เจชเจพเจธ เจ•เจฐเฉ‹ func2(), เจซเจฟเจฐ เจ…เจธเฉ€เจ‚ เจ‡เจธ เจ—เจฃเจจเจพ เจฆเฉ‡ เจจเจคเฉ€เจœเฉ‡ เจจเฉ‚เฉฐ เจชเจนเจฟเจฒเฉ€ เจฆเจฒเฉ€เจฒ เจตเจœเฉ‹เจ‚ เจชเจพเจธ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚ func3(). เจ…เจคเฉ‡ เจ…เฉฐเจค เจตเจฟเฉฑเจš, เจ…เจธเฉ€เจ‚ เจตเจธเจคเฉ‚ เจตเจฟเฉฑเจš เจ•เฉ€เจคเฉ€เจ†เจ‚ เจ—เจˆเจ†เจ‚ เจธเจพเจฐเฉ€เจ†เจ‚ เจ—เจฃเจจเจพเจตเจพเจ‚ เจฒเจฟเจ–เจฆเฉ‡ เจนเจพเจ‚ obj <-.

เจ‰เจชเจฐเฉ‹เจ•เจค เจธเจพเจฐเฉ‡ เจจเฉ‚เฉฐ เจ‡เจธ เจฎเฉ€เจฎ เจฆเฉเจ†เจฐเจพ เจธเจผเจฌเจฆเจพเจ‚ เจจเจพเจฒเฉ‹เจ‚ เจฌเจฟเจนเจคเจฐ เจฆเจฐเจธเจพเจ‡เจ† เจ—เจฟเจ† เจนเฉˆ:
เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

ะ’ data.table เจšเฉ‡เจจเจพเจ‚ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ‡เจธเฉ‡ เจคเจฐเฉเจนเจพเจ‚ เจ•เฉ€เจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆเฅค

newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]

เจนเจฐเฉ‡เจ• เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจคเฉเจธเฉ€เจ‚ เจชเจฟเจ›เจฒเฉ€ เจ•เจพเจฐเจตเจพเจˆ เจฆเฉ‡ เจจเจคเฉ€เจœเฉ‡ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเฉ‹เฅค

ะ’ pandas เจ…เจœเจฟเจนเฉ‡ เจ“เจชเจฐเฉ‡เจธเจผเจจเจพเจ‚ เจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจฌเจฟเฉฐเจฆเฉ€ เจฆเฉเจ†เจฐเจพ เจตเฉฑเจ– เจ•เฉ€เจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค

obj = df.fun1().fun2().fun3()

เจ‰เจน. เจ…เจธเฉ€เจ‚ เจ†เจชเจฃเจพ เจฎเฉ‡เจœเจผ เจฒเฉˆเจ‚เจฆเฉ‡ เจนเจพเจ‚ df เจ…เจคเฉ‡ เจ‰เจธเจฆเฉ€ เจตเจฟเจงเฉ€ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ‹ fun1(), เจซเจฟเจฐ เจ…เจธเฉ€เจ‚ เจชเฉเจฐเจพเจชเจค เจจเจคเฉ€เจœเฉ‡ 'เจคเฉ‡ เจตเจฟเจงเฉ€ เจจเฉ‚เฉฐ เจฒเจพเจ—เฉ‚ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚ fun2(), เจฆเฉ‡ เจฌเจพเจ…เจฆ fun3(). เจจเจคเฉ€เจœเจพ เจจเจคเฉ€เจœเจพ เจ‡เฉฑเจ• เจตเจธเจคเฉ‚ เจตเจฟเฉฑเจš เจธเฉเจฐเฉฑเจ–เจฟเจ…เจค เจ•เฉ€เจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆ obj .

เจกเจพเจŸเจพ เจฌเจฃเจคเจฐ

R เจ…เจคเฉ‡ Python เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฌเจฃเจคเจฐ เจธเจฎเจพเจจ เจนเจจ, เจชเจฐ เจตเฉฑเจ–-เจตเฉฑเจ– เจจเจพเจฎ เจนเจจเฅค

เจตเฉ‡เจฐเจตเจพ
เจตเจฟเฉฑเจš เจจเจพเจฎ เจ†เจฐ
Python/pandas เจตเจฟเฉฑเจš เจจเจพเจฎ

เจŸเฉ‡เจฌเจฒ เจฌเจฃเจคเจฐ
data.frame, data.table, tibble
เจกเจพเจŸเจพเจซเฉเจฐเฉ‡เจฎ

เจฎเฉเฉฑเจฒเจพเจ‚ เจฆเฉ€ เจ‡เฉฑเจ•-เจ…เจฏเจพเจฎเฉ€ เจธเฉ‚เจšเฉ€
เจตเฉˆเจ•เจŸเจฐ
เจชเจพเจ‚เจกเจพ เจตเจฟเฉฑเจš เจฒเฉœเฉ€ เจœเจพเจ‚ เจธเจผเฉเฉฑเจง เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจธเฉ‚เจšเฉ€

เจฌเจนเฉ-เจชเฉฑเจงเจฐเฉ€ เจ—เฉˆเจฐ-เจธเจพเจฐเจฃเฉ€ เจฌเจฃเจคเจฐ
เจธเฉ‚เจšเฉ€
เจธเจผเจฌเจฆเจ•เฉ‹เจธเจผ (เจกเจฟเจ•เจŸ)

เจ…เจธเฉ€เจ‚ เจนเฉ‡เจ เจพเจ‚ เจ•เฉเจ เจนเฉ‹เจฐ เจตเจฟเจธเจผเฉ‡เจธเจผเจคเจพเจตเจพเจ‚ เจ…เจคเฉ‡ เจธเฉฐเจŸเฉˆเจ•เจธ เจตเจฟเฉฑเจš เจ…เฉฐเจคเจฐ เจฆเฉ‡เจ–เจพเจ‚เจ—เฉ‡เฅค

เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจฌเจพเจฐเฉ‡ เจ•เฉเจ เจธเจผเจฌเจฆ เจœเฉ‹ เจ…เจธเฉ€เจ‚ เจตเจฐเจคเจพเจ‚เจ—เฉ‡

เจชเจนเจฟเจฒเจพเจ‚, เจฎเฉˆเจ‚ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‰เจนเจจเจพเจ‚ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจฌเจพเจฐเฉ‡ เจฅเฉ‹เฉœเจพ เจœเจฟเจนเจพ เจฆเฉฑเจธเจพเจ‚เจ—เจพ เจœเจฟเจจเฉเจนเจพเจ‚ เจคเฉ‹เจ‚ เจคเฉเจธเฉ€เจ‚ เจ‡เจธ เจฒเฉ‡เจ– เจฆเฉ‡ เจฆเฉŒเจฐเจพเจจ เจœเจพเจฃเฉ‚ เจนเฉ‹เจตเฉ‹เจ—เฉ‡.

เจธเฉเจฅเจฐเจพ

เจธเจฐเจ•เจพเจฐเฉ€ เจตเฉˆเจฌเจธเจพเจˆเจŸ: tidyverse.org
เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ
เจฒเจพเจ‡เจฌเจฐเฉ‡เจฐเฉ€ เจจเฉ‚เฉฐ tidyverse RStudio เจฆเฉ‡ เจธเฉ€เจจเฉ€เจ…เจฐ เจฐเจฟเจธเจฐเจš เจธเจพเจ‡เฉฐเจŸเจฟเจธเจŸ เจนเฉ‡เจกเจฒเฉ€ เจตเจฟเฉฑเจ•เจฎ เจฆเฉเจ†เจฐเจพ เจฒเจฟเจ–เจฟเจ† เจ—เจฟเจ†เฅค tidyverse เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจฆเจพ เจ‡เฉฑเจ• เจชเฉเจฐเจญเจพเจตเจธเจผเจพเจฒเฉ€ เจธเจฎเฉ‚เจน เจนเฉˆ เจœเฉ‹ เจกเฉ‡เจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจจเฉ‚เฉฐ เจธเจฐเจฒ เจฌเจฃเจพเจ‰เจ‚เจฆเจพ เจนเฉˆ, เจœเจฟเจจเฉเจนเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ 5 CRAN เจฐเจฟเจชเฉ‹เจœเจผเจŸเจฐเฉ€ เจคเฉ‹เจ‚ เจšเฉ‹เจŸเฉ€ เจฆเฉ‡ 10 เจกเจพเจŠเจจเจฒเฉ‹เจกเจพเจ‚ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจนเจจเฅค

เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจฆเฉ‡ เจ•เฉ‹เจฐ เจตเจฟเฉฑเจš เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ‡ เจชเฉˆเจ•เฉ‡เจœ เจนเฉเฉฐเจฆเฉ‡ เจนเจจ: ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats. เจ‡เจนเจจเจพเจ‚ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจนเจฐเฉ‡เจ• เจฆเจพ เจ‰เจฆเฉ‡เจธเจผ เจ‡เฉฑเจ• เจ–เจพเจธ เจธเจฎเฉฑเจธเจฟเจ† เจจเฉ‚เฉฐ เจนเฉฑเจฒ เจ•เจฐเจจเจพ เจนเฉˆเฅค เจ‰เจฆเจพเจนเจฐเจฃ เจฒเจˆ dplyr เจกเจพเจŸเจพ เจนเฉ‡เจฐเจพเจซเฉ‡เจฐเฉ€ เจฒเจˆ เจฌเจฃเจพเจ‡เจ† เจ—เจฟเจ†, tidyr เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจธเฉเจšเฉฑเจœเฉ‡ เจฐเฉ‚เจช เจตเจฟเฉฑเจš เจฒเจฟเจ†เจ‰เจฃ เจฒเจˆ, stringr เจธเจคเจฐ เจฆเฉ‡ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจเจพ เจธเฉŒเจ–เจพ เจฌเจฃเจพเจ‰เจ‚เจฆเจพ เจนเฉˆ, เจ…เจคเฉ‡ ggplot2 เจธเจญ เจคเฉ‹เจ‚ เจชเฉเจฐเจธเจฟเฉฑเจง เจกเฉ‡เจŸเจพ เจตเจฟเจœเจผเฉ‚เจ…เจฒเจพเจˆเจœเจผเฉ‡เจธเจผเจจ เจŸเฉ‚เจฒเจธ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ‡เฉฑเจ• เจนเฉˆเฅค

เจซเจพเจ‡เจฆเจพ tidyverse เจธเจพเจฆเจ—เฉ€ เจ…เจคเฉ‡ เจธเฉฐเจŸเฉˆเจ•เจธ เจจเฉ‚เฉฐ เจชเฉœเฉเจนเจจ เจตเจฟเฉฑเจš เจ†เจธเจพเจจ เจนเฉˆ, เจœเฉ‹ เจ•เจฟ เจฌเจนเฉเจค เจธเจพเจฐเฉ‡ เจคเจฐเฉ€เจ•เจฟเจ†เจ‚ เจจเจพเจฒ SQL เจชเฉเฉฑเจ›เจ—เจฟเฉฑเจ› เจญเจพเจธเจผเจพ เจฆเฉ‡ เจธเจฎเจพเจจ เจนเฉˆเฅค

เจกเฉ‡เจŸเจพ.เจŸเฉˆเจฌเจฒ

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพเจธเจฐเจ•เจพเจฐเฉ€ เจตเฉˆเจฌเจธเจพเจˆเจŸ: r-datatable.com

เจฒเฉ‡เจ–เจ• data.table H2O.ai เจฆเจพ เจฎเฉˆเจŸ เจกเฉ‹เจฒ เจนเฉˆเฅค

เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจฆเฉ€ เจชเจนเจฟเจฒเฉ€ เจฐเจฟเจฒเฉ€เจœเจผ 2006 เจตเจฟเฉฑเจš เจนเฉ‹เจˆ เจธเฉ€เฅค

เจชเฉˆเจ•เฉ‡เจœ เจธเฉฐเจŸเฉˆเจ•เจธ เจ‡เฉฐเจจเจพ เจธเฉเจตเจฟเจงเจพเจœเจจเจ• เจจเจนเฉ€เจ‚ เจนเฉˆ เจœเจฟเฉฐเจจเจพ เจตเจฟเฉฑเจš tidyverse เจ…เจคเฉ‡ R เจตเจฟเฉฑเจš เจ•เจฒเจพเจธเจฟเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎเจพเจ‚ เจฆเฉ€ เจตเจงเฉ‡เจฐเฉ‡ เจฏเจพเจฆ เจฆเจฟเจตเจพเจ‰เจ‚เจฆเจพ เจนเฉˆ, เจชเจฐ เจ‰เจธเฉ‡ เจธเจฎเฉ‡เจ‚ เจ•เจพเจฐเจœเจธเจผเฉ€เจฒเจคเจพ เจตเจฟเฉฑเจš เจฎเจนเฉฑเจคเจตเจชเฉ‚เจฐเจจ เจคเฉŒเจฐ 'เจคเฉ‡ เจตเจฟเจธเจคเจพเจฐ เจ•เฉ€เจคเจพ เจ—เจฟเจ† เจนเฉˆเฅค

เจ‡เจธ เจชเฉˆเจ•เฉ‡เจœ เจตเจฟเฉฑเจš เจธเจพเจฐเจฃเฉ€ เจฆเฉ‡ เจจเจพเจฒ เจธเจพเจฐเฉ€เจ†เจ‚ เจนเฉ‡เจฐเจพเจซเฉ‡เจฐเฉ€เจ†เจ‚ เจฆเจพ เจตเจฐเจฃเจจ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจ•เฉ€เจคเจพ เจ—เจฟเจ† เจนเฉˆ, เจ…เจคเฉ‡ เจœเฉ‡เจ•เจฐ เจคเฉเจธเฉ€เจ‚ เจธเฉฐเจŸเฉˆเจ•เจธ เจฆเจพ เจ…เจจเฉเจตเจพเจฆ เจ•เจฐเจฆเฉ‡ เจนเฉ‹ data.table SQL เจตเจฟเฉฑเจš, เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ•เฉเจ เจ…เจœเจฟเจนเจพ เจฎเจฟเจฒเจฆเจพ เจนเฉˆ: data.table[ WHERE, SELECT, GROUP BY ]

เจ‡เจธ เจชเฉˆเจ•เฉ‡เจœ เจฆเฉ€ เจคเจพเจ•เจค เจตเฉฑเจกเฉ€ เจฎเจพเจคเจฐเจพ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจชเฉเจฐเฉ‹เจธเฉˆเจธ เจ•เจฐเจจ เจฆเฉ€ เจ—เจคเฉ€ เจนเฉˆเฅค

เจชเฉฐเจกเจพเจธ

เจธเจฐเจ•เจพเจฐเฉ€ เจตเฉˆเจฌเจธเจพเจˆเจŸ: pandas.pydata.org เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจฆเจพ เจจเจพเจฎ เจ…เจฐเจฅ เจ—เจฃเจฟเจค เจธเจผเจฌเจฆ "เจชเฉˆเจจเจฒ เจกเฉ‡เจŸเจพ" เจคเฉ‹เจ‚ เจ†เจ‡เจ† เจนเฉˆ, เจœเฉ‹ เจœเจพเจฃเจ•เจพเจฐเฉ€ เจฆเฉ‡ เจฌเจนเฉ-เจ†เจฏเจพเจฎเฉ€ เจขเจพเจ‚เจšเฉ‡ เจตเจพเจฒเฉ‡ เจธเฉˆเฉฑเจŸเจพเจ‚ เจฆเจพ เจตเจฐเจฃเจจ เจ•เจฐเจจ เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค

เจฒเฉ‡เจ–เจ• pandas เจ…เจฎเจฐเฉ€เจ•เฉ€ เจตเฉ‡เจธ เจฎเฉˆเจ•เจ•เจฟเจจเฉ€ เจนเฉˆเฅค

เจœเจฆเฉ‹เจ‚ เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจฆเฉ€ เจ—เฉฑเจฒ เจ†เจ‰เจ‚เจฆเฉ€ เจนเฉˆ, เจฌเจฐเจพเจฌเจฐ pandas เจจเฉฐ. เจ‡เฉฑเจ• เจฌเจนเฉเจค เจนเฉ€ เจฎเจฒเจŸเฉ€เจซเฉฐเจ•เจธเจผเจจเจฒ, เจ‰เฉฑเจš-เจชเฉฑเจงเจฐเฉ€ เจชเฉˆเจ•เฉ‡เจœ เจœเฉ‹ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ•เจฟเจธเฉ‡ เจตเฉ€ เจธเจฐเฉ‹เจค เจคเฉ‹เจ‚ เจกเฉ‡เจŸเจพ เจฒเฉ‹เจก เจ•เจฐเจจ เจคเฉ‹เจ‚ เจฒเฉˆ เจ•เฉ‡ เจ‡เจธเจฆเฉ€ เจ•เจฒเจชเจจเจพ เจ•เจฐเจจ เจคเฉฑเจ•, เจกเฉ‡เจŸเจพ เจจเจพเจฒ เจ•เฉ‹เจˆ เจนเฉ‡เจฐเจพเจซเฉ‡เจฐเฉ€ เจ•เจฐเจจ เจฆเฉ€ เจ†เจ—เจฟเจ† เจฆเจฟเฉฐเจฆเจพ เจนเฉˆเฅค

เจตเจพเจงเฉ‚ เจชเฉˆเจ•เฉ‡เจœ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐ เจฐเจฟเจนเจพ เจนเฉˆ

เจ‡เจธ เจฒเฉ‡เจ– เจตเจฟเฉฑเจš เจตเจฟเจšเจพเจฐเฉ‡ เจ—เจ เจชเฉˆเจ•เฉ‡เจœ เจฌเฉเจจเจฟเจ†เจฆเฉ€ R เจ…เจคเฉ‡ Python เจกเจฟเจธเจŸเจฐเฉ€เจฌเจฟเจŠเจธเจผเจจ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจจเจนเฉ€เจ‚ เจนเจจเฅค เจนเจพเจฒเจพเจ‚เจ•เจฟ เจ‡เฉฑเจ• เจ›เฉ‹เจŸเฉ€ เจœเจฟเจนเฉ€ เจšเฉ‡เจคเจพเจตเจจเฉ€ เจนเฉˆ, เจœเฉ‡เจ•เจฐ เจคเฉเจธเฉ€เจ‚ เจเจจเจพเจ•เจพเจ‚เจกเจพ เจกเจฟเจธเจŸเจฐเฉ€เจฌเจฟเจŠเจธเจผเจจ เจจเฉ‚เฉฐ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เฉ€เจคเจพ เจนเฉˆ, เจคเจพเจ‚ เจ‡เจธ เจคเฉ‹เจ‚ เจ‡เจฒเจพเจตเจพ เจตเฉ€ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐเฉ‹ pandas เจฆเฉ€ เจฒเฉ‹เฉœ เจจเจนเฉ€ เจนเฉˆ.

เจ†เจฐ เจตเจฟเฉฑเจš เจชเฉˆเจ•เฉ‡เจœ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐเจจเจพ

เจœเฉ‡เจ•เจฐ เจคเฉเจธเฉ€เจ‚ เจ˜เฉฑเจŸเฉ‹-เจ˜เฉฑเจŸ เจ‡เฉฑเจ• เจตเจพเจฐ RStudio เจตเจฟเจ•เจพเจธ เจตเจพเจคเจพเจตเจฐเจฃ เจจเฉ‚เฉฐ เจ–เฉ‹เจฒเฉเจนเจฟเจ† เจนเฉˆ, เจคเจพเจ‚ เจคเฉเจธเฉ€เจ‚ เจธเจผเจพเจ‡เจฆ เจชเจนเจฟเจฒเจพเจ‚ เจนเฉ€ เจœเจพเจฃเจฆเฉ‡ เจนเฉ‹เจตเฉ‹เจ—เฉ‡ เจ•เจฟ R เจตเจฟเฉฑเจš เจฒเฉ‹เฉœเฉ€เจ‚เจฆเฉ‡ เจชเฉˆเจ•เฉ‡เจœ เจจเฉ‚เฉฐ เจ•เจฟเจตเฉ‡เจ‚ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐเจจเจพ เจนเฉˆเฅค เจชเฉˆเจ•เฉ‡เจœ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐเจจ เจฒเจˆ, เจธเจŸเฉˆเจ‚เจกเจฐเจก เจ•เจฎเจพเจ‚เจก เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ‹เฅค install.packages() เจ‡เจธเจจเฉ‚เฉฐ เจธเจฟเฉฑเจงเฉ‡ เจ†เจฐ เจตเจฟเฉฑเจš เจšเจฒเจพ เจ•เฉ‡เฅค

# ัƒัั‚ะฐะฝะพะฒะบะฐ ะฟะฐะบะตั‚ะพะฒ
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")

เจ‡เฉฐเจธเจŸเจพเจฒเฉ‡เจธเจผเจจ เจคเฉ‹เจ‚ เจฌเจพเจ…เจฆ, เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจจเฉ‚เฉฐ เจ•เจจเฉˆเจ•เจŸ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉเฉฐเจฆเฉ€ เจนเฉˆ, เจœเจฟเจธ เจฒเจˆ เจœเจผเจฟเจ†เจฆเจพเจคเจฐ เจฎเจพเจฎเจฒเจฟเจ†เจ‚ เจตเจฟเฉฑเจš เจ•เจฎเจพเจ‚เจก เจตเจฐเจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆ library().

# ะฟะพะดะบะปัŽั‡ะตะฝะธะต ะธะปะธ ะธะผะฟะพั€ั‚ ะฟะฐะบะตั‚ะพะฒ ะฒ ั€ะฐะฑะพั‡ะตะต ะพะบั€ัƒะถะตะฝะธะต
library(vroom)
library(readr)
library(dplyr)
library(data.table)

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจชเฉˆเจ•เฉ‡เจœ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐเจจเจพ

เจ‡เจธ เจฒเจˆ, เจœเฉ‡เจ•เจฐ เจคเฉเจนเจพเจกเฉ‡ เจ•เฉ‹เจฒ เจธเจผเฉเฉฑเจง เจชเจพเจˆเจฅเจจ เจธเจฅเจพเจชเจฟเจค เจนเฉˆ, เจคเจพเจ‚ pandas เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‡เจธ เจจเฉ‚เฉฐ เจฆเจธเจคเฉ€ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ. เจคเฉเจนเจพเจกเฉ‡ เจ“เจชเจฐเฉ‡เจŸเจฟเฉฐเจ— เจธเจฟเจธเจŸเจฎ เจฆเฉ‡ เจ†เจงเจพเจฐ 'เจคเฉ‡ เจ•เจฎเจพเจ‚เจก เจฒเจพเจˆเจจ, เจœเจพเจ‚ เจŸเจฐเจฎเฉ€เจจเจฒ เจ–เฉ‹เจฒเฉเจนเฉ‹ เจ…เจคเฉ‡ เจนเฉ‡เจ  เจฆเจฟเฉฑเจคเฉ€ เจ•เจฎเจพเจ‚เจก เจฆเจฟเจ“เฅค

pip install pandas

เจซเจฟเจฐ เจ…เจธเฉ€เจ‚ เจชเจพเจˆเจฅเจจ เจคเฉ‡ เจตเจพเจชเจธ เจ†เจ‰เจ‚เจฆเฉ‡ เจนเจพเจ‚ เจ…เจคเฉ‡ เจ•เจฎเจพเจ‚เจก เจจเจพเจฒ เจ‡เฉฐเจธเจŸเจพเจฒ เจ•เฉ€เจคเฉ‡ เจชเฉˆเจ•เฉ‡เจœ เจจเฉ‚เฉฐ เจ†เจฏเจพเจค เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚ import.

import pandas as pd

เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ

เจกเฉ‡เจŸเจพ เจฎเจพเจˆเจจเจฟเฉฐเจ— เจกเฉ‡เจŸเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจตเจฟเฉฑเจš เจธเจญ เจคเฉ‹เจ‚ เจฎเจนเฉฑเจคเจตเจชเฉ‚เจฐเจจ เจ•เจฆเจฎเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ‡เฉฑเจ• เจนเฉˆเฅค Python เจ…เจคเฉ‡ R เจฆเฉ‹เจตเฉ‡เจ‚, เจœเฉ‡เจ•เจฐ เจฒเฉ‹เฉœ เจนเฉ‹เจตเฉ‡, เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ•เจฟเจธเฉ‡ เจตเฉ€ เจธเจฐเฉ‹เจค เจคเฉ‹เจ‚ เจกเฉ‡เจŸเจพ เจชเฉเจฐเจพเจชเจค เจ•เจฐเจจ เจฆเฉ‡ เจตเจฟเจ†เจชเจ• เจฎเฉŒเจ•เฉ‡ เจชเฉเจฐเจฆเจพเจจ เจ•เจฐเจฆเฉ‡ เจนเจจ: เจธเจฅเจพเจจเจ• เจซเจพเจˆเจฒเจพเจ‚, เจ‡เฉฐเจŸเจฐเจจเฉˆเจŸ เจคเฉ‹เจ‚ เจซเจพเจˆเจฒเจพเจ‚, เจตเฉˆเจฌเจธเจพเจˆเจŸเจพเจ‚, เจนเจฐ เจ•เจฟเจธเจฎ เจฆเฉ‡ เจกเฉ‡เจŸเจพเจฌเฉ‡เจธเฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจฒเฉ‡เจ– เจฆเฉ‡ เจฆเฉŒเจฐเจพเจจ เจ…เจธเฉ€เจ‚ เจ•เจˆ เจกเฉ‡เจŸเจพเจธเฉˆเจŸเจพเจ‚ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจพเจ‚เจ—เฉ‡:

  1. เจ—เฉ‚เจ—เจฒ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจคเฉ‹เจ‚ เจฆเฉ‹ เจกเจพเจŠเจจเจฒเฉ‹เจกเฅค
  2. เจŸเจพเจ‡เจŸเฉˆเจจเจฟเจ• เจฏเจพเจคเจฐเฉ€ เจกเฉ‡เจŸเจพเจธเฉˆเจŸ

เจธเจพเจฐเจพ เจกเจพเจŸเจพ เจฎเฉ‡เจฐเฉ‡ 'เจคเฉ‡ เจนเฉˆ GitHub csv เจ…เจคเฉ‡ tsv เจซเจพเจˆเจฒเจพเจ‚ เจฆเฉ‡ เจฐเฉ‚เจช เจตเจฟเฉฑเจš. เจ…เจธเฉ€เจ‚ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจ•เจฟเฉฑเจฅเฉ‹เจ‚ เจฎเฉฐเจ—เจพเจ‚เจ—เฉ‡?

R เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ: tidyverse, vroom, readr

เจ‡เฉฑเจ• เจฒเจพเจ‡เจฌเฉเจฐเฉ‡เจฐเฉ€ เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เจฐเจจ เจฒเจˆ tidyverse เจ‡เฉฑเจฅเฉ‡ เจฆเฉ‹ เจชเฉˆเจ•เฉ‡เจœ เจนเจจ: vroom, readr. vroom เจตเจงเฉ‡เจฐเฉ‡ เจ†เจงเฉเจจเจฟเจ•, เจชเจฐ เจญเจตเจฟเฉฑเจ– เจตเจฟเฉฑเจš เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจฟเจ† เจœเจพ เจธเจ•เจฆเจพ เจนเฉˆเฅค

เจคเฉ‹เจ‚ เจนเจตเจพเจฒเจพ เจ…เจงเจฟเจ•เจพเจฐเจค เจฆเจธเจคเจพเจตเฉ‡เจœเจผ vroom.

เจตเจฐเฉ‚เจฎ เจฌเจจเจพเจฎ เจฐเฉ€เจกเจฐ
เจฆเฉ€ เจฐเจฟเจนเจพเจˆ เจ•เฉ€ เจ•เจฐเจฆเฉ€ เจนเฉˆ vroom เจฒเจˆ เจฎเจคเจฒเจฌ readr? เจซเจฟเจฒเจนเจพเจฒ เจ…เจธเฉ€เจ‚ เจฆเฉ‹ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจจเฉ‚เฉฐ เจตเฉฑเจ–เจฐเฉ‡ เจคเฉŒเจฐ 'เจคเฉ‡ เจตเจฟเจ•เจธเจค เจ•เจฐเจจ เจฆเฉ€ เจฏเฉ‹เจœเจจเจพ เจฌเจฃเจพ เจฐเจนเฉ‡ เจนเจพเจ‚, เจชเจฐ เจธเฉฐเจญเจพเจตเจจเจพ เจนเฉˆ เจ•เจฟ เจ…เจธเฉ€เจ‚ เจญเจตเจฟเฉฑเจ– เจตเจฟเฉฑเจš เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจจเฉ‚เฉฐ เจ‡เจ•เจœเฉเฉฑเจŸ เจ•เจฐเจพเจ‚เจ—เฉ‡เฅค เจตเจฐเฉ‚เจฎ เจฆเฉ€ เจ†เจฒเจธเฉ€ เจฐเฉ€เจกเจฟเฉฐเจ— เจฆเจพ เจ‡เฉฑเจ• เจจเฉเจ•เจธเจพเจจ เจ‡เจน เจนเฉˆ เจ•เจฟ เจ•เฉเจ เจกเจพเจŸเจพ เจธเจฎเฉฑเจธเจฟเจ†เจตเจพเจ‚ เจจเฉ‚เฉฐ เจธเจพเจนเจฎเจฃเฉ‡ เจจเจนเฉ€เจ‚ เจฒเจฟเจ†เจ‚เจฆเจพ เจœเจพ เจธเจ•เจฆเจพ, เจ‡เจธ เจฒเจˆ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจ•เจฟเจตเฉ‡เจ‚ เจ‡เจ•เจฎเฉเฉฑเจ  เจ•เจฐเจจเจพ เจนเฉˆ เจ‡เจธ เจฌเจพเจฐเฉ‡ เจ•เฉเจ เจธเฉ‹เจšเจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆเฅค

vroom เจฌเจจเจพเจฎ เจฐเฉ€เจกเจฐ
เจฐเจฟเจนเจพเจˆ เจฆเจพ เจ•เฉ€ เจฎเจคเจฒเจฌ เจนเฉˆ? vroom เจจเฉ‚เฉฐ readr? เจ‡เจธ เจธเจฎเฉ‡เจ‚ เจ…เจธเฉ€เจ‚ เจฆเฉ‹เจตเจพเจ‚ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจจเฉ‚เฉฐ เจตเฉฑเจ–เจฐเฉ‡ เจคเฉŒเจฐ 'เจคเฉ‡ เจตเจฟเจ•เจธเจค เจ•เจฐเจจ เจฆเฉ€ เจฏเฉ‹เจœเจจเจพ เจฌเจฃเจพ เจฐเจนเฉ‡ เจนเจพเจ‚, เจชเจฐ เจ…เจธเฉ€เจ‚ เจธเจผเจพเจ‡เจฆ เจญเจตเจฟเฉฑเจ– เจตเจฟเฉฑเจš เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจพเจ‚เจ—เฉ‡เฅค เจ†เจฒเจธเฉ€ เจชเฉœเฉเจนเจจ เจฆเฉ‡ เจจเฉเจ•เจธเจพเจจเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ‡เฉฑเจ• vroom เจ‡เจน เจนเฉˆ เจ•เจฟ เจกเฉ‡เจŸเจพ เจฆเฉ‡ เจจเจพเจฒ เจ•เฉเจ เจธเจฎเฉฑเจธเจฟเจ†เจตเจพเจ‚ เจฆเฉ€ เจชเจนเจฟเจฒเจพเจ‚ เจคเฉ‹เจ‚ เจฐเจฟเจชเฉ‹เจฐเจŸ เจจเจนเฉ€เจ‚ เจ•เฉ€เจคเฉ€ เจœเจพ เจธเจ•เจฆเฉ€, เจ‡เจธ เจฒเจˆ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‡เจน เจธเฉ‹เจšเจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ เจ•เจฟ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจธเจญ เจคเฉ‹เจ‚ เจตเจงเฉ€เจ† เจ•เจฟเจตเฉ‡เจ‚ เจœเฉ‹เฉœเจจเจพ เจนเฉˆเฅค

เจ‡เจธ เจฒเฉ‡เจ– เจตเจฟเฉฑเจš เจ…เจธเฉ€เจ‚ เจฆเฉ‹เจตเฉ‡เจ‚ เจกเจพเจŸเจพ เจฒเฉ‹เจกเจฟเฉฐเจ— เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจจเฉ‚เฉฐ เจฆเฉ‡เจ–เจพเจ‚เจ—เฉ‡:

R: vroom เจชเฉˆเจ•เฉ‡เจœ เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ

# install.packages("vroom")
library(vroom)

# ะงั‚ะตะฝะธะต ะดะฐะฝะฝั‹ั…
## vroom
ga_nov  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

R: เจฐเฉ€เจกเจฐ เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ

# install.packages("readr")
library(readr)

# ะงั‚ะตะฝะธะต ะดะฐะฝะฝั‹ั…
## readr
ga_nov  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

เจชเฉˆเจ•เฉ‡เจœ เจตเจฟเฉฑเจš vroom, csv/tsv เจกเฉ‡เจŸเจพ เจซเจพเจฐเจฎเฉˆเจŸ เจฆเฉ€ เจชเจฐเจตเจพเจน เจ•เฉ€เจคเฉ‡ เจฌเจฟเจจเจพเจ‚, เจฒเฉ‹เจกเจฟเฉฐเจ— เจ‰เจธเฉ‡ เจจเจพเจฎ เจฆเฉ‡ เจซเฉฐเจ•เจธเจผเจจ เจฆเฉเจ†เจฐเจพ เจ•เฉ€เจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆ vroom(), เจชเฉˆเจ•เฉ‡เจœ เจตเจฟเฉฑเจš readr เจ…เจธเฉ€เจ‚ เจนเจฐเฉ‡เจ• เจซเจพเจฐเจฎเฉˆเจŸ เจฒเจˆ เจ‡เฉฑเจ• เจตเฉฑเจ–เจฐเจพ เจซเฉฐเจ•เจธเจผเจจ เจตเจฐเจคเจฆเฉ‡ เจนเจพเจ‚ read_tsv() ะธ read_csv().

R: data.table เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ

ะ’ data.table เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เจฐเจจ เจฒเจˆ เจ‡เฉฑเจ• เจซเฉฐเจ•เจธเจผเจจ เจนเฉˆ fread().

R: data.table เจชเฉˆเจ•เฉ‡เจœ เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ

# install.packages("data.table")
library(data.table)

## data.table
ga_nov  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

Python เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ: pandas

เจœเฉ‡เจ•เจฐ เจ…เจธเฉ€เจ‚ R เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจจเจพเจฒ เจคเฉเจฒเจจเจพ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚, เจคเจพเจ‚ เจ‡เจธ เจ•เฉ‡เจธ เจตเจฟเฉฑเจš เจธเฉฐเจŸเฉˆเจ•เจธ เจธเจญ เจคเฉ‹เจ‚ เจจเฉ‡เฉœเฉ‡ เจนเฉˆ pandas เจนเฉ‹ เจœเจพเจตเฉ‡เจ—เจพ readr, เจ•เจฟเจ‰เจ‚เจ•เจฟ pandas เจ•เจฟเจคเฉ‡ เจตเฉ€ เจกเฉ‡เจŸเจพ เจฆเฉ€ เจฌเฉ‡เจจเจคเฉ€ เจ•เจฐ เจธเจ•เจฆเจพ เจนเฉˆ, เจ…เจคเฉ‡ เจ‡เจธ เจชเฉˆเจ•เฉ‡เจœ เจตเจฟเฉฑเจš เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเจพ เจชเฉ‚เจฐเจพ เจชเจฐเจฟเจตเจพเจฐ เจนเฉˆ read_*().

  • read_csv()
  • read_excel()
  • read_sql()
  • read_json()
  • read_html()

เจ…เจคเฉ‡ เจ•เจˆ เจนเฉ‹เจฐ เจซเฉฐเจ•เจธเจผเจจ เจตเฉฑเจ–-เจตเฉฑเจ– เจซเจพเจฐเจฎเฉˆเจŸเจพเจ‚ เจคเฉ‹เจ‚ เจกเจพเจŸเจพ เจชเฉœเฉเจนเจจ เจฒเจˆ เจคเจฟเจ†เจฐ เจ•เฉ€เจคเฉ‡ เจ—เจ เจนเจจเฅค เจชเจฐ เจธเจพเจกเฉ‡ เจ‰เจฆเฉ‡เจธเจผเจพเจ‚ เจฒเจˆ เจ‡เจน เจ•เจพเจซเจผเฉ€ เจนเฉˆ read_table() เจœ read_csv() เจฆเจฒเฉ€เจฒ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹เจ เจธเจคเฉฐเจฌเจฐ เจจเฉ‚เฉฐ เจ•เจพเจฒเจฎ เจตเจฟเจญเจพเจœเจ• เจจเฉ‚เฉฐ เจจเจฟเจธเจผเจšเจฟเจค เจ•เจฐเจจ เจฒเจˆเฅค

Python เจตเจฟเฉฑเจš เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ: pandas

import pandas as pd

ga_nov  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")

เจกเจพเจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ

เจŸเฉ‡เจฌเจฒ เจฎเจธเจผเจนเฉ‚เจฐ, เจœเจฟเจธเจจเฉ‚เฉฐ เจ…เจธเฉ€เจ‚ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจนเฉˆ, เจ‰เฉฑเจฅเฉ‡ เจ‡เฉฑเจ• เจ–เฉ‡เจคเจฐ เจนเฉˆ เจฒเจฟเฉฐเจ—, เจœเฉ‹ เจฏเจพเจคเจฐเฉ€ เจฆเฉ‡ เจฒเจฟเฉฐเจ— เจชเจ›เจพเจฃเจ•เจฐเจคเจพ เจจเฉ‚เฉฐ เจธเจŸเฉ‹เจฐ เจ•เจฐเจฆเจพ เจนเฉˆเฅค

เจชเจฐ เจฏเจพเจคเจฐเฉ€ เจฒเจฟเฉฐเจ— เจฆเฉ‡ เจฐเฉ‚เจช เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจฆเฉ€ เจตเจงเฉ‡เจฐเฉ‡ เจธเฉเจตเจฟเจงเจพเจœเจจเจ• เจชเฉ‡เจธเจผเจ•เจพเจฐเฉ€ เจฒเจˆ, เจคเฉเจนเจพเจจเฉ‚เฉฐ เจฒเจฟเฉฐเจ— เจ•เฉ‹เจก เจฆเฉ€ เจฌเจœเจพเจ เจจเจพเจฎ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจเฉ€ เจšเจพเจนเฉ€เจฆเฉ€ เจนเฉˆเฅค

เจ…เจœเจฟเจนเจพ เจ•เจฐเจจ เจฒเจˆ, เจ…เจธเฉ€เจ‚ เจ‡เฉฑเจ• เจ›เฉ‹เจŸเฉ€ เจกเจพเจ‡เจฐเฉˆเจ•เจŸเจฐเฉ€ เจฌเจฃเจพเจตเจพเจ‚เจ—เฉ‡, เจ‡เฉฑเจ• เจธเจพเจฐเจฃเฉ€ เจœเจฟเจธ เจตเจฟเฉฑเจš เจ•เฉเจฐเจฎเจตเจพเจฐ เจ•เฉ‡เจตเจฒ 2 เจ•เจพเจฒเจฎ (เจ•เฉ‹เจก เจ…เจคเฉ‡ เจฒเจฟเฉฐเจ— เจจเจพเจฎ) เจ…เจคเฉ‡ 2 เจ•เจคเจพเจฐเจพเจ‚ เจนเฉ‹เจฃเจ—เฉ€เจ†เจ‚เฅค

R เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ: tidyverse, dplyr

เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ€ เจ•เฉ‹เจก เจ‰เจฆเจพเจนเจฐเจจ เจตเจฟเฉฑเจš, เจ…เจธเฉ€เจ‚ เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจ•เฉ‡ เจฒเฉ‹เฉœเฉ€เจ‚เจฆเจพ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจ‚เจฆเฉ‡ เจนเจพเจ‚ tibble() .

R: dplyr เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ

## dplyr
### ัะพะทะดะฐั‘ะผ ัะฟั€ะฐะฒะพั‡ะฝะธะบ
gender <- tibble(id = c(1, 2),
                 gender = c("female", "male"))

R: data.table เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ

R: data.table เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ

## data.table
### ัะพะทะดะฐั‘ะผ ัะฟั€ะฐะฒะพั‡ะฝะธะบ
gender <- data.table(id = c(1, 2),
                    gender = c("female", "male"))

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ: เจชเจพเจ‚เจกเจพ

ะ’ pandas เจซเจฐเฉ‡เจฎเจพเจ‚ เจฆเฉ€ เจธเจฟเจฐเจœเจฃเจพ เจ•เจˆ เจชเฉœเจพเจตเจพเจ‚ เจตเจฟเฉฑเจš เจ•เฉ€เจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆ, เจชเจนเจฟเจฒเจพเจ‚ เจ…เจธเฉ€เจ‚ เจ‡เฉฑเจ• เจกเจฟเจ•เจธเจผเจจเจฐเฉ€ เจฌเจฃเจพเจ‰เจ‚เจฆเฉ‡ เจนเจพเจ‚, เจ…เจคเฉ‡ เจซเจฟเจฐ เจ…เจธเฉ€เจ‚ เจกเจฟเจ•เจธเจผเจจเจฐเฉ€ เจจเฉ‚เฉฐ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจตเจฟเฉฑเจš เจฌเจฆเจฒเจฆเฉ‡ เจนเจพเจ‚เฅค

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ: เจชเจพเจ‚เจกเจพ

# ัะพะทะดะฐั‘ะผ ะดะฐั‚ะฐ ั„ั€ะตะนะผ
gender_dict = {'id': [1, 2],
               'gender': ["female", "male"]}
# ะฟั€ะตะพะฑั€ะฐะทัƒะตะผ ัะปะพะฒะฐั€ัŒ ะฒ ะดะฐั‚ะฐั„ั€ะตะนะผ
gender = pd.DataFrame.from_dict(gender_dict)

เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ

เจœเจฟเจจเฉเจนเจพเจ‚ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจจเจพเจฒ เจคเฉเจธเฉ€เจ‚ เจ•เฉฐเจฎ เจ•เจฐเจฆเฉ‡ เจนเฉ‹, เจ‰เจนเจจเจพเจ‚ เจตเจฟเฉฑเจš เจฆเจฐเจœเจจเจพเจ‚ เจœเจพเจ‚ เจธเฉˆเจ‚เจ•เฉœเฉ‡ เจ•เจพเจฒเจฎ เจกเฉ‡เจŸเจพ เจนเฉ‹ เจธเจ•เจฆเฉ‡ เจนเจจเฅค เจชเจฐ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจ•เจฐเจจ เจฒเจˆ, เจ‡เฉฑเจ• เจจเจฟเจฏเจฎ เจฆเฉ‡ เจคเฉŒเจฐ 'เจคเฉ‡, เจคเฉเจนเจพเจจเฉ‚เฉฐ เจธเจฐเฉ‹เจค เจธเจพเจฐเจฃเฉ€ เจตเจฟเฉฑเจš เจ‰เจชเจฒเจฌเจง เจธเจพเจฐเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ€ เจฒเฉ‹เฉœ เจจเจนเฉ€เจ‚ เจนเฉˆเฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจ‡เจธ เจฒเจˆ, เจธเจฐเฉ‹เจค เจธเจพเจฐเจฃเฉ€ เจฆเฉ‡ เจจเจพเจฒ เจคเฉเจนเจพเจกเฉ‡ เจฆเฉเจ†เจฐเจพ เจ•เฉ€เจคเฉ‡ เจœเจพเจฃ เจตเจพเจฒเฉ‡ เจชเจนเจฟเจฒเฉ‡ เจ“เจชเจฐเฉ‡เจธเจผเจจเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ‡เฉฑเจ• เจ‡เจน เจนเฉˆ เจ•เจฟ เจ‡เจธ เจจเฉ‚เฉฐ เจฌเฉ‡เจฒเฉ‹เฉœเฉ€ เจœเจพเจฃเจ•เจพเจฐเฉ€ เจคเฉ‹เจ‚ เจธเจพเจซเจผ เจ•เจฐเจจเจพ เจ…เจคเฉ‡ เจ‡เจธ เจœเจพเจฃเจ•เจพเจฐเฉ€ เจตเจฟเฉฑเจš เจฎเฉŒเจœเฉ‚เจฆ เจฎเฉˆเจฎเฉ‹เจฐเฉ€ เจจเฉ‚เฉฐ เจ–เจพเจฒเฉ€ เจ•เจฐเจจเจพ เจนเฉˆเฅค

R เจตเจฟเฉฑเจš เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ: tidyverse, dplyr

เจธเฉฐเจŸเฉˆเจ•เจธ dplyr SQL เจ•เจฟเจŠเจฐเฉ€ เจญเจพเจธเจผเจพ เจฆเฉ‡ เจธเจฎเจพเจจ เจนเฉˆ, เจœเฉ‡เจ•เจฐ เจคเฉเจธเฉ€เจ‚ เจ‡เจธ เจคเฉ‹เจ‚ เจœเจพเจฃเฉ‚ เจนเฉ‹ เจคเจพเจ‚ เจคเฉเจธเฉ€เจ‚ เจœเจฒเจฆเฉ€ เจนเฉ€ เจ‡เจธ เจชเฉˆเจ•เฉ‡เจœ เจตเจฟเฉฑเจš เจฎเฉเจนเจพเจฐเจค เจนเจพเจธเจฒ เจ•เจฐ เจฒเจตเฉ‹เจ—เฉ‡เฅค

เจ•เจพเจฒเจฎ เจšเฉเจฃเจจ เจฒเจˆ, เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ‹ select().

เจนเฉ‡เจ เจพเจ‚ เจ•เฉ‹เจก เจฆเฉ€เจ†เจ‚ เจ‰เจฆเจพเจนเจฐเจฃเจพเจ‚ เจนเจจ เจœเจฟเจจเฉเจนเจพเจ‚ เจจเจพเจฒ เจคเฉเจธเฉ€เจ‚ เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ‡ เจคเจฐเฉ€เจ•เจฟเจ†เจ‚ เจจเจพเจฒ เจ•เจพเจฒเจฎ เจšเฉเจฃ เจธเจ•เจฆเฉ‡ เจนเฉ‹:

  • เจฒเฉ‹เฉœเฉ€เจ‚เจฆเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ‡ เจจเจพเจฎเจพเจ‚ เจฆเฉ€ เจธเฉ‚เจšเฉ€ เจฌเจฃเจพเจ‰เจฃเจพ
  • เจฐเฉˆเจ—เฉ‚เจฒเจฐ เจธเจฎเฉ€เจ•เจฐเจจ เจตเจฐเจคเจฆเฉ‡ เจนเฉ‹เจ เจ•เจพเจฒเจฎ เจฆเฉ‡ เจจเจพเจฎ เจตเฉ‡เจ–เฉ‹
  • เจ•เจพเจฒเจฎ เจตเจฟเฉฑเจš เจฎเฉŒเจœเฉ‚เจฆ เจกเฉ‡เจŸเจพ เจฆเฉ€ เจ•เจฟเจธเจฎ เจœเจพเจ‚ เจ•เจฟเจธเฉ‡ เจนเฉ‹เจฐ เจตเจฟเจธเจผเฉ‡เจธเจผเจคเจพ เจฆเฉเจ†เจฐเจพ

R เจตเจฟเฉฑเจš เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ: dplyr

# ะ’ั‹ะฑะพั€ ะฝัƒะถะฝั‹ั… ัั‚ะพะปะฑั†ะพะฒ
## dplyr
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
select(ga_nov, date, source, sessions)
### ะธัะบะปัŽั‡ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
select(ga_nov, -medium, -bounces)
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ, ัั‚ะพะฑั†ั‹ ะธะผะตะฝะฐ ะบะพั‚ะพั€ั‹ั… ะทะฐะบะฐะฝั‡ะธะฒะฐัŽั‚ัั ะฝะฐ s
select(ga_nov, matches("s$"))
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ัƒัะปะพะฒะธัŽ, ะฒั‹ะฑะธั€ะฐะตะผ ั‚ะพะปัŒะบะพ ั†ะตะปะพั‡ะธัะปะตะฝะฝั‹ะต ัั‚ะพะปะฑั†ั‹
select_if(ga_nov, is.integer)

R: data.table เจตเจฟเฉฑเจš เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ

เจตเจฟเจš เจ‰เจนเฉ€ เจ“เจชเจฐเฉ‡เจธเจผเจจ data.table เจฅเฉ‹เฉœเฉ‡ เจตเฉฑเจ–เจฐเฉ‡ เจคเจฐเฉ€เจ•เฉ‡ เจจเจพเจฒ เจ•เฉ€เจคเฉ‡ เจœเจพเจ‚เจฆเฉ‡ เจนเจจ, เจฒเฉ‡เจ– เจฆเฉ‡ เจธเจผเฉเจฐเฉ‚ เจตเจฟเฉฑเจš เจฎเฉˆเจ‚ เจ‡เฉฑเจ• เจตเจฐเจฃเจจ เจชเฉเจฐเจฆเจพเจจ เจ•เฉ€เจคเจพ เจธเฉ€ เจ•เจฟ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจ•เจฟเจนเฉœเฉ€เจ†เจ‚ เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸเจพเจ‚ เจนเจจ data.table.

DT[i,j,by]

เจ•เจฟเฉฑเจฅเฉ‡:
i - เจ•เจฟเฉฑเจฅเฉ‡, i.e. เจ•เจคเจพเจฐเจพเจ‚ เจฆเฉเจ†เจฐเจพ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ
j - เจšเฉเจฃเฉ‹ | เจ…เฉฑเจชเจกเฉ‡เจŸ | เจ•เจฐเฉ‹ , i.e. เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ เจ…เจคเฉ‡ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจฌเจฆเจฒเจฃเจพ
เจฆเฉเจ†เจฐเจพ - เจกเจพเจŸเจพ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ—

R: data.table เจตเจฟเฉฑเจš เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ

## data.table
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
ga_nov[ , .(date, source, sessions) ]
### ะธัะบะปัŽั‡ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ
ga_nov[, .SD, .SDcols = patterns("s$")]

เจชเจฐเจฟเจตเจฐเจคเจจเจธเจผเฉ€เจฒ .SD เจคเฉเจนเจพเจจเฉ‚เฉฐ เจธเจพเจฐเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจคเฉฑเจ• เจชเจนเฉเฉฐเจš เจ•เจฐเจจ เจฆเฉ€ เจ‡เจœเจพเจœเจผเจค เจฆเจฟเฉฐเจฆเจพ เจนเฉˆ, เจ…เจคเฉ‡ .SDcols เจคเฉเจนเจพเจจเฉ‚เฉฐ เจฒเฉ‹เฉœเฉ€เจ‚เจฆเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ‡ เจจเจพเจฎ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจ เจฒเจˆ เจจเจฟเจฏเจฎเจค เจธเจฎเฉ€เจ•เจฐเจจ, เจœเจพเจ‚ เจนเฉ‹เจฐ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจ•เฉ‡ เจฒเฉ‹เฉœเฉ€เจ‚เจฆเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเฉ‹เฅค

เจชเจพเจˆเจฅเจจ, เจชเจพเจ‚เจกเจพ เจตเจฟเฉฑเจš เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ

เจตเจฟเฉฑเจš เจจเจพเจฎ เจฆเฉเจ†เจฐเจพ เจ•เจพเจฒเจฎ เจšเฉเจฃเจจ เจฒเจˆ pandas เจ‡เจน เจ‰เจนเจจเจพเจ‚ เจฆเฉ‡ เจจเจพเจตเจพเจ‚ เจฆเฉ€ เจธเฉ‚เจšเฉ€ เจชเฉเจฐเจฆเจพเจจ เจ•เจฐเจจ เจฒเจˆ เจ•เจพเจซเฉ€ เจนเฉˆเฅค เจ…เจคเฉ‡ เจฐเฉˆเจ—เฉ‚เจฒเจฐ เจธเจฎเฉ€เจ•เจฐเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจ•เฉ‡ เจจเจพเจฎ เจฆเฉเจ†เจฐเจพ เจ•เจพเจฒเจฎเจพเจ‚ เจจเฉ‚เฉฐ เจšเฉเจฃเจจ เจœเจพเจ‚ เจฌเจพเจนเจฐ เจ•เฉฑเจขเจฃ เจฒเจˆ, เจคเฉเจนเจพเจจเฉ‚เฉฐ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ drop() ะธ filter(), เจ…เจคเฉ‡ เจฆเจฒเฉ€เจฒ เจงเฉเจฐเจพ = 1, เจœเจฟเจธ เจจเจพเจฒ เจคเฉเจธเฉ€เจ‚ เจฆเจฐเจธเจพเจ‰เจ‚เจฆเฉ‡ เจนเฉ‹ เจ•เจฟ เจ•เจคเจพเจฐเจพเจ‚ เจฆเฉ€ เจฌเจœเจพเจ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ€ เจชเฉเจฐเจ•เจฟเจฐเจฟเจ† เจ•เจฐเจจเจพ เจœเจผเจฐเฉ‚เจฐเฉ€ เจนเฉˆเฅค

เจกเฉ‡เจŸเจพ เจ•เจฟเจธเจฎ เจฆเฉเจ†เจฐเจพ เจ‡เฉฑเจ• เจ–เฉ‡เจคเจฐ เจฆเฉ€ เจšเฉ‹เจฃ เจ•เจฐเจจ เจฒเจˆ, เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ‹ select_dtypes(), เจ…เจคเฉ‡ เจฆเจฒเฉ€เจฒเจพเจ‚ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจนเจจ เจœ เจฌเจพเจนเจฐ เจ•เฉฑเจขเฉ‹ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ•เจฟเจนเฉœเฉ‡ เจ–เฉ‡เจคเจฐเจพเจ‚ เจฆเฉ€ เจšเฉ‹เจฃ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ, เจจเจพเจฒ เจธเฉฐเจฌเฉฐเจงเจฟเจค เจกเฉ‡เจŸเจพ เจ•เจฟเจธเจฎเจพเจ‚ เจฆเฉ€ เจ‡เฉฑเจ• เจธเฉ‚เจšเฉ€ เจชเจพเจธ เจ•เจฐเฉ‹เฅค

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ: เจชเจพเจ‚เจกเจพ

# ะ’ั‹ะฑะพั€ ะฟะพะปะตะน ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ
ga_nov[['date', 'source', 'sessions']]
# ะ˜ัะบะปัŽั‡ะธั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ
ga_nov.drop(['medium', 'bounces'], axis=1)
# ะ’ั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ
ga_nov.filter(regex="s$", axis=1)
# ะ’ั‹ะฑั€ะฐั‚ัŒ ั‡ะธัะปะพะฒั‹ะต ะฟะพะปั
ga_nov.select_dtypes(include=['number'])
# ะ’ั‹ะฑั€ะฐั‚ัŒ ั‚ะตะบัั‚ะพะฒั‹ะต ะฟะพะปั
ga_nov.select_dtypes(include=['object'])

เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ

เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆ, เจธเจฐเฉ‹เจค เจธเจพเจฐเจฃเฉ€ เจตเจฟเฉฑเจš เจ•เจˆ เจธเจพเจฒเจพเจ‚ เจฆเจพ เจกเฉ‡เจŸเจพ เจนเฉ‹ เจธเจ•เจฆเจพ เจนเฉˆ, เจชเจฐ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจธเจฟเจฐเจซเจผ เจชเจฟเจ›เจฒเฉ‡ เจฎเจนเฉ€เจจเฉ‡ เจฆเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆเฅค เจฆเฉเจฌเจพเจฐเจพ เจซเจฟเจฐ, เจตเจพเจงเฉ‚ เจฒเจพเจˆเจจเจพเจ‚ เจกเฉ‡เจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจชเฉเจฐเจ•เจฟเจฐเจฟเจ† เจจเฉ‚เฉฐ เจนเฉŒเจฒเฉ€ เจ•เจฐ เจฆเฉ‡เจฃเจ—เฉ€เจ†เจ‚ เจ…เจคเฉ‡ เจชเฉ€เจธเฉ€ เจฎเฉˆเจฎเฉ‹เจฐเฉ€ เจจเฉ‚เฉฐ เจฌเฉฐเจฆ เจ•เจฐ เจฆเฉ‡เจฃเจ—เฉ€เจ†เจ‚เฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

R เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ: tydyverse, dplyr

ะ’ dplyr เจซเฉฐเจ•เจธเจผเจจ เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจ เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ filter(). เจ‡เจน เจชเจนเจฟเจฒเฉ€ เจฆเจฒเฉ€เจฒ เจตเจœเฉ‹เจ‚ เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฒเฉˆเจ‚เจฆเจพ เจนเฉˆ, เจซเจฟเจฐ เจคเฉเจธเฉ€เจ‚ เจซเจฟเจฒเจŸเจฐเจฟเฉฐเจ— เจธเจผเจฐเจคเจพเจ‚ เจฆเฉ€ เจธเฉ‚เจšเฉ€ เจฌเจฃเจพเจ‰เจ‚เจฆเฉ‡ เจนเฉ‹เฅค

เจ‡เฉฑเจ• เจธเจพเจฐเจฃเฉ€ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจ เจฒเจˆ เจฒเจพเจœเจผเฉ€เจ•เจฒ เจธเจฎเฉ€เจ•เจฐเจจ เจฒเจฟเจ–เจฃ เจตเฉ‡เจฒเฉ‡, เจ‡เจธ เจธเจฅเจฟเจคเฉ€ เจตเจฟเฉฑเจš, เจฌเจฟเจจเจพเจ‚ เจนเจตเจพเจฒเฉ‡ เจฆเฉ‡ เจ…เจคเฉ‡ เจธเจพเจฐเจฃเฉ€ เจฆเฉ‡ เจจเจพเจฎ เจฆเฉ€ เจ˜เฉ‹เจธเจผเจฃเจพ เจ•เฉ€เจคเฉ‡ เจฌเจฟเจจเจพเจ‚ เจ•เจพเจฒเจฎ เจฆเฉ‡ เจจเจพเจฎ เจฆเจฟเจ“เฅค

เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจ เจฒเจˆ เจฎเจฒเจŸเฉ€เจชเจฒ เจฒเจพเจœเจผเฉ€เจ•เจฒ เจธเจฎเฉ€เจ•เจฐเจจเจพเจ‚ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจธเจฎเฉ‡เจ‚, เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ‡ เจ“เจชเจฐเฉ‡เจŸเจฐเจพเจ‚ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ‹:

  • & เจœเจพเจ‚ เจ•เฉŒเจฎเจพ - เจฒเจพเจœเจผเฉ€เจ•เจฒ AND
  • | - เจฒเจพเจœเจผเฉ€เจ•เจฒ OR

R: dplyr เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ

# ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ
## dplyr
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
filter(ga_nov, source == "google")
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
filter(ga_nov, source == "google" & sessions >= 10)
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
filter(ga_nov, source == "google" | sessions >= 10)

R: data.table เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ

เจœเจฟเจตเฉ‡เจ‚ เจ•เจฟ เจฎเฉˆเจ‚ เจชเจนเจฟเจฒเจพเจ‚ เจนเฉ€ เจ‰เฉฑเจชเจฐ เจฒเจฟเจ–เจฟเจ† เจนเฉˆ, เจตเจฟเฉฑเจš data.table เจกเฉ‡เจŸเจพ เจชเจฐเจฟเจตเจฐเจคเจจ เจธเฉฐเจŸเฉˆเจ•เจธ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจฌเฉฐเจฆ เจนเฉˆเฅค

DT[i,j,by]

เจ•เจฟเฉฑเจฅเฉ‡:
i - เจ•เจฟเฉฑเจฅเฉ‡, i.e. เจ•เจคเจพเจฐเจพเจ‚ เจฆเฉเจ†เจฐเจพ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ
j - เจšเฉเจฃเฉ‹ | เจ…เฉฑเจชเจกเฉ‡เจŸ | เจ•เจฐเฉ‹ , i.e. เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ เจ…เจคเฉ‡ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจฌเจฆเจฒเจฃเจพ
เจฆเฉเจ†เจฐเจพ - เจกเจพเจŸเจพ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ—

เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจ เจฒเจˆ เจ•เฉ€เจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆ i, เจœเจฟเจธเจฆเจพ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจชเจนเจฟเจฒเจพ เจธเจฅเจพเจจ เจนเฉˆเฅค

เจ•เจพเจฒเจฎเจพเจ‚ เจจเฉ‚เฉฐ เจฌเจฟเจจเจพเจ‚ เจนเจตเจพเจฒเจพ เจšเจฟเฉฐเจจเฉเจน เจ…เจคเฉ‡ เจธเจพเจฐเจฃเฉ€ เจฆเจพ เจจเจพเจฎ เจฆเฉฑเจธเฉ‡ เจฌเจฟเจจเจพเจ‚ เจฒเจพเจœเจผเฉ€เจ•เจฒ เจธเจฎเฉ€เจ•เจฐเจจเจพเจ‚ เจตเจฟเฉฑเจš เจเจ•เจธเฉˆเจธ เจ•เฉ€เจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค

เจฒเจพเจœเจผเฉ€เจ•เจฒ เจธเจฎเฉ€เจ•เจฐเจจ เจ‡เฉฑเจ• เจฆเฉ‚เจœเฉ‡ เจจเจพเจฒ เจ‰เจธเฉ‡ เจคเจฐเฉเจนเจพเจ‚ เจธเฉฐเจฌเฉฐเจงเจฟเจค เจนเจจ เจœเจฟเจตเฉ‡เจ‚ เจ•เจฟ เจตเจฟเฉฑเจš dplyr & เจ…เจคเฉ‡ | เจ†เจชเจฐเฉ‡เจŸเจฐเจพเจ‚ เจฐเจพเจนเฉ€เจ‚เฅค

R: data.table เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ

## data.table
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
ga_nov[source == "google"]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
ga_nov[source == "google" & sessions >= 10]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
ga_nov[source == "google" | sessions >= 10]

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจซเจฟเจฒเจŸเจฐเจฟเฉฐเจ— เจธเจคเจฐ: เจชเจพเจ‚เจกเจพ

เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจฆเฉเจ†เจฐเจพ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเฉ‹ pandas เจตเจฟเฉฑเจš เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจ เจฆเฉ‡ เจธเจฎเจพเจจ data.table, เจ…เจคเฉ‡ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจ•เฉ€เจคเจพ เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค

เจ‡เจธ เจธเจฅเจฟเจคเฉ€ เจตเจฟเฉฑเจš, เจ•เจพเจฒเจฎเจพเจ‚ เจคเฉฑเจ• เจชเจนเฉเฉฐเจš เจœเจผเจฐเฉ‚เจฐเฉ€ เจคเฉŒเจฐ 'เจคเฉ‡ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฆเฉ‡ เจจเจพเจฎ เจจเฉ‚เฉฐ เจฆเจฐเจธเจพ เจ•เฉ‡ เจ•เฉ€เจคเฉ€ เจœเจพเจ‚เจฆเฉ€ เจนเฉˆ; เจซเจฟเจฐ เจ•เจพเจฒเจฎ เจฆเจพ เจจเจพเจฎ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจนเจตเจพเจฒเจพ เจšเจฟเฉฐเจจเฉเจน เจตเจฟเฉฑเจš เจตเฉ€ เจฆเจฐเจธเจพเจ‡เจ† เจœเจพ เจธเจ•เจฆเจพ เจนเฉˆ (เจ‰เจฆเจพเจนเจฐเจจ df['col_name']), เจœเจพเจ‚ เจฎเจฟเจ†เจฆ เจฆเฉ‡ เจฌเจพเจ…เจฆ เจนเจตเจพเจฒเฉ‡ เจคเฉ‹เจ‚ เจฌเจฟเจจเจพเจ‚ (เจ‰เจฆเจพเจนเจฐเจจ df.col_name).

เจœเฉ‡เจ•เจฐ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ•เจˆ เจธเจผเจฐเจคเจพเจ‚ เจฆเฉเจ†เจฐเจพ เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ, เจคเจพเจ‚ เจนเจฐเฉ‡เจ• เจธเจผเจฐเจค เจจเฉ‚เฉฐ เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจฐเฉฑเจ–เจฟเจ† เจœเจพเจฃเจพ เจšเจพเจนเฉ€เจฆเจพ เจนเฉˆเฅค เจฒเจพเจœเจผเฉ€เจ•เจฒ เจธเจฅเจฟเจคเฉ€เจ†เจ‚ เจ†เจชเจฐเฉ‡เจŸเจฐเจพเจ‚ เจฆเฉเจ†เจฐเจพ เจ‡เฉฑเจ• เจฆเฉ‚เจœเฉ‡ เจจเจพเจฒ เจœเฉเฉœเฉ€เจ†เจ‚ เจนเฉเฉฐเจฆเฉ€เจ†เจ‚ เจนเจจ & ะธ |.

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจซเจฟเจฒเจŸเจฐเจฟเฉฐเจ— เจธเจคเจฐ: เจชเจพเจ‚เจกเจพ

# ะคะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ั‚ะฐะฑะปะธั†ั‹
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
ga_nov[ ga_nov['source'] == "google" ]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]

เจกเฉ‡เจŸเจพ เจฆเจพ เจธเจฎเฉ‚เจนเฉ€เจ•เจฐเจจ เจ…เจคเฉ‡ เจ‡เจ•เฉฑเจคเจฐเฉ€เจ•เจฐเจจ

เจกเฉ‡เจŸเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจตเจฟเฉฑเจš เจธเจญ เจคเฉ‹เจ‚ เจตเฉฑเจง เจตเจฐเจคเฉ‡ เจœเจพเจฃ เจตเจพเจฒเฉ‡ เจ•เจพเจฐเจœเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ‡เฉฑเจ• เจนเฉˆ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจเฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจ‡เจนเจจเจพเจ‚ เจ•เจพเจฐเจตเจพเจˆเจ†เจ‚ เจจเฉ‚เฉฐ เจ•เจฐเจจ เจฒเจˆ เจธเฉฐเจŸเฉˆเจ•เจธ เจ‰เจนเจจเจพเจ‚ เจธเจพเจฐเฉ‡ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจตเจฟเฉฑเจš เจซเฉˆเจฒเจฟเจ† เจนเฉ‹เจ‡เจ† เจนเฉˆ เจœเจฟเจนเจจเจพเจ‚ เจฆเฉ€ เจ…เจธเฉ€เจ‚ เจธเจฎเฉ€เจ–เจฟเจ† เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚เฅค

เจ‡เจธ เจธเจฅเจฟเจคเฉ€ เจตเจฟเฉฑเจš, เจ…เจธเฉ€เจ‚ เจ‡เฉฑเจ• เจ‰เจฆเจพเจนเจฐเจจ เจตเจœเฉ‹เจ‚ เจ‡เฉฑเจ• เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฒเจตเจพเจ‚เจ—เฉ‡ เจฎเจธเจผเจนเฉ‚เจฐ, เจ…เจคเฉ‡ เจ•เฉˆเจฌเจฟเจจ เจ•เจฒเจพเจธ เจฆเฉ‡ เจ†เจงเจพเจฐ 'เจคเฉ‡ เจŸเจฟเจ•เจŸเจพเจ‚ เจฆเฉ€ เจ—เจฟเจฃเจคเฉ€ เจ…เจคเฉ‡ เจ”เจธเจค เจฒเจพเจ—เจค เจฆเฉ€ เจ—เจฃเจจเจพ เจ•เจฐเฉ‹เฅค

R เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจฆเจพ เจธเจฎเฉ‚เจนเฉ€เจ•เจฐเจจ เจ…เจคเฉ‡ เจ‡เจ•เฉฑเจคเจฐเฉ€เจ•เจฐเจจ: tidyverse, dplyr

ะ’ dplyr เจซเฉฐเจ•เจธเจผเจจ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ group_by(), เจ…เจคเฉ‡ เจเจ•เฉ€เจ•เจฐเจฃ เจฒเจˆ summarise(). เจตเจพเจธเจคเจต เจตเจฟเฉฑเจš, dplyr เจซเฉฐเจ•เจธเจผเจจ เจฆเจพ เจ‡เฉฑเจ• เจชเฉ‚เจฐเจพ เจชเจฐเจฟเจตเจพเจฐ เจนเฉˆ summarise_*(), เจชเจฐ เจ‡เจธ เจฒเฉ‡เจ– เจฆเจพ เจ‰เจฆเฉ‡เจธเจผ เจฎเฉ‚เจฒ เจธเฉฐเจŸเฉˆเจ•เจธ เจฆเฉ€ เจคเฉเจฒเจจเจพ เจ•เจฐเจจเจพ เจนเฉˆ, เจ‡เจธ เจฒเจˆ เจ…เจธเฉ€เจ‚ เจ…เจœเจฟเจนเฉ‡ เจœเฉฐเจ—เจฒ เจตเจฟเฉฑเจš เจจเจนเฉ€เจ‚ เจœเจพเจตเจพเจ‚เจ—เฉ‡เฅค

เจฎเฉ‚เจฒ เจเจ•เฉ€เจ•เจฐเจฃ เจซเฉฐเจ•เจธเจผเจจ:

  • sum() - เจธเจพเจฐ
  • min() / max() - เจจเจฟเจŠเจจเจคเจฎ เจ…เจคเฉ‡ เจตเฉฑเจง เจคเฉ‹เจ‚ เจตเฉฑเจง เจฎเฉเฉฑเจฒ
  • mean() - เจ”เจธเจค
  • median() - เจฎเฉฑเจง
  • length() - เจฎเจพเจคเจฐเจพ

R: dplyr เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ

## dplyr
### ะณั€ัƒะฟะฟะธั€ะพะฒะบะฐ ะธ ะฐะณั€ะตะณะฐั†ะธั ัั‚ั€ะพะบ
group_by(titanic, Pclass) %>%
  summarise(passangers = length(PassengerId),
            avg_price  = mean(Fare))

เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ group_by() เจ…เจธเฉ€เจ‚ เจชเจนเจฟเจฒเฉ€ เจฆเจฒเฉ€เจฒ เจตเจœเฉ‹เจ‚ เจธเจพเจฐเจฃเฉ€ เจจเฉ‚เฉฐ เจชเจพเจธ เจ•เฉ€เจคเจพ เจฎเจธเจผเจนเฉ‚เจฐ, เจ…เจคเฉ‡ เจซเจฟเจฐ เจ–เฉ‡เจคเจฐ เจจเฉ‚เฉฐ เจธเฉฐเจ•เฉ‡เจค เจ•เฉ€เจคเจพ Pclass, เจœเจฟเจธ เจฆเฉเจ†เจฐเจพ เจ…เจธเฉ€เจ‚ เจ†เจชเจฃเฉ‡ เจŸเฉ‡เจฌเจฒ เจจเฉ‚เฉฐ เจธเจฎเฉ‚เจน เจ•เจฐเจพเจ‚เจ—เฉ‡เฅค เจ†เจชเจฐเฉ‡เจŸเจฐ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹เจ เจ‡เจธ เจ•เจพเจฐเจตเจพเจˆ เจฆเจพ เจจเจคเฉ€เจœเจพ %>% เจซเฉฐเจ•เจธเจผเจจ เจฒเจˆ เจชเจนเจฟเจฒเฉ€ เจฆเจฒเฉ€เจฒ เจตเจœเฉ‹เจ‚ เจชเจพเจธ เจ•เฉ€เจคเจพ เจ—เจฟเจ† summarise(), เจ…เจคเฉ‡ 2 เจนเฉ‹เจฐ เจ–เฉ‡เจคเจฐ เจธเจผเจพเจฎเจฒ เจ•เฉ€เจคเฉ‡: เจฏเจพเจคเจฐเฉ€ ะธ เจ”เจธเจค_เจ•เฉ€เจฎเจค. เจชเจนเจฟเจฒเจพเจ‚, เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹เจ length() เจŸเจฟเจ•เจŸเจพเจ‚ เจฆเฉ€ เจ—เจฟเจฃเจคเฉ€ เจฆเฉ€ เจ—เจฃเจจเจพ เจ•เฉ€เจคเฉ€, เจ…เจคเฉ‡ เจฆเฉ‚เจœเฉ‡ เจตเจฟเฉฑเจš เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจ•เฉ‡ mean() เจ”เจธเจค เจŸเจฟเจ•เจŸ เจฆเฉ€ เจ•เฉ€เจฎเจค เจชเฉเจฐเจพเจชเจค เจ•เฉ€เจคเฉ€.

R: data.table เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจฆเจพ เจธเจฎเฉ‚เจนเฉ€เจ•เจฐเจจ เจ…เจคเฉ‡ เจ‡เจ•เฉฑเจคเจฐเฉ€เจ•เจฐเจจ

ะ’ data.table เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸ เจจเฉ‚เฉฐ เจเจ•เฉ€เจ•เจฐเจฃ เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ j เจœเจฟเจธเจฆเจพ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจฆเฉ‚เจœเจพ เจธเจฅเจพเจจ เจนเฉˆ, เจ…เจคเฉ‡ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจฒเจˆ by เจœ keyby, เจœเจฟเจจเฉเจนเจพเจ‚ เจฆเจพ เจคเฉ€เจœเจพ เจธเจฅเจพเจจ เจนเฉˆเฅค

เจ‡เจธ เจ•เฉ‡เจธ เจตเจฟเฉฑเจš เจเจ•เฉ€เจ•เจฐเจฃ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเฉ€ เจธเฉ‚เจšเฉ€ เจตเจฟเฉฑเจš เจตเจฐเจฃเจจ เจ•เฉ€เจคเฉ‡ เจธเจฎเจพเจจ เจนเฉˆ dplyr, เจ•เจฟเจ‰เจ‚เจ•เจฟ เจ‡เจน เจฎเฉ‚เจฒ R เจธเฉฐเจŸเฉˆเจ•เจธ เจคเฉ‹เจ‚ เจซเฉฐเจ•เจธเจผเจจ เจนเจจเฅค

R: data.table เจตเจฟเฉฑเจš เจธเจฎเฉ‚เจนเฉ€เจ•เจฐเจจ เจ…เจคเฉ‡ เจ‡เจ•เฉฑเจคเจฐเฉ€เจ•เจฐเจจ

## data.table
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
titanic[, .(passangers = length(PassengerId),
            avg_price  = mean(Fare)),
        by = Pclass]

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจฆเจพ เจธเจฎเฉ‚เจนเฉ€เจ•เจฐเจจ เจ…เจคเฉ‡ เจ‡เจ•เฉฑเจคเจฐเฉ€เจ•เจฐเจจ: เจชเจพเจ‚เจกเจพ

เจตเจฟเฉฑเจš เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— pandas เจฆเฉ‡ เจตเจฐเจ—เจพ dplyr, เจชเจฐ เจเจ•เฉ€เจ•เจฐเจจ เจธเจฎเจพเจจ เจจเจนเฉ€เจ‚ เจนเฉˆ dplyr เจšเจพเจฒเฉ‚ เจจเจนเฉ€เจ‚ data.table.

เจธเจฎเฉ‚เจน เจ•เจฐเจจ เจฒเจˆ, เจตเจฟเจงเฉ€ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ‹ groupby(), เจœเจฟเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ€ เจ‡เฉฑเจ• เจธเฉ‚เจšเฉ€ เจชเจพเจธ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ เจœเจฟเจธ เจฆเฉเจ†เจฐเจพ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจจเฉ‚เฉฐ เจธเจฎเฉ‚เจนเจฌเฉฑเจง เจ•เฉ€เจคเจพ เจœเจพเจตเฉ‡เจ—เจพเฅค

เจเจ•เฉ€เจ•เจฐเจฃ เจฒเจˆ เจคเฉเจธเฉ€เจ‚ เจตเจฟเจงเฉ€ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเฉ‹ agg()เจœเฉ‹ เจ‡เฉฑเจ• เจธเจผเจฌเจฆเจ•เฉ‹เจธเจผ เจจเฉ‚เฉฐ เจธเจตเฉ€เจ•เจพเจฐ เจ•เจฐเจฆเจพ เจนเฉˆเฅค เจกเจฟเจ•เจธเจผเจจเจฐเฉ€ เจ•เฉเฉฐเจœเฉ€เจ†เจ‚ เจ‰เจน เจ•เจพเจฒเจฎ เจนเจจ เจœเจฟเจจเฉเจนเจพเจ‚ 'เจคเฉ‡ เจคเฉเจธเฉ€เจ‚ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจจเฉ‚เฉฐ เจฒเจพเจ—เฉ‚ เจ•เจฐเฉ‹เจ—เฉ‡, เจ…เจคเฉ‡ เจฎเฉเฉฑเจฒ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเฉ‡ เจจเจพเจฎ เจนเจจเฅค

เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ เจซเฉฐเจ•เจธเจผเจจ:

  • sum() - เจธเจพเจฐ
  • min() / max() - เจจเจฟเจŠเจจเจคเจฎ เจ…เจคเฉ‡ เจตเฉฑเจง เจคเฉ‹เจ‚ เจตเฉฑเจง เจฎเฉเฉฑเจฒ
  • mean() - เจ”เจธเจค
  • median() - เจฎเฉฑเจง
  • count() - เจฎเจพเจคเจฐเจพ

เจซเฉฐเจ•เจธเจผเจจ reset_index() เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ€ เจ‰เจฆเจพเจนเจฐเจจ เจตเจฟเฉฑเจš เจ‡เจธเจจเฉ‚เฉฐ เจจเฉ‡เจธเจŸเจก เจ‡เฉฐเจกเฉˆเจ•เจธ เจจเฉ‚เฉฐ เจฐเฉ€เจธเฉˆเจŸ เจ•เจฐเจจ เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ pandas เจกเจพเจŸเจพ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ เจคเฉ‹เจ‚ เจฌเจพเจ…เจฆ เจกเจฟเจซเจพเจฒเจŸเฅค

เจจเจฟเจธเจผเจพเจจ เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ…เจ—เจฒเฉ€ เจฒเจพเจˆเจจ 'เจคเฉ‡ เจœเจพเจฃ เจฆเฉ€ เจ‡เจœเจพเจœเจผเจค เจฆเจฟเฉฐเจฆเจพ เจนเฉˆเฅค

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจธเจฎเฉ‚เจนเฉ€เจ•เจฐเจจ เจ…เจคเฉ‡ เจ‡เจ•เฉฑเจคเจฐเฉ€เจ•เจฐเจจ: เจชเจพเจ‚เจกเจพ

# ะณั€ัƒะฟะฟะธั€ะพะฒะบะฐ ะธ ะฐะณั€ะตะณะฐั†ะธั ะดะฐะฝะฝั‹ั…
titanic.groupby(["Pclass"]).
    agg({'PassengerId': 'count', 'Fare': 'mean'}).
        reset_index()

เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจฒเฉฐเจฌเจ•เจพเจฐเฉ€ เจœเฉ‹เฉœ

เจ‡เฉฑเจ• เจ“เจชเจฐเฉ‡เจธเจผเจจ เจœเจฟเจธ เจตเจฟเฉฑเจš เจคเฉเจธเฉ€เจ‚ เจ‡เฉฑเจ•เฉ‹ เจขเจพเจ‚เจšเฉ‡ เจฆเฉ€เจ†เจ‚ เจฆเฉ‹ เจœเจพเจ‚ เจตเฉฑเจง เจŸเฉ‡เจฌเจฒเจพเจ‚ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจนเฉเฉฐเจฆเฉ‡ เจนเฉ‹เฅค เจธเจพเจกเฉ‡ เจฆเฉเจ†เจฐเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเฉ‡ เจ—เจ เจกเฉ‡เจŸเจพ เจตเจฟเฉฑเจš เจŸเฉ‡เจฌเจฒ เจธเจผเจพเจฎเจฒ เจนเจจ ga_nov ะธ ga_dec. เจ‡เจน เจŸเฉ‡เจฌเจฒ เจฌเจฃเจคเจฐ เจตเจฟเฉฑเจš เจ‡เฉฑเจ•เฉ‹ เจœเจฟเจนเฉ‡ เจนเจจ, เจฏเจพเจจเฉ€. เจ‡เจนเจจเจพเจ‚ เจ•เจพเจฒเจฎเจพเจ‚ เจตเจฟเฉฑเจš เจ‡เฉฑเจ•เฉ‹ เจœเจฟเจนเฉ‡ เจ•เจพเจฒเจฎ, เจ…เจคเฉ‡ เจกเจพเจŸเจพ เจ•เจฟเจธเจฎเจพเจ‚ เจนเจจเฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจ‡เจน เจจเจตเฉฐเจฌเจฐ เจ…เจคเฉ‡ เจฆเจธเฉฐเจฌเจฐ เจฆเฉ‡ เจฎเจนเฉ€เจจเฉ‡ เจฒเจˆ เจ—เฉ‚เจ—เจฒ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจคเฉ‹เจ‚ เจ‡เฉฑเจ• เจ…เจชเจฒเฉ‹เจก เจนเฉˆ, เจ‡เจธ เจญเจพเจ— เจตเจฟเฉฑเจš เจ…เจธเฉ€เจ‚ เจ‡เจธ เจกเฉ‡เจŸเจพ เจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจธเจพเจฐเจฃเฉ€ เจตเจฟเฉฑเจš เจœเฉ‹เฉœเจพเจ‚เจ—เฉ‡เฅค

เจฒเฉฐเจฌเจ•เจพเจฐเฉ€ เจฐเฉ‚เจช เจตเจฟเฉฑเจš R เจตเจฟเฉฑเจš เจธเจพเจฐเจฃเฉ€เจ†เจ‚ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจจเจพ: tidyverse, dplyr

ะ’ dplyr เจคเฉเจธเฉ€เจ‚ เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจ•เฉ‡ 2 เจŸเฉ‡เจฌเจฒเจพเจ‚ เจจเฉ‚เฉฐ เจ‡เฉฑเจ• เจตเจฟเฉฑเจš เจœเฉ‹เฉœ เจธเจ•เจฆเฉ‡ เจนเฉ‹ bind_rows(), เจ‡เจธเจฆเฉ‡ เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸเจพเจ‚ เจตเจœเฉ‹เจ‚ เจŸเฉ‡เจฌเจฒ เจชเจพเจธ เจ•เจฐเจจเจพเฅค

R: dplyr เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ

# ะ’ะตั€ั‚ะธะบะฐะปัŒะฝะพะต ะพะฑัŠะตะดะธะฝะตะฝะธะต ั‚ะฐะฑะปะธั†
## dplyr
bind_rows(ga_nov, ga_dec)

R: data.table เจตเจฟเฉฑเจš เจฒเฉฐเจฌเจ•เจพเจฐเฉ€ เจคเฉŒเจฐ 'เจคเฉ‡ เจธเจพเจฐเจฃเฉ€เจ†เจ‚ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจจเจพ

เจ‡เจน เจ•เฉเจ เจตเฉ€ เจ—เฉเฉฐเจเจฒเจฆเจพเจฐ เจจเจนเฉ€เจ‚ เจนเฉˆ, เจ†เจ“ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ€เจ rbind().

R: data.table เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ

## data.table
rbind(ga_nov, ga_dec)

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจฒเฉฐเจฌเจ•เจพเจฐเฉ€ เจคเฉŒเจฐ 'เจคเฉ‡ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจนเฉ‹เจฃเจพ: เจชเจพเจ‚เจกเจพ

ะ’ pandas เจซเฉฐเจ•เจธเจผเจจ เจŸเฉ‡เจฌเจฒ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจจ เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ concat(), เจœเจฟเจธ เจตเจฟเฉฑเจš เจคเฉเจนเจพเจจเฉ‚เฉฐ เจ‰เจนเจจเจพเจ‚ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจจ เจฒเจˆ เจซเจฐเฉ‡เจฎเจพเจ‚ เจฆเฉ€ เจ‡เฉฑเจ• เจธเฉ‚เจšเฉ€ เจชเจพเจธ เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆเฅค

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจซเจฟเจฒเจŸเจฐเจฟเฉฐเจ— เจธเจคเจฐ: เจชเจพเจ‚เจกเจพ

# ะฒะตั€ั‚ะธะบะฐะปัŒะฝะพะต ะพะฑัŠะตะดะธะฝะตะฝะธะต ั‚ะฐะฑะปะธั†
pd.concat([ga_nov, ga_dec])

เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจนเจฐเฉ€เจœเฉฑเจŸเจฒ เจœเฉ‹เฉœ

เจ‡เฉฑเจ• เจ“เจชเจฐเฉ‡เจธเจผเจจ เจœเจฟเจธ เจตเจฟเฉฑเจš เจฆเฉ‚เจœเฉ€ เจคเฉ‹เจ‚ เจ•เจพเจฒเจฎ เจ•เฉเฉฐเจœเฉ€ เจฆเฉเจ†เจฐเจพ เจชเจนเจฟเจฒเฉ€ เจธเจพเจฐเจฃเฉ€ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจ•เฉ€เจคเฉ‡ เจœเจพเจ‚เจฆเฉ‡ เจนเจจเฅค เจ‡เจน เจ…เจ•เจธเจฐ เจ•เฉเจ เจธเฉฐเจฆเจฐเจญ เจกเฉ‡เจŸเจพ (เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆ, เจ•เจฟเจธเฉ‡ เจ‰เจคเจชเจพเจฆ เจฆเฉ€ เจฒเจพเจ—เจค) เจฆเฉ‡ เจจเจพเจฒ เจ‡เฉฑเจ• เจคเฉฑเจฅ เจธเจพเจฐเจฃเฉ€ (เจ‰เจฆเจพเจนเจฐเจฃ เจตเจœเฉ‹เจ‚, เจตเจฟเจ•เจฐเฉ€ เจกเฉ‡เจŸเจพ เจตเจพเจฒเฉ€ เจ‡เฉฑเจ• เจธเจพเจฐเจฃเฉ€) เจจเฉ‚เฉฐ เจญเจฐเจชเฉ‚เจฐ เจฌเจฃเจพเจ‰เจฃ เจตเฉ‡เจฒเฉ‡ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆเฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจœเฉ‹เฉœเจพเจ‚ เจฆเฉ€เจ†เจ‚ เจ•เจˆ เจ•เจฟเจธเจฎเจพเจ‚ เจนเจจ:

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจชเจนเจฟเจฒเจพเจ‚ เจฒเฉ‹เจก เจ•เฉ€เจคเฉ€ เจธเจพเจฐเจฃเฉ€ เจตเจฟเฉฑเจš เจฎเจธเจผเจนเฉ‚เจฐ เจธเจพเจกเฉ‡ เจ•เฉ‹เจฒ เจ‡เฉฑเจ• เจ•เจพเจฒเจฎ เจนเฉˆ เจฒเจฟเฉฐเจ—, เจœเฉ‹ เจฏเจพเจคเจฐเฉ€ เจฆเฉ‡ เจฒเจฟเฉฐเจ— เจ•เฉ‹เจก เจจเจพเจฒ เจฎเฉ‡เจฒ เจ–เจพเจ‚เจฆเจพ เจนเฉˆ:

1 - เจ”เจฐเจค
2 - เจชเฉเจฐเจธเจผ

เจจเจพเจฒ เจนเฉ€, เจ…เจธเฉ€เจ‚ เจ‡เฉฑเจ• เจธเจพเจฐเจฃเฉ€ เจฌเจฃเจพเจˆ เจนเฉˆ - เจ‡เฉฑเจ• เจนเจตเจพเจฒเจพ เจ•เจฟเจคเจพเจฌ เจฒเจฟเฉฐเจ—. เจฏเจพเจคเจฐเฉ€เจ†เจ‚ เจฆเฉ‡ เจฒเจฟเฉฐเจ— 'เจคเฉ‡ เจกเฉ‡เจŸเจพ เจฆเฉ€ เจตเจงเฉ‡เจฐเฉ‡ เจธเฉเจตเจฟเจงเจพเจœเจจเจ• เจชเฉ‡เจธเจผเจ•เจพเจฐเฉ€ เจฒเจˆ, เจธเจพเจจเฉ‚เฉฐ เจกเจพเจ‡เจฐเฉˆเจ•เจŸเจฐเฉ€ เจคเฉ‹เจ‚ เจฒเจฟเฉฐเจ— เจฆเจพ เจจเจพเจฎ เจœเฉ‹เฉœเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ เจฒเจฟเฉฐเจ— เจฎเฉ‡เจœเจผ เจจเฉ‚เฉฐ เจฎเจธเจผเจนเฉ‚เจฐ.

เจนเจฐเฉ€เจœเจผเฉฑเจŸเจฒ เจŸเฉ‡เจฌเจฒ เจจเฉ‚เฉฐ R เจตเจฟเฉฑเจš เจœเฉ‹เฉœเฉ‹: tidyverse, dplyr

ะ’ dplyr เจนเจฐเฉ€เจœเฉฑเจŸเจฒ เจœเฉ‹เฉœเจจ เจฒเจˆ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเจพ เจ‡เฉฑเจ• เจชเฉ‚เจฐเจพ เจชเจฐเจฟเจตเจพเจฐ เจนเฉˆ:

  • inner_join()
  • left_join()
  • right_join()
  • full_join()
  • semi_join()
  • nest_join()
  • anti_join()

เจฎเฉ‡เจฐเฉ‡ เจ…เจญเจฟเจ†เจธ เจตเจฟเฉฑเจš เจธเจญ เจคเฉ‹เจ‚ เจตเฉฑเจง เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ left_join().

เจชเจนเจฟเจฒเฉ‡ เจฆเฉ‹ เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸเจพเจ‚ เจฆเฉ‡ เจฐเฉ‚เจช เจตเจฟเฉฑเจš, เจ‰เฉฑเจชเจฐ เจธเฉ‚เจšเฉ€เจฌเฉฑเจง เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ‹ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจจ เจฒเจˆ เจฒเฉˆเจ‚เจฆเฉ‡ เจนเจจ, เจ…เจคเฉ‡ เจคเฉ€เจœเฉ‡ เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸ เจฆเฉ‡ เจฐเฉ‚เจช เจตเจฟเฉฑเจš by เจคเฉเจนเจพเจจเฉ‚เฉฐ เจธเจผเจพเจฎเจฒ เจนเฉ‹เจฃ เจฒเจˆ เจ•เจพเจฒเจฎเจพเจ‚ เจจเฉ‚เฉฐ เจจเจฟเจธเจผเจšเจฟเจค เจ•เจฐเจจเจพ เจšเจพเจนเฉ€เจฆเจพ เจนเฉˆเฅค

เจนเจฐเฉ€เจœเฉฑเจŸเจฒ เจŸเฉ‡เจฌเจฒ เจจเฉ‚เฉฐ R: dplyr เจตเจฟเฉฑเจš เจœเฉ‹เฉœเฉ‹

# ะพะฑัŠะตะดะธะฝัะตะผ ั‚ะฐะฑะปะธั†ั‹
left_join(titanic, gender,
          by = c("Sex" = "id"))

R: data.table เจตเจฟเฉฑเจš เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจนเจฐเฉ€เจœเฉฑเจŸเจฒ เจœเฉ‹เฉœเจจเจพ

ะ’ data.table เจคเฉเจนเจพเจจเฉ‚เฉฐ เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจ•เฉ‡ เจ•เฉเฉฐเจœเฉ€ เจฆเฉเจ†เจฐเจพ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจนเฉ‹เจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ merge().

data.table เจตเจฟเฉฑเจš เจฎเจฐเจœ() เจซเฉฐเจ•เจธเจผเจจ เจฒเจˆ เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸเจธ

  • x, y โ€” เจœเฉเฉœเจจ เจฒเจˆ เจŸเฉ‡เจฌเจฒ
  • เจฆเฉเจ†เจฐเจพ โ€” เจ•เจพเจฒเจฎ เจœเฉ‹ เจ•เจฟ เจœเฉเฉœเจจ เจฆเฉ€ เจ•เฉเฉฐเจœเฉ€ เจนเฉˆ เจœเฉ‡เจ•เจฐ เจ‡เจธเจฆเจพ เจฆเฉ‹เจจเจพเจ‚ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจตเจฟเฉฑเจš เจ‡เฉฑเจ•เฉ‹ เจจเจพเจฎ เจนเฉˆ
  • by.x, by.y โ€” เจ…เจญเฉ‡เจฆ เจ•เฉ€เจคเฉ‡ เจœเจพเจฃ เจตเจพเจฒเฉ‡ เจ•เจพเจฒเจฎ เจจเจพเจฎ, เจœเฉ‡เจ•เจฐ เจ‰เจนเจจเจพเจ‚ เจฆเฉ‡ เจŸเฉ‡เจฌเจฒ เจตเจฟเฉฑเจš เจตเฉฑเจ–เจฐเฉ‡ เจจเจพเจฎ เจนเจจ
  • all, all.x, all.y โ€” เจœเฉ‹เฉœเจจ เจฆเฉ€ เจ•เจฟเจธเจฎ, เจธเจพเจฐเฉ‡ เจฆเฉ‹เจตเจพเจ‚ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจคเฉ‹เจ‚ เจธเจพเจฐเฉ€เจ†เจ‚ เจ•เจคเจพเจฐเจพเจ‚ เจตเจพเจชเจธ เจ•เจฐ เจฆเฉ‡เจตเฉ‡เจ—เจพ, all.x เจ–เฉฑเจฌเฉ‡ เจœเฉ‹เฉœเจจ เจฆเฉ€ เจ•เจพเจฐเจตเจพเจˆ เจจเจพเจฒ เจฎเฉ‡เจฒ เจ–เจพเจ‚เจฆเจพ เจนเฉˆ (เจชเจนเจฟเจฒเฉ€ เจธเจพเจฐเจฃเฉ€ เจฆเฉ€เจ†เจ‚ เจธเจพเจฐเฉ€เจ†เจ‚ เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจ›เฉฑเจก เจฆเฉ‡เจตเฉ‡เจ—เจพ), all.y โ€” เจจเจพเจฒ เจฎเฉ‡เจฒ เจ–เจพเจ‚เจฆเจพ เจนเฉˆ เจฐเจพเจˆเจŸ เจœเฉเจ†เจ‡เจจ เจ“เจชเจฐเฉ‡เจธเจผเจจ (เจฆเฉ‚เจœเฉ€ เจธเจพเจฐเจฃเฉ€ เจฆเฉ€เจ†เจ‚ เจธเจพเจฐเฉ€เจ†เจ‚ เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจ›เฉฑเจก เจฆเฉ‡เจตเฉ‡เจ—เจพ)เฅค

R: data.table เจตเจฟเฉฑเจš เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจนเจฐเฉ€เจœเฉฑเจŸเจฒ เจœเฉ‹เฉœเจจเจพ

# ะพะฑัŠะตะดะธะฝัะตะผ ั‚ะฐะฑะปะธั†ั‹
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)

เจฒเฉ‡เจŸเจตเฉ€เจ‚ เจธเจพเจฐเจฃเฉ€ เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจนเฉเฉฐเจฆเฉ€ เจนเฉˆ: เจชเจพเจ‚เจกเจพ

เจฆเฉ‡ เจจเจพเจฒ เจจเจพเจฒ เจตเจฟเฉฑเจš data.table, เจตเจฟเจš pandas เจซเฉฐเจ•เจธเจผเจจ เจŸเฉ‡เจฌเจฒ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจจ เจฒเจˆ เจตเจฐเจคเจฟเจ† เจœเจพเจ‚เจฆเจพ เจนเฉˆ merge().

เจชเจพเจ‚เจกเจฟเจ†เจ‚ เจตเจฟเฉฑเจš เจฎเจฐเจœ() เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€เจ†เจ‚ เจ†เจฐเจ—เฉ‚เจฎเฉˆเจ‚เจŸเจธ

  • เจ•เจฟเจตเฉ‡เจ‚ - เจ•เจจเฉˆเจ•เจธเจผเจจ เจฆเฉ€ เจ•เจฟเจธเจฎ: เจ–เฉฑเจฌเฉ‡, เจธเฉฑเจœเฉ‡, เจฌเจพเจนเจฐเฉ€, เจ…เฉฐเจฆเจฐเฉ‚เจจเฉ€
  • on โ€” เจ•เจพเจฒเจฎ เจœเฉ‹ เจ•เจฟ เจ‡เฉฑเจ• เจ•เฉเฉฐเจœเฉ€ เจนเฉˆ เจœเฉ‡เจ•เจฐ เจ‡เจธเจฆเจพ เจฆเฉ‹เจจเจพเจ‚ เจŸเฉ‡เจฌเจฒเจพเจ‚ เจตเจฟเฉฑเจš เจ‡เฉฑเจ•เฉ‹ เจจเจพเจฎ เจนเฉˆ
  • left_on, right_on โ€” เจ•เฉเฉฐเจœเฉ€ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ‡ เจจเจพเจฎ, เจœเฉ‡เจ•เจฐ เจ‰เจนเจจเจพเจ‚ เจฆเฉ‡ เจŸเฉ‡เจฌเจฒ เจตเจฟเฉฑเจš เจตเฉฑเจ–เจฐเฉ‡ เจจเจพเจฎ เจนเจจ

เจฒเฉ‡เจŸเจตเฉ€เจ‚ เจธเจพเจฐเจฃเฉ€ เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจธเจผเจพเจฎเจฒ เจนเฉเฉฐเจฆเฉ€ เจนเฉˆ: เจชเจพเจ‚เจกเจพ

# ะพะฑัŠะตะดะธะฝัะตะผ ะฟะพ ะบะปัŽั‡ัƒ
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")

เจฎเฉ‚เจฒ เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ เจ…เจคเฉ‡ เจ—เจฃเจจเจพ เจ•เฉ€เจคเฉ‡ เจ•เจพเจฒเจฎ

เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเฉ‡ เจ…เจฐเจฅเจพเจ‚ เจตเจฟเฉฑเจš เจธเจฎเจพเจจ เจนเจจ, เจ…เจคเฉ‡ เจ…เจ•เจธเจฐ เจกเฉ‡เจŸเจพ เจตเจฟเจธเจผเจฒเฉ‡เจธเจผเจฃ เจตเจฟเฉฑเจš เจตเฉ€ เจตเจฐเจคเฉ‡ เจœเจพเจ‚เจฆเฉ‡ เจนเจจเฅค เจชเจฐ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ เจซเฉฐเจ•เจธเจผเจจเจพเจ‚ เจฆเฉ‡ เจ‰เจฒเจŸ, เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ เจ†เจŠเจŸเจ—เฉ‹เจ‡เฉฐเจ— เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฆเฉ€เจ†เจ‚ เจ•เจคเจพเจฐเจพเจ‚ เจฆเฉ€ เจธเฉฐเจ–เจฟเจ† เจจเฉ‚เฉฐ เจจเจนเฉ€เจ‚ เจฌเจฆเจฒเจฆเฉ‡ เจนเจจเฅค

เจกเจพเจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจšเฉเจฃเจจเฉ€ เจนเฉˆ - R เจœเจพเจ‚ Python? เจฆเฉ‹เจจเฉ‹! เจชเจพเจ‚เจกเจพ เจคเฉ‹เจ‚ tidyverse เจ…เจคเฉ‡ data.table เจ…เจคเฉ‡ เจชเจฟเฉฑเจ›เฉ‡ เจตเฉฑเจฒ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ

เจœเจผเจฐเฉ‚เจฐเฉ€ เจคเฉŒเจฐ 'เจคเฉ‡, เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹เจ, เจ…เจธเฉ€เจ‚ เจ†เจ‰เจฃ เจตเจพเจฒเฉ‡ เจกเฉ‡เจŸเจพเจซเฉเจฐเฉ‡เจฎ เจจเฉ‚เฉฐ เจ•เฉเจ เจฎเจพเจชเจฆเฉฐเจกเจพเจ‚ เจฆเฉ‡ เจ…เจจเฉเจธเจพเจฐ เจนเจฟเฉฑเจธเจฟเจ†เจ‚ เจตเจฟเฉฑเจš เจตเฉฐเจกเจฆเฉ‡ เจนเจพเจ‚, เจœเจฟเจตเฉ‡เจ‚ เจ•เจฟ. เจ‡เฉฑเจ• เจ–เฉ‡เจคเจฐ, เจœเจพเจ‚ เจ•เจˆ เจ–เฉ‡เจคเจฐเจพเจ‚ เจฆเฉ‡ เจฎเฉเฉฑเจฒ เจฆเฉเจ†เจฐเจพเฅค เจ…เจคเฉ‡ เจ…เจธเฉ€เจ‚ เจนเจฐเฉ‡เจ• เจตเจฟเฉฐเจกเฉ‹ 'เจคเฉ‡ เจ…เฉฐเจ•เจ—เจฃเจฟเจค เจฆเฉ€เจ†เจ‚ เจ•เจพเจฐเจตเจพเจˆเจ†เจ‚ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚เฅค เจ‡เจนเจจเจพเจ‚ เจ“เจชเจฐเฉ‡เจธเจผเจจเจพเจ‚ เจฆเจพ เจจเจคเฉ€เจœเจพ เจนเจฐเฉ‡เจ• เจฒเจพเจˆเจจ เจตเจฟเฉฑเจš เจตเจพเจชเจธ เจ•เฉ€เจคเจพ เจœเจพเจตเฉ‡เจ—เจพ, i.e. เจธเจพเจฐเจฃเฉ€ เจตเจฟเฉฑเจš เจ•เจคเจพเจฐเจพเจ‚ เจฆเฉ€ เจ•เฉเฉฑเจฒ เจธเฉฐเจ–เจฟเจ† เจจเฉ‚เฉฐ เจฌเจฆเจฒเฉ‡ เจฌเจฟเจจเจพเจ‚เฅค

เจ‰เจฆเจพเจนเจฐเจจ เจฒเจˆ, เจ†เจ‰ เจธเจพเจฐเจฃเฉ€ เจจเฉ‚เฉฐ เจฒเฉˆเจ‚เจฆเฉ‡ เจนเจพเจ‚ เจฎเจธเจผเจนเฉ‚เจฐ. เจ…เจธเฉ€เจ‚ เจ‡เจธเจฆเฉ€ เจ•เฉˆเจฌเจฟเจจ เจ•เจฒเจพเจธ เจฆเฉ‡ เจ…เฉฐเจฆเจฐ เจนเจฐเฉ‡เจ• เจŸเจฟเจ•เจŸ เจฆเฉ€ เจ•เฉ€เจฎเจค เจ•เจฟเฉฐเจจเฉ€ เจชเฉเจฐเจคเฉ€เจธเจผเจค เจฆเฉ€ เจ—เจฃเจจเจพ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเจพเจ‚เฅค

เจ…เจœเจฟเจนเจพ เจ•เจฐเจจ เจฒเจˆ, เจธเจพเจจเฉ‚เฉฐ เจนเจฐเฉ‡เจ• เจฒเจพเจˆเจจ เจตเจฟเฉฑเจš เจฎเฉŒเจœเฉ‚เจฆเจพ เจ•เฉˆเจฌเจฟเจจ เจ•เจฒเจพเจธ เจฒเจˆ เจŸเจฟเจ•เจŸ เจฆเฉ€ เจ•เฉเฉฑเจฒ เจ•เฉ€เจฎเจค เจชเฉเจฐเจพเจชเจค เจ•เจฐเจจ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ เจœเจฟเจธ เจจเจพเจฒ เจ‡เจธ เจฒเจพเจˆเจจ เจตเจฟเฉฑเจš เจŸเจฟเจ•เจŸ เจธเจฌเฉฐเจงเจค เจนเฉˆ, เจซเจฟเจฐ เจนเจฐเฉ‡เจ• เจŸเจฟเจ•เจŸ เจฆเฉ€ เจ•เฉ€เจฎเจค เจจเฉ‚เฉฐ เจ‰เจธเฉ‡ เจ•เฉˆเจฌเจฟเจจ เจ•เจฒเจพเจธ เจฆเฉ€เจ†เจ‚ เจธเจพเจฐเฉ€เจ†เจ‚ เจŸเจฟเจ•เจŸเจพเจ‚ เจฆเฉ€ เจ•เฉเฉฑเจฒ เจ•เฉ€เจฎเจค เจจเจพเจฒ เจตเฉฐเจกเฉ‹เฅค .

R เจตเจฟเฉฑเจš เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ: tidyverse, dplyr

เจ•เจคเจพเจฐ เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เฉ€เจคเฉ‡ เจฌเจฟเจจเจพเจ‚, เจจเจตเฉ‡เจ‚ เจ•เจพเจฒเจฎ เจœเฉ‹เฉœเจจ เจฒเจˆ, เจตเจฟเฉฑเจš dplyr เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจธเฉ‡เจตเจพ เจ•เจฐเจฆเจพ เจนเฉˆ mutate().

เจคเฉเจธเฉ€เจ‚ เจซเฉ€เจฒเจก เจฆเฉเจ†เจฐเจพ เจกเฉ‡เจŸเจพ เจฆเจพ เจธเจฎเฉ‚เจน เจ•เจฐเจ•เฉ‡ เจ‰เฉฑเจชเจฐ เจฆเฉฑเจธเฉ€ เจธเจฎเฉฑเจธเจฟเจ† เจจเฉ‚เฉฐ เจนเฉฑเจฒ เจ•เจฐ เจธเจ•เจฆเฉ‡ เจนเฉ‹ Pclass เจ…เจคเฉ‡ เจ‡เฉฑเจ• เจจเจตเฉ‡เจ‚ เจ•เจพเจฒเจฎ เจตเจฟเฉฑเจš เจซเฉ€เจฒเจก เจฆเจพ เจธเจพเจฐ เจ•เจฐเจจเจพ เจ•เจฟเจฐเจพเจ‡เจ†. เจ…เฉฑเจ—เฉ‡, เจธเจพเจฐเจฃเฉ€ เจจเฉ‚เฉฐ เจ…เจจเจ—เจฐเฉเฉฑเจช เจ•เจฐเฉ‹ เจ…เจคเฉ‡ เจ–เฉ‡เจคเจฐ เจฆเฉ‡ เจฎเฉเฉฑเจฒเจพเจ‚ เจจเฉ‚เฉฐ เจตเฉฐเจกเฉ‹ เจ•เจฟเจฐเจพเจ‡เจ† เจชเจฟเจ›เจฒเฉ‡ เจชเฉœเจพเจ… เจตเจฟเฉฑเจš เจ•เฉ€ เจนเฉ‹เจ‡เจ† เจธเฉ€เฅค

R: dplyr เจตเจฟเฉฑเจš เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ

group_by(titanic, Pclass) %>%
  mutate(Pclass_cost = sum(Fare)) %>%
  ungroup() %>%
  mutate(ticket_fare_rate = Fare / Pclass_cost)

R: data.table เจตเจฟเฉฑเจš เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ

เจนเฉฑเจฒ เจเจฒเจ—เฉ‹เจฐเจฟเจฆเจฎ เจตเจฟเฉฑเจš เจตเจพเจ‚เจ— เจนเฉ€ เจฐเจนเจฟเฉฐเจฆเจพ เจนเฉˆ dplyr, เจธเจพเจจเฉ‚เฉฐ เจŸเฉ‡เจฌเจฒ เจจเฉ‚เฉฐ เจตเจฟเฉฐเจกเฉ‹เจœเจผ เจตเจฟเฉฑเจš เจ–เฉ‡เจคเจฐ เจฆเฉเจ†เจฐเจพ เจตเฉฐเจกเจฃ เจฆเฉ€ เจฒเฉ‹เฉœ เจนเฉˆ Pclass. เจ‡เฉฑเจ• เจจเจตเฉ‡เจ‚ เจ•เจพเจฒเจฎ เจตเจฟเฉฑเจš เจนเจฐเฉ‡เจ• เจ•เจคเจพเจฐ เจฆเฉ‡ เจ…เจจเฉเจธเจพเจฐเฉ€ เจธเจฎเฉ‚เจน เจฒเจˆ เจฐเจ•เจฎ เจฆเจพ เจ†เจ‰เจŸเจชเฉเฉฑเจŸ เจ•เจฐเฉ‹, เจ…เจคเฉ‡ เจ‡เฉฑเจ• เจ•เจพเจฒเจฎ เจธเจผเจพเจฎเจฒ เจ•เจฐเฉ‹ เจœเจฟเจธ เจตเจฟเฉฑเจš เจ…เจธเฉ€เจ‚ เจ‡เจธเจฆเฉ‡ เจธเจฎเฉ‚เจน เจตเจฟเฉฑเจš เจนเจฐเฉ‡เจ• เจŸเจฟเจ•เจŸ เจฆเฉ€ เจ•เฉ€เจฎเจค เจฆเฉ‡ เจนเจฟเฉฑเจธเฉ‡ เจฆเฉ€ เจ—เจฃเจจเจพ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚เฅค

เจตเจฟเฉฑเจš เจจเจตเฉ‡เจ‚ เจ•เจพเจฒเจฎ เจœเฉ‹เฉœเจจ เจฒเจˆ data.table เจ†เจชเจฐเฉ‡เจŸเจฐ เจฎเฉŒเจœเฉ‚เจฆ :=. เจนเฉ‡เจ เจพเจ‚ เจชเฉˆเจ•เฉ‡เจœ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจ•เฉ‡ เจธเจฎเฉฑเจธเจฟเจ† เจจเฉ‚เฉฐ เจนเฉฑเจฒ เจ•เจฐเจจ เจฆเฉ€ เจ‡เฉฑเจ• เจ‰เจฆเจพเจนเจฐเจจ เจนเฉˆ data.table

R: data.table เจตเจฟเฉฑเจš เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ

titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost), 
        by = Pclass]

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ: เจชเจพเจ‚เจกเจพ

เจตเจฟเฉฑเจš เจ‡เฉฑเจ• เจจเจตเจพเจ‚ เจ•เจพเจฒเจฎ เจœเฉ‹เฉœเจจ เจฆเจพ เจ‡เฉฑเจ• เจคเจฐเฉ€เจ•เจพ pandas - เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเฉ‹ assign(). เจ•เฉˆเจฌเจฟเจจ เจ•เจฒเจพเจธ เจฆเฉเจ†เจฐเจพ เจŸเจฟเจ•เจŸเจพเจ‚ เจฆเฉ€ เจ•เฉ€เจฎเจค เจฆเจพ เจธเจพเจฐ เจฆเฉ‡เจฃ เจฒเจˆ, เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจธเจฎเฉ‚เจน เจ•เฉ€เจคเฉ‡ เจฌเจฟเจจเจพเจ‚, เจ…เจธเฉ€เจ‚ เจซเฉฐเจ•เจธเจผเจจ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจพเจ‚เจ—เฉ‡ transform().

เจนเฉ‡เจ เจพเจ‚ เจ‡เฉฑเจ• เจนเฉฑเจฒ เจฆเฉ€ เจ‡เฉฑเจ• เจ‰เจฆเจพเจนเจฐเจฃ เจนเฉˆ เจœเจฟเจธ เจตเจฟเฉฑเจš เจ…เจธเฉ€เจ‚ เจธเจพเจฐเจฃเฉ€ เจตเจฟเฉฑเจš เจœเฉ‹เฉœเจฆเฉ‡ เจนเจพเจ‚ เจฎเจธเจผเจนเฉ‚เจฐ เจ‰เจนเฉ€ 2 เจ•เจพเจฒเจฎเฅค

เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ: เจชเจพเจ‚เจกเจพ

titanic.assign(Pclass_cost      =  titanic.groupby('Pclass').Fare.transform(sum),
               ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])

เจซเฉฐเจ•เจธเจผเจจ เจ…เจคเฉ‡ เจขเฉฐเจ— เจชเฉฑเจคเจฐ เจตเจฟเจนเจพเจฐ เจธเจพเจฐเจฃเฉ€

เจนเฉ‡เจ เจพเจ‚ เจธเจพเจกเฉ‡ เจฆเฉเจ†เจฐเจพ เจตเจฟเจšเจพเจฐเฉ‡ เจ—เจ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจฆเฉ‡ เจจเจพเจฒ เจตเฉฑเจ–-เจตเฉฑเจ– เจ•เจพเจฐเจตเจพเจˆเจ†เจ‚ เจ•เจฐเจจ เจฆเฉ‡ เจคเจฐเฉ€เจ•เจฟเจ†เจ‚ เจตเจฟเจšเจ•เจพเจฐ เจชเฉฑเจคเจฐ เจตเจฟเจนเจพเจฐ เจฆเฉ€ เจ‡เฉฑเจ• เจธเจพเจฐเจฃเฉ€ เจนเฉˆเฅค

เจตเฉ‡เจฐเจตเจพ
เจธเฉเจฅเจฐเจพ
เจกเฉ‡เจŸเจพ.เจŸเฉˆเจฌเจฒ
เจชเฉฐเจกเจพเจธ

เจกเจพเจŸเจพ เจฒเฉ‹เจก เจ•เฉ€เจคเจพ เจœเจพ เจฐเจฟเจนเจพ เจนเฉˆ
vroom()/ readr::read_csv() / readr::read_tsv()
fread()
read_csv()

เจกเจพเจŸเจพเจซเฉเจฐเฉ‡เจฎ เจฌเจฃเจพเจ‰เจฃเจพ
tibble()
data.table()
dict() + from_dict()

เจ•เจพเจฒเจฎ เจšเฉเจฃเจจเจพ
select()
เจ‡เฉฑเจ• เจฆเจฒเฉ€เจฒ j, เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจฆเฉ‚เจœเจพ เจธเจฅเจพเจจ
เจ…เจธเฉ€เจ‚ เจฒเฉ‹เฉœเฉ€เจ‚เจฆเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจฆเฉ€ เจธเฉ‚เจšเฉ€ เจจเฉ‚เฉฐ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจชเจพเจธ เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚ / drop() / filter() / select_dtypes()

เจ•เจคเจพเจฐเจพเจ‚ เจจเฉ‚เฉฐ เจซเจฟเจฒเจŸเจฐ เจ•เจฐเจจเจพ
filter()
เจ‡เฉฑเจ• เจฆเจฒเฉ€เจฒ i, เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจชเจนเจฟเจฒเฉ€ เจธเจฅเจฟเจคเฉ€
เจ…เจธเฉ€เจ‚ เจซเจฟเจฒเจŸเจฐเจฟเฉฐเจ— เจนเจพเจฒเจคเจพเจ‚ เจจเฉ‚เฉฐ เจตเจฐเจ— เจฌเจฐเฉˆเจ•เจŸเจพเจ‚ เจตเจฟเฉฑเจš เจธเฉ‚เจšเฉ€เจฌเฉฑเจง เจ•เจฐเจฆเฉ‡ เจนเจพเจ‚ / filter()

เจ—เจฐเฉเฉฑเจชเจฟเฉฐเจ— เจ…เจคเฉ‡ เจเจ—เจฐเฉ€เจ—เฉ‡เจธเจผเจจ
group_by() + summarise()
เจฌเจนเจฟเจธ j + by
groupby() + agg()

เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจฒเฉฐเจฌเจ•เจพเจฐเฉ€ เจธเฉฐเจ˜ (UNION)
bind_rows()
rbind()
concat()

เจŸเฉ‡เจฌเจฒเจพเจ‚ เจฆเจพ เจนเจฐเฉ€เจœเฉฑเจŸเจฒ เจœเฉ‹เฉœ (เจธเจผเจพเจฎเจฒ)
left_join() / *_join()
merge()
merge()

เจฎเฉ‚เจฒ เจตเจฟเฉฐเจกเฉ‹ เจซเฉฐเจ•เจธเจผเจจ เจ…เจคเฉ‡ เจ—เจฃเจจเจพ เจ•เฉ€เจคเฉ‡ เจ•เจพเจฒเจฎเจพเจ‚ เจจเฉ‚เฉฐ เจœเฉ‹เฉœเจจเจพ
group_by() + mutate()
เจ‡เฉฑเจ• เจฆเจฒเฉ€เจฒ j เจ†เจชเจฐเฉ‡เจŸเจฐ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹เจ := + เจฆเจฒเฉ€เจฒ by
transform() + assign()

เจธเจฟเฉฑเจŸเจพ

เจธเจผเจพเจ‡เจฆ เจฒเฉ‡เจ– เจตเจฟเฉฑเจš เจฎเฉˆเจ‚ เจกเฉ‡เจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจฆเฉ‡ เจธเจญ เจคเฉ‹เจ‚ เจ…เจจเฉเจ•เฉ‚เจฒ เจ…เจฎเจฒเจพเจ‚ เจฆเจพ เจตเจฐเจฃเจจ เจจเจนเฉ€เจ‚ เจ•เฉ€เจคเจพ เจนเฉˆ, เจ‡เจธ เจฒเจˆ เจฎเฉˆเจจเฉ‚เฉฐ เจ–เฉเจธเจผเฉ€ เจนเฉ‹เจตเฉ‡เจ—เฉ€ เจœเฉ‡เจ•เจฐ เจคเฉเจธเฉ€เจ‚ เจŸเจฟเฉฑเจชเจฃเฉ€เจ†เจ‚ เจตเจฟเฉฑเจš เจฎเฉ‡เจฐเฉ€เจ†เจ‚ เจ—เจฒเจคเฉ€เจ†เจ‚ เจจเฉ‚เฉฐ เจ เฉ€เจ• เจ•เจฐเจฆเฉ‡ เจนเฉ‹, เจœเจพเจ‚ เจ†เจฐ / เจชเจพเจˆเจฅเจจ เจตเจฟเฉฑเจš เจกเฉ‡เจŸเจพ เจจเจพเจฒ เจ•เฉฐเจฎ เจ•เจฐเจจ เจฒเจˆ เจนเฉ‹เจฐ เจคเจ•เจจเฉ€เจ•เจพเจ‚ เจฆเฉ‡ เจจเจพเจฒ เจฒเฉ‡เจ– เจตเจฟเฉฑเจš เจฆเจฟเฉฑเจคเฉ€ เจ—เจˆ เจœเจพเจฃเจ•เจพเจฐเฉ€ เจจเฉ‚เฉฐ เจธเจฟเจฐเจซเจผ เจชเฉ‚เจฐเจ• เจ•เจฐเจฆเฉ‡ เจนเฉ‹.

เจœเจฟเจตเฉ‡เจ‚ เจ•เจฟ เจฎเฉˆเจ‚ เจ‰เฉฑเจชเจฐ เจฒเจฟเจ–เจฟเจ† เจนเฉˆ, เจฒเฉ‡เจ– เจฆเจพ เจ‰เจฆเฉ‡เจธเจผ เจ•เจฟเจธเฉ‡ เจฆเฉ€ เจฐเจพเจ‡ เจฒเจ—เจพเจ‰เจฃเจพ เจจเจนเฉ€เจ‚ เจธเฉ€ เจ•เจฟ เจ•เจฟเจนเฉœเฉ€ เจญเจพเจธเจผเจพ เจฌเจฟเจนเจคเจฐ เจนเฉˆ, เจชเจฐ เจฆเฉ‹เจตเจพเจ‚ เจญเจพเจธเจผเจพเจตเจพเจ‚ เจจเฉ‚เฉฐ เจธเจฟเฉฑเจ–เจฃ เจฆเฉ‡ เจฎเฉŒเจ•เฉ‡ เจจเฉ‚เฉฐ เจธเจฐเจฒ เจฌเจฃเจพเจ‰เจฃเจพ เจธเฉ€, เจœเจพเจ‚, เจœเฉ‡ เจฒเฉ‹เฉœ เจนเฉ‹เจตเฉ‡, เจ‰เจนเจจเจพเจ‚ เจตเจฟเจšเจ•เจพเจฐ เจฎเจพเจˆเจ—เจฐเฉ‡เจŸ เจ•เจฐเจจเจพ เจธเฉ€เฅค

เจœเฉ‡ เจคเฉเจธเฉ€เจ‚ เจฒเฉ‡เจ– เจจเฉ‚เฉฐ เจชเจธเฉฐเจฆ เจ•เฉ€เจคเจพ เจนเฉˆ, เจคเจพเจ‚ เจฎเฉˆเจ‚ เจ†เจชเจฃเฉ‡ เจจเจตเฉ‡เจ‚ เจ—เจพเจนเจ•เจพเจ‚ เจจเฉ‚เฉฐ เจฒเฉˆ เจ•เฉ‡ เจ–เฉเจธเจผ เจนเฉ‹เจตเจพเจ‚เจ—เจพ YouTube ะธ เจคเจพเจฐ เจšเฉˆเจจเจฒเฅค

เจชเฉ‹เจฒ

เจคเฉเจธเฉ€เจ‚ เจ†เจชเจฃเฉ‡ เจ•เฉฐเจฎ เจตเจฟเฉฑเจš เจนเฉ‡เจ เจพเจ‚ เจฆเจฟเฉฑเจคเฉ‡ เจชเฉˆเจ•เฉ‡เจœเจพเจ‚ เจตเจฟเฉฑเจšเฉ‹เจ‚ เจ•เจฟเจธ เจฆเฉ€ เจตเจฐเจคเฉ‹เจ‚ เจ•เจฐเจฆเฉ‡ เจนเฉ‹?

เจŸเจฟเฉฑเจชเจฃเฉ€เจ†เจ‚ เจตเจฟเฉฑเจš เจคเฉเจธเฉ€เจ‚ เจ†เจชเจฃเฉ€ เจชเจธเฉฐเจฆ เจฆเจพ เจ•เจพเจฐเจจ เจฒเจฟเจ– เจธเจ•เจฆเฉ‡ เจนเฉ‹เฅค

เจธเจฟเจฐเจซเจผ เจฐเจœเจฟเจธเจŸเจฐเจก เจ‰เจชเจญเฉ‹เจ—เจคเจพ เจนเฉ€ เจธเจฐเจตเฉ‡เจ–เจฃ เจตเจฟเฉฑเจš เจนเจฟเฉฑเจธเจพ เจฒเฉˆ เจธเจ•เจฆเฉ‡ เจนเจจเฅค เจธเจพเจˆเจจ - เจ‡เจจ, เจคเฉเจนเจพเจกเจพ เจธเฉเจ†เจ—เจค เจนเฉˆ.

เจคเฉเจธเฉ€เจ‚ เจ•เจฟเจนเฉœเจพ เจกเจพเจŸเจพ เจชเฉเจฐเฉ‹เจธเฉˆเจธเจฟเฉฐเจ— เจชเฉˆเจ•เฉ‡เจœ เจตเจฐเจคเจฆเฉ‡ เจนเฉ‹ (เจคเฉเจธเฉ€เจ‚ เจ•เจˆ เจตเจฟเจ•เจฒเจช เจšเฉเจฃ เจธเจ•เจฆเฉ‡ เจนเฉ‹)

  • 45,2%tidyverse19

  • 33,3%data.table14

  • 54,8%pandas23

42 เจ‰เจชเจญเฉ‹เจ—เจคเจพเจตเจพเจ‚ เจจเฉ‡ เจตเฉ‹เจŸ เจ•เฉ€เจคเจพเฅค 9 เจ‰เจชเจญเฉ‹เจ—เจคเจพ เจฌเจšเฉ‡ เจฐเจนเฉ‡เฅค

เจธเจฐเฉ‹เจค: www.habr.com

เจ‡เฉฑเจ• เจŸเจฟเฉฑเจชเจฃเฉ€ เจœเฉ‹เฉœเฉ‹