เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เป‚เบ”เบเบเบฒเบ™เบŠเบญเบเบซเบฒ R เบซเบผเบท Python เปƒเบ™เบญเบดเบ™เป€เบ•เบตเป€เบ™เบฑเบ”, เบ—เปˆเบฒเบ™เบˆเบฐเบžเบปเบšเป€เบซเบฑเบ™เบซเบฅเบฒเบเบฅเป‰เบฒเบ™เบšเบปเบ”เบ„เบงเบฒเบกเปเบฅเบฐเบเบดเป‚เบฅเปเบกเบฑเบ”เบ‚เบญเบ‡เบเบฒเบ™เบชเบปเบ™เบ—เบฐเบ™เบฒเบเปˆเบฝเบงเบเบฑเบšเบซเบปเบงเบ‚เปเป‰เบงเปˆเบฒเบญเบฑเบ™เปƒเบ”เบ”เบตเบเบงเปˆเบฒ, เป„เบงเบเบงเปˆเบฒเปเบฅเบฐเบชเบฐเบ”เบงเบเบเบงเปˆเบฒเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™. เปเบ•เปˆเบซเบ™เป‰เบฒเป€เบชเบเบ”เบฒเบ, เบšเบปเบ”เบ„เบงเบฒเบกเปเบฅเบฐเบเบฒเบ™เบ‚เบฑเบ”เปเบเป‰เบ‡เบ—เบฑเบ‡เบซเบกเบปเบ”เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰เบšเปเปˆเบกเบตเบ›เบฐเป‚เบซเบเบ”เป‚เบ”เบเบชเบฐเป€เบžเบฒเบฐ.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เบˆเบธเบ”เบ›เบฐเบชเบปเบ‡เบ‚เบญเบ‡เบšเบปเบ”เบ„เบงเบฒเบกเบ™เบตเป‰เปเบกเปˆเบ™เป€เบžเบทเปˆเบญเบ›เบฝเบšเบ—เบฝเบšเป€เบ•เบฑเบเบ™เบดเบเบเบฒเบ™เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ‚เปเป‰เบกเบนเบ™เบžเบทเป‰เบ™เบ–เบฒเบ™เปƒเบ™เบŠเบธเบ”เบ—เบตเปˆเบ™เบดเบเบปเบกเบ—เบตเปˆเบชเบธเบ”เบ‚เบญเบ‡เบ—เบฑเบ‡เบชเบญเบ‡เบžเบฒเบชเบฒ. เปเบฅเบฐโ€‹เบŠเปˆเบงเบโ€‹เปƒเบซเป‰โ€‹เบœเบนเป‰โ€‹เบญเปˆเบฒเบ™โ€‹เบฎเบนเป‰โ€‹เบšเบฒเบ‡โ€‹เบชเบดเปˆเบ‡โ€‹เบ—เบตเปˆโ€‹เป€เบ‚เบปเบฒโ€‹เป€เบˆเบปเป‰เบฒโ€‹เบเบฑเบ‡โ€‹เบšเปเปˆโ€‹เบ—เบฑเบ™โ€‹เบฎเบนเป‰โ€‹เป„เบ”เป‰โ€‹เป„เบง. เบชเปเบฒเบฅเบฑเบšเบœเบนเป‰เบ—เบตเปˆเบ‚เบฝเบ™เปƒเบ™ Python, เบŠเบญเบเบซเบฒเบงเบดเบ—เบตเป€เบฎเบฑเบ”เบชเบดเปˆเบ‡เบ”เบฝเบงเบเบฑเบ™เปƒเบ™ R, เปเบฅเบฐเปƒเบ™เบ—เบฒเบ‡เบเบฑเบšเบเบฑเบ™.

เปƒเบ™เบฅเบฐเบซเบงเปˆเบฒเบ‡เบšเบปเบ”เบ„เบงเบฒเบกเบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบงเบดเป€เบ„เบฒเบฐ syntax เบ‚เบญเบ‡เบŠเบธเบ”เบ—เบตเปˆเบ™เบดเบเบปเบกเบ—เบตเปˆเบชเบธเบ”เปƒเบ™ R. เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰เปเบกเปˆเบ™เบŠเบธเบ”เบ—เบตเปˆเบฅเบงเบกเบขเบนเปˆเปƒเบ™เบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ”. tidyverseเปเบฅเบฐเบเบฑเบ‡เบŠเบธเบ” data.table. เปเบฅเบฐเบ›เบฝเบšเบ—เบฝเบš syntax เบ‚เบญเบ‡เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒเบเบฑเบš pandas, เบŠเบธเบ”เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบ™เบดเบเบปเบกเบ—เบตเปˆเบชเบธเบ”เปƒเบ™ Python.

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเป„เบ›เป€เบ—เบทเปˆเบญเบฅเบฐเบเป‰เบฒเบงเบœเปˆเบฒเบ™เป€เบชเบฑเป‰เบ™เบ—เบฒเบ‡เบ—เบฑเบ‡เบซเบกเบปเบ”เบ‚เบญเบ‡เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเบเบฒเบ™เป‚เบซเบผเบ”เบกเบฑเบ™เป„เบ›เบชเบนเปˆเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบซเบ™เป‰เบฒเบ•เปˆเบฒเบ‡เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเป‚เบ”เบเปƒเบŠเป‰ Python เปเบฅเบฐ R.

เป€เบ™เบทเป‰เบญเปƒเบ™

เบšเบปเบ”เบ„เบงเบฒเบกเบ™เบตเป‰เบชเบฒเบกเบฒเบ”เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เป€เบ›เบฑเบ™เปเบœเปˆเบ™ cheat เบ–เป‰เบฒเบซเบฒเบเบงเปˆเบฒเบ—เปˆเบฒเบ™เป„เบ”เป‰เบฅเบทเบกเบงเบดเบ—เบตเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ‚เปเป‰เบกเบนเบ™เบˆเปเบฒเบ™เบงเบ™เบซเบ™เบถเปˆเบ‡เปƒเบ™เบซเบ™เบถเปˆเบ‡เบ‚เบญเบ‡เบŠเบธเบ”เบ—เบตเปˆเบเปเบฒเบฅเบฑเบ‡เบžเบดเบˆเบฒเบฅเบฐเบ™เบฒ.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

  1. เบ„เบงเบฒเบกเปเบ•เบเบ•เปˆเบฒเบ‡เบฅเบฐเบซเบงเปˆเบฒเบ‡ syntax เบ•เบปเป‰เบ™เบ•เปเบฅเบฐเบซเบงเปˆเบฒเบ‡ R เปเบฅเบฐ Python
    1.1โ€‹. เบเบฒเบ™โ€‹เป€เบ‚เบปเป‰เบฒโ€‹เป€เบ–เบดเบ‡โ€‹เบซเบ™เป‰เบฒโ€‹เบ—เบตเปˆ Packageโ€‹
    1.2โ€‹. เบเบฒเบ™เบกเบญเบšเปเบฒเบ
    1.3โ€‹. เบ”เบฑเบ”เบชเบฐเบ™เบต
    1.4โ€‹. เบงเบดเบ—เบตเบเบฒเบ™เปเบฅเบฐ OOP
    1.5โ€‹. เบ—เปเปˆ
    1.6โ€‹. เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบ‚เปเป‰เบกเบนเบ™
  2. เบชเบญเบ‡เบชเบฒเบกเบ„เปเบฒเบเปˆเบฝเบงเบเบฑเบšเบŠเบธเบ”เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเปƒเบŠเป‰
    2.1โ€‹. เป€เบ›เบฑเบ™เบฅเบฐเบšเบฝเบšเบฎเบฝเบšเบฎเป‰เบญเบ
    2.2โ€‹. เบ•เบฒเบ•เบฐเบฅเบฒเบ‡
    2.3โ€‹. เปเบต เปเบžเบ™เบ”เบฒ
  3. เบเบฒเบ™เบ•เบดเบ”เบ•เบฑเป‰เบ‡เปเบžเบฑเบเป€เบเบ”
  4. เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™
  5. เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™
  6. เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™เบ—เบตเปˆเบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบเบฒเบ™
  7. เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบง
  8. เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบก
  9. เบชเบฐโ€‹เบซเบฐโ€‹เบžเบฒเบšโ€‹เบ•เบฑเป‰เบ‡โ€‹เบ‚เบญเบ‡โ€‹เบ•เบฒโ€‹เบ•เบฐโ€‹เบฅเบฒเบ‡ (UNIONโ€‹)
  10. เบเบฒเบ™เบฅเบงเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ•เบฒเบกเบฅเบงเบ‡เบ™เบญเบ™ (เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบก)
  11. เบซเบ™เป‰เบฒเบ—เบตเปˆเบžเบทเป‰เบ™เบ–เบฒเบ™เบ‚เบญเบ‡เบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปเบฅเบฐเบ–เบฑเบ™เบ—เบตเปˆเบ„เบดเบ”เป„เบฅเปˆ
  12. เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบเบฒเบ™เบ•เบดเบ”เบ•เปเปˆเบฅเบฐเบซเบงเปˆเบฒเบ‡เบงเบดเบ—เบตเบเบฒเบ™เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R เปเบฅเบฐ Python
  13. เบชเบฐเบซเบฅเบธเบš
  14. เปเบšเบšเบชเบณเบซเบผเบงเบ”เบชเบฑเป‰เบ™เป†เบเปˆเบฝเบงเบเบฑเบšเบŠเบธเบ”เปƒเบ”เบ—เบตเปˆเบ—เปˆเบฒเบ™เปƒเบŠเป‰

เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบชเบปเบ™เปƒเบˆเปƒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เปเป‰เบกเบนเบ™, เบ—เปˆเบฒเบ™เบญเบฒเบ”เบˆเบฐเบŠเบญเบเบซเบฒเบ‚เบญเบ‡เบ‚เป‰เบญเบ telegram ะธ youtube เบŠเปˆเบญเบ‡. เบชเปˆเบงเบ™เปƒเบซเบเปˆเบ‚เบญเบ‡เป€เบ™เบทเป‰เบญเบซเบฒเปเบกเปˆเบ™เบญเบธเบ—เบดเบ”เบ•เบปเบ™เป€เบžเบทเปˆเบญเบžเบฒเบชเบฒ R.

เบ„เบงเบฒเบกเปเบ•เบเบ•เปˆเบฒเบ‡เบฅเบฐเบซเบงเปˆเบฒเบ‡ syntax เบ•เบปเป‰เบ™เบ•เปเบฅเบฐเบซเบงเปˆเบฒเบ‡ R เปเบฅเบฐ Python

เป€เบžเบทเปˆเบญเป€เบฎเบฑเบ”เปƒเบซเป‰เบกเบฑเบ™เบ‡เปˆเบฒเบเบ‚เบถเป‰เบ™เบชเปเบฒเบฅเบฑเบšเบ—เปˆเบฒเบ™เบ—เบตเปˆเบˆเบฐเบ›เปˆเบฝเบ™เบˆเบฒเบ Python เป€เบ›เบฑเบ™ R, เบซเบผเบทเปƒเบ™เบ—เบฒเบ‡เบเบฑเบšเบเบฑเบ™, เบ‚เป‰เบฒเบžเบฐเป€เบˆเบปเป‰เบฒเบˆเบฐเปƒเบซเป‰เบšเบฒเบ‡เบˆเบธเบ”เบ•เบปเป‰เบ™เบ•เปเบ—เบตเปˆเบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป€เบญเบปเบฒเปƒเบˆเปƒเบชเปˆ.

เบเบฒเบ™โ€‹เป€เบ‚เบปเป‰เบฒโ€‹เป€เบ–เบดเบ‡โ€‹เบซเบ™เป‰เบฒโ€‹เบ—เบตเปˆ Packageโ€‹

เป€เบกเบทเปˆเบญเปเบžเบฑเบเป€เบเบฑเบ”เบ–เบทเบเป‚เบซเบฅเบ”เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™ R, เบ—เปˆเบฒเบ™เบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เบฅเบฐเบšเบธเบŠเบทเปˆเปเบžเบฑเบเป€เบเบฑเบ”เป€เบžเบทเปˆเบญเป€เบ‚เบปเป‰เบฒเป€เบ–เบดเบ‡เบซเบ™เป‰เบฒเบ—เบตเปˆเบ‚เบญเบ‡เบกเบฑเบ™. เปƒเบ™เบเปเบฅเบฐเบ™เบตเบซเบผเบฒเบเบ—เบตเปˆเบชเบธเบ”, เบ™เบตเป‰เบšเปเปˆเปเบกเปˆเบ™เบ—เบปเปˆเบงเป„เบ›เปƒเบ™ R, เปเบ•เปˆเบงเปˆเบฒเบกเบฑเบ™เป€เบ›เบฑเบ™เบ—เบตเปˆเบเบญเบกเบฎเบฑเบš. เบ—เปˆเบฒเบ™เบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เบ™เปเบฒเป€เบ‚เบปเป‰เบฒเบŠเบธเบ”เปƒเบ”เป†เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบเบฒเบ™เบซเบ™เบถเปˆเบ‡เปƒเบ™เบซเบ™เป‰เบฒเบ—เบตเปˆเบ‚เบญเบ‡เบกเบฑเบ™เบขเบนเปˆเปƒเบ™เบฅเบฐเบซเบฑเบ”เบ‚เบญเบ‡เบ—เปˆเบฒเบ™, เปเบ•เปˆเบžเบฝเบ‡เปเบ•เปˆเป‚เบ—เบซเบฒเบกเบฑเบ™เป‚เบ”เบเบเบฒเบ™เบฅเบฐเบšเบธเบŠเบทเปˆเบ‚เบญเบ‡เบŠเบธเบ”เปเบฅเบฐเบŠเบทเปˆเบ‚เบญเบ‡เบซเบ™เป‰เบฒเบ—เบตเปˆ. เบ•เบปเบงเปเบเบเบฅเบฐเบซเบงเปˆเบฒเบ‡เปเบžเบฑเบเป€เบเบฑเบ” เปเบฅเบฐเบŠเบทเปˆเบŸเบฑเบ‡เบŠเบฑเบ™เปƒเบ™ R เปเบกเปˆเบ™เบˆเปเป‰เบฒเบชเบญเบ‡เป€เบกเบฑเบ”. package_name::function_name().

เปƒเบ™ Python, เปƒเบ™เบ—เบฒเบ‡เบเบปเบ‡เบเบฑเบ™เบ‚เป‰เบฒเบก, เบกเบฑเบ™เบ–เบทเบงเปˆเบฒเป€เบ›เบฑเบ™เบ„เบฅเบฒเบชเบชเบดเบเบ—เบตเปˆเบˆเบฐเป‚เบ—เบซเบฒเบซเบ™เป‰เบฒเบ—เบตเปˆเบ‚เบญเบ‡เบŠเบธเบ”เป‚เบ”เบเบเบฒเบ™เบฅเบฐเบšเบธเบŠเบทเปˆเบ‚เบญเบ‡เบกเบฑเบ™เบขเปˆเบฒเบ‡เบŠเบฑเบ”เป€เบˆเบ™. เป€เบกเบทเปˆเบญเปเบžเบฑเบเป€เบเบฑเบ”เบ–เบทเบเบ”เบฒเบงเป‚เบซเบผเบ”เปเบฅเป‰เบง, เบกเบฑเบ™เบกเบฑเบเบˆเบฐเบกเบตเบŠเบทเปˆเบซเบเปเป‰, เป€เบŠเบฑเปˆเบ™:. pandas เบ›เบปเบเบเบฐเบ•เบดเปเบฅเป‰เบงเปเบกเปˆเบ™เปƒเบŠเป‰เบ™เบฒเบกเบชเบฐเบเบธเบ™ pd. เบŸเบฑเบ‡เบŠเบฑเบ™เปเบžเบฑเบเป€เบเบฑเบ”เบ–เบทเบเป€เบ‚เบปเป‰เบฒเป€เบ–เบดเบ‡เบœเปˆเบฒเบ™เบˆเบธเบ” package_name.function_name().

เบเบฒเบ™เบกเบญเบšเปเบฒเบ

เปƒเบ™ R, เบกเบฑเบ™เป€เบ›เบฑเบ™เป€เบฅเบทเปˆเบญเบ‡เบ—เปเบฒเบกเบฐเบ”เบฒเบ—เบตเปˆเบˆเบฐเปƒเบŠเป‰เบฅเบนเบเบชเบญเบ™เป€เบžเบทเปˆเบญเบเปเบฒเบ™เบปเบ”เบ„เปˆเบฒเปƒเบซเป‰เบเบฑเบšเบงเบฑเบ”เบ–เบธ. obj_name <- value, เป€เบ–เบดเบ‡เปเบกเปˆเบ™เบงเปˆเบฒเป€เบ„เบทเปˆเบญเบ‡เบซเบกเบฒเบเป€เบ—เบปเปˆเบฒเบเบฑเบšเบ”เบฝเบงเป„เบ”เป‰เบ–เบทเบเบญเบฐเบ™เบธเบเบฒเบ”เปƒเบซเป‰, เป€เบ„เบทเปˆเบญเบ‡เบซเบกเบฒเบเบ”เบฝเบงเป€เบ—เบปเปˆเบฒเบเบฑเบš R เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เบ•เบปเป‰เบ™เบ•เปเป€เบžเบทเปˆเบญเบชเบปเปˆเบ‡เบ„เปˆเบฒเป„เบ›เบซเบฒ arguments.

เปƒเบ™ Python, เบเบฒเบ™เบกเบญเบšเปเบฒเบเปเบกเปˆเบ™เป€เบฎเบฑเบ”เบชเบฐเป€เบžเบฒเบฐเบ”เป‰เบงเบเป€เบ„เบทเปˆเบญเบ‡เปเบฒเบเป€เบ—เบปเปˆเบฒเบ—เบฝเบก obj_name = value.

เบ”เบฑเบ”เบชเบฐเบ™เบต

เบกเบฑเบ™เบเบฑเบ‡เบกเบตเบ„เบงเบฒเบกเปเบ•เบเบ•เปˆเบฒเบ‡เบ—เบตเปˆเบ‚เป‰เบญเบ™เบ‚เป‰เบฒเบ‡เบขเบนเปˆเบ—เบตเปˆเบ™เบตเป‰. เปƒเบ™ R, เบ”เบฑเบ”เบชเบฐเบ™เบตเป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบ—เบตเปˆเบซเบ™เบถเปˆเบ‡เปเบฅเบฐเบ›เบฐเบเบญเบšเบกเบตเบญเบปเบ‡เบ›เบฐเบเบญเบšเบ—เบตเปˆเบฅเบฐเบšเบธเป„เบงเป‰เบ—เบฑเบ‡เบซเบกเบปเบ”เปƒเบ™เบฅเบฐเบ”เบฑเบšเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบš,

เปƒเบ™ Python, เบเบฒเบ™เบชเป‰เบฒเบ‡เบ”เบฑเบ”เบชเบฐเบ™เบตเป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบˆเบฒเบเบชเบนเบ™เปเบฅเบฐเบŠเปˆเบงเบ‡เบ—เบตเปˆเป€เบฅเบทเบญเบเบšเปเปˆเบฅเบงเบกเป€เบญเบปเบฒเบญเบปเบ‡เบ›เบฐเบเบญเบšเบชเบธเบ”เบ—เป‰เบฒเบเบ—เบตเปˆเบฅเบฐเบšเบธเป„เบงเป‰เปƒเบ™เบ”เบฑเบ”เบŠเบฐเบ™เบต. เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™เบเบฒเบ™เบญเบญเบเปเบšเบš x[i:j] เปƒเบ™ Python เบˆเบฐเบšเปเปˆเบฅเบงเบกเป€เบญเบปเบฒเบญเบปเบ‡เบ›เบฐเบเบญเบš j.

เบเบฑเบ‡เบกเบตเบ„เบงเบฒเบกเปเบ•เบเบ•เปˆเบฒเบ‡เปƒเบ™เบเบฒเบ™เบ”เบฑเบ”เบชเบฐเบ™เบตเบ—เบฒเบ‡เบฅเบปเบš, เปƒเบ™ R notation x[-1] เบˆเบฐเบชเบปเปˆเบ‡เบ„เบทเบ™เบญเบปเบ‡เบ›เบฐเบเบญเบšเบ—เบฑเบ‡เปเบปเบ”เบ‚เบญเบ‡ vector เบเบปเบเป€เบงเบฑเป‰เบ™เบญเบฑเบ™เบชเบธเบ”เบ—เป‰เบฒเบ. เปƒเบ™ Python, เบซเบกเบฒเบเป€เบซเบ”เบ—เบตเปˆเบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เบˆเบฐเบชเบปเปˆเบ‡เบ„เบทเบ™เบžเบฝเบ‡เปเบ•เปˆเบญเบปเบ‡เบ›เบฐเบเบญเบšเบชเบธเบ”เบ—เป‰เบฒเบ.

เบงเบดเบ—เบตเบเบฒเบ™เปเบฅเบฐ OOP

R เบ›เบฐเบ•เบดเบšเบฑเบ” OOP เปƒเบ™เบงเบดเบ—เบตเบเบฒเบ™เบ‚เบญเบ‡เบ•เบปเบ™เป€เบญเบ‡, เบ‚เป‰เบฒเบžเบฐเป€เบˆเบปเป‰เบฒเป„เบ”เป‰เบ‚เบฝเบ™เบเปˆเบฝเบงเบเบฑเบšเป€เบฅเบทเปˆเบญเบ‡เบ™เบตเป‰เปƒเบ™เบšเบปเบ”เบ„เบงเบฒเบก "OOP เปƒเบ™เบžเบฒเบชเบฒ R (เบชเปˆเบงเบ™ 1): เบซเป‰เบญเบ‡เบฎเบฝเบ™ S3". เป‚เบ”เบเบ—เบปเปˆเบงเป„เบ›, R เปเบกเปˆเบ™เบžเบฒเบชเบฒเบ—เบตเปˆเปƒเบŠเป‰เป„เบ”เป‰, เปเบฅเบฐเบ—เบธเบเบชเบดเปˆเบ‡เบ—เบธเบเบขเปˆเบฒเบ‡เบขเบนเปˆเปƒเบ™เบกเบฑเบ™เบ–เบทเบเบชเป‰เบฒเบ‡เบ‚เบถเป‰เบ™เปƒเบ™เบซเบ™เป‰เบฒเบ—เบตเปˆ. เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบเบปเบเบ•เบปเบงเบขเปˆเบฒเบ‡, เบชเปเบฒเบฅเบฑเบšเบœเบนเป‰เปƒเบŠเป‰ Excel, เป„เบ› tydiverse เบกเบฑเบ™เบˆเบฐเบ‡เปˆเบฒเบเบเบงเปˆเบฒ pandas. เป€เบ–เบดเบ‡เปเบกเปˆเบ™เบงเปˆเบฒเบ™เบตเป‰เบญเบฒเบ”เบˆเบฐเป€เบ›เบฑเบ™เบ„เบงเบฒเบกเบ„เบดเบ”เป€เบซเบฑเบ™เบ‚เบญเบ‡เบ‚เป‰เบญเบ.

เปƒเบ™เบชเบฑเป‰เบ™, เบงเบฑเบ”เบ–เบธเปƒเบ™ R เบšเปเปˆเบกเบตเบงเบดเบ—เบตเบเบฒเบ™ (เบ–เป‰เบฒเบžเบงเบเป€เบฎเบปเบฒเป€เบงเบปเป‰เบฒเบเปˆเบฝเบงเบเบฑเบšเบซเป‰เบญเบ‡เบฎเบฝเบ™ S3, เปเบ•เปˆเบกเบตเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ” OOP เบญเบทเปˆเบ™เป†เบ—เบตเปˆเบกเบตเบซเบ™เป‰เบญเบเบซเบผเบฒเบ). เบกเบตเบžเบฝเบ‡เปเบ•เปˆเบŸเบฑเบ‡เบŠเบฑเบ™เบ—เบปเปˆเบงเป„เบ›เบ—เบตเปˆเบ›เบฐเบกเบงเบ™เบœเบปเบ™เบžเบงเบเบกเบฑเบ™เปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เป‚เบ”เบเบญเบตเบ‡เบ•เบฒเบกเบŠเบฑเป‰เบ™เบ‚เบญเบ‡เบงเบฑเบ”เบ–เบธ.

เบ—เปเปˆ

เบšเบฒเบ‡เบ—เบตเบ™เบตเป‰เปเบกเปˆเบ™เบŠเบทเปˆเบชเปเบฒเบฅเบฑเบš pandas เบกเบฑเบ™เบˆเบฐเบšเปเปˆเบ–เบทเบเบ•เป‰เบญเบ‡เบ—เบฑเบ‡เบซเบกเบปเบ”, เปเบ•เปˆเบ‚เป‰เบญเบเบˆเบฐเบžเบฐเบเบฒเบเบฒเบกเบญเบฐเบ—เบดเบšเบฒเบเบ„เบงเบฒเบกเบซเบกเบฒเบ.

เป€เบžเบทเปˆเบญเบšเปเปˆเปƒเบซเป‰เบ›เบฐเบซเบเบฑเบ”เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบฅเบฐเบ”เบฑเบšเบเบฒเบ‡เปเบฅเบฐเบšเปเปˆเบœเบฐเบฅเบดเบ”เบงเบฑเบ”เบ–เบธเบ—เบตเปˆเบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เปƒเบ™เบชเบฐเบžเบฒเบšเปเบงเบ”เบฅเป‰เบญเบกเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบ, เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบ™เปเบฒเปƒเบŠเป‰เบ›เบฐเป€เบžเบ”เบ‚เบญเบ‡เบ—เปเปˆ. เป€เบซเบผเบปเปˆเบฒเบ™เบฑเป‰เบ™. เบœเปˆเบฒเบ™เบœเบปเบ™เบ‚เบญเบ‡เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบˆเบฒเบเบŸเบฑเบ‡เบŠเบฑเบ™เบซเบ™เบถเปˆเบ‡เป„เบ›เบซเบฒเบซเบ™เป‰เบฒเบ•เปเปˆเป„เบ›, เปเบฅเบฐเบšเปเปˆเบšเบฑเบ™เบ—เบถเบเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบฅเบฐเบ”เบฑเบšเบเบฒเบ‡.

เปƒเบซเป‰เป€เบญเบปเบฒเบ•เบปเบงเบขเปˆเบฒเบ‡เบฅเบฐเบซเบฑเบ”เบ•เปเปˆเป„เบ›เบ™เบตเป‰, เบšเปˆเบญเบ™เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเป€เบเบฑเบšเบฎเบฑเบเบชเบฒเบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบฅเบฐเบ”เบฑเบšเบ›เบฒเบ™เบเบฒเบ‡เปƒเบ™เบงเบฑเบ”เบ–เบธเปเบเบเบ•เปˆเบฒเบ‡เบซเบฒเบ:

temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )

เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบ›เบฐเบ•เบดเบšเบฑเบ” 3 เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ•เบฒเบกเบฅเปเบฒเบ”เบฑเบš, เปเบฅเบฐเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ‚เบญเบ‡เปเบ•เปˆเบฅเบฐเบ„เบปเบ™เป„เบ”เป‰เบ–เบทเบเบšเบฑเบ™เบ—เบถเบเป„เบงเป‰เปƒเบ™เบงเบฑเบ”เบ–เบธเปเบเบเบ•เปˆเบฒเบ‡เบซเบฒเบ. เปเบ•เปˆเบ„เบงเบฒเบกเบˆเบดเบ‡เปเบฅเป‰เบง, เบžเบงเบเป€เบฎเบปเบฒเบšเปเปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เบงเบฑเบ”เบ–เบธเบฅเบฐเบ”เบฑเบšเบ›เบฒเบ™เบเบฒเบ‡เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰.

เบซเบผเบทเบฎเป‰เบฒเบเปเบฎเบ‡เบเบงเปˆเบฒเป€เบเบปเปˆเบฒ, เปเบ•เปˆเบ„เบธเป‰เบ™เป€เบ„เบตเบเบเบฑเบšเบœเบนเป‰เปƒเบŠเป‰ Excel.

obj  <- func3(func2(func1()))

เปƒเบ™เบเปเบฅเบฐเบ™เบตเบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเบšเปเปˆเป„เบ”เป‰เบšเบฑเบ™เบ—เบถเบเบœเบปเบ™เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบฅเบฐเบ”เบฑเบšเบ›เบฒเบ™เบเบฒเบ‡, เปเบ•เปˆเบเบฒเบ™เบญเปˆเบฒเบ™เบฅเบฐเบซเบฑเบ”เบ—เบตเปˆเบกเบตเบซเบ™เป‰เบฒเบ—เบตเปˆเบŠเป‰เบญเบ™เบเบฑเบ™เปเบกเปˆเบ™เบšเปเปˆเบชเบฐเบ”เบงเบเบ—เบตเปˆเบชเบธเบ”.

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเป€เบšเบดเปˆเบ‡เบงเบดเบ—เบตเบเบฒเบ™เบˆเปเบฒเบ™เบงเบ™เบซเบ™เบถเปˆเบ‡เบ‚เบญเบ‡เบเบฒเบ™เบ›เบธเบ‡เปเบ•เปˆเบ‡เบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R, เปเบฅเบฐเบžเบงเบเป€เบ‚เบปเบฒเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบเบฒเบ™เบ—เบตเปˆเบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เปƒเบ™เบงเบดเบ—เบตเบ•เปˆเบฒเบ‡เป†.

เบ—เปเปˆเปƒเบ™เบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ” tidyverse เบ›เบฐเบ•เบดเบšเบฑเบ”เป‚เบ”เบเบœเบนเป‰เบ›เบฐเบเบญเบšเบเบฒเบ™ %>%.

obj <- func1() %>% 
            func2() %>%
            func3()

เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™เบžเบงเบเป€เบฎเบปเบฒเป€เบญเบปเบฒเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ‚เบญเบ‡เบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบ func1() เปเบฅเบฐเบœเปˆเบฒเบ™เบกเบฑเบ™เป€เบ›เบฑเบ™เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เบ—เปเบฒเบญเบดเบ” func2(), เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เบžเบงเบเป€เบฎเบปเบฒเบœเปˆเบฒเบ™เบœเบปเบ™เบ‚เบญเบ‡เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบ™เบตเป‰เป€เบ›เบฑเบ™เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เบ—เปเบฒเบญเบดเบ” func3(). เปเบฅเบฐเปƒเบ™เบ—เบตเปˆเบชเบธเบ”, เบžเบงเบเป€เบฎเบปเบฒเบ‚เบฝเบ™เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเบ—เบฑเบ‡เบซเบกเบปเบ”เบ—เบตเปˆเบ›เบฐเบ•เบดเบšเบฑเบ”เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบงเบฑเบ”เบ–เบธ obj <-.

เบ—เบฑเบ‡เบซเบกเบปเบ”เบ‚เป‰เบฒเบ‡เป€เบ—เบดเบ‡เบ™เบตเป‰เปเบกเปˆเบ™เบชเบฐเปเบ”เบ‡เปƒเบซเป‰เป€เบซเบฑเบ™เบ”เบตเบเบงเปˆเบฒเบ„เปเบฒเป€เบงเบปเป‰เบฒเป‚เบ”เบ meme เบ™เบตเป‰:
เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

ะ’ data.table เบ•เปˆเบญเบ‡เป‚เบชเป‰เบ–เบทเบเปƒเบŠเป‰เปƒเบ™เบ—เบฒเบ‡เบ—เบตเปˆเบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™.

newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]

เปƒเบ™เปเบ•เปˆเบฅเบฐเบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบฅเปˆเบฝเบกเบ—เบตเปˆเบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบ™เปเบฒเปƒเบŠเป‰เบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ‚เบญเบ‡เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ—เบตเปˆเบœเปˆเบฒเบ™เบกเบฒ.

ะ’ pandas เบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบ‡เบฒเบ™เบ”เบฑเปˆเบ‡เบเปˆเบฒเบงเบ–เบทเบเปเบเบเบญเบญเบเป‚เบ”เบเบˆเบธเบ”.

obj = df.fun1().fun2().fun3()

เป€เบซเบผเบปเปˆเบฒเบ™เบฑเป‰เบ™. เบžเบงเบเป€เบฎเบปเบฒเป€เบญเบปเบฒเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒ df เปเบฅเบฐเปƒเบŠเป‰เบงเบดเบ—เบตเบเบฒเบ™เบ‚เบญเบ‡เบ™เบฒเบ‡ fun1(), เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เบžเบงเบเป€เบฎเบปเบฒเบ™เปเบฒเปƒเบŠเป‰เบงเบดเบ—เบตเบเบฒเบ™เบเบฑเบšเบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ—เบตเปˆเป„เบ”เป‰เบฎเบฑเบš fun2()เบซเบฅเบฑเบ‡เบˆเบฒเบ fun3(). เบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ—เบตเปˆเบ–เบทเบเบšเบฑเบ™เบ—เบถเบเป„เบงเป‰เปƒเบ™เบงเบฑเบ”เบ–เบธ เบงเบฑเบ”เบ–เบธ .

เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบ‚เปเป‰เบกเบนเบ™

เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R เปเบฅเบฐ Python เปเบกเปˆเบ™เบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™, เปเบ•เปˆเบกเบตเบŠเบทเปˆเบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™.

เบฅเบฒเบโ€‹เบฅเบฐโ€‹เบญเบฝเบ”
เบŠเบทเปˆเปƒเบ™ R
เบŠเบทเปˆเปƒเบ™ Python/pandas

เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡
data.frame, data.table, tibble
DataFrame

เบฅเบฒเบเบเบฒเบ™เปœเบถเปˆเบ‡เบกเบดเบ•เบดเบฅเบฐเบ”เบฑเบšเบ‚เบญเบ‡เบ„เปˆเบฒ
เปเบงเปˆเบ™
เบŠเบธเบ”เปƒเบ™ pandas เบซเบผเบทเบฅเบฒเบเบŠเบทเปˆเปƒเบ™ Python เบšเปเบฅเบดเบชเบธเบ”

เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบ—เบตเปˆเบšเปเปˆเปเบกเปˆเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบซเบผเบฒเบเบฅเบฐเบ”เบฑเบš
เบฅเบฒเบเบเบฒเบ™
เบงเบฑเบ”เบˆเบฐเบ™เบฒเบ™เบธเบเบปเบก

เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเป€เบšเบดเปˆเบ‡เบšเบฒเบ‡เบฅเบฑเบเบชเบฐเบ™เบฐเบญเบทเปˆเบ™เป†เปเบฅเบฐเบ„เบงเบฒเบกเปเบ•เบเบ•เปˆเบฒเบ‡เปƒเบ™ syntax เบ‚เป‰เบฒเบ‡เบฅเบธเปˆเบกเบ™เบตเป‰.

เบชเบญเบ‡เบชเบฒเบกเบ„เปเบฒเบเปˆเบฝเบงเบเบฑเบšเบŠเบธเบ”เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเปƒเบŠเป‰

เบเปˆเบญเบ™เบญเบทเปˆเบ™ เปเบปเบ”, เบ‚เป‰เบญเบเบˆเบฐเบšเบญเบเป€เบˆเบปเป‰เบฒเป€เบฅเบฑเบเบ™เป‰เบญเบเบเปˆเบฝเบงเบเบฑเบšเบŠเบธเบ”เบ—เบตเปˆเป€เบˆเบปเป‰เบฒเบˆเบฐเบ„เบธเป‰เบ™เป€เบ„เบตเบเบเบฑเบšเปƒเบ™เบšเบปเบ”เบ„เบงเบฒเบกเบ™เบตเป‰.

เป€เบ›เบฑเบ™เบฅเบฐเบšเบฝเบšเบฎเบฝเบšเบฎเป‰เบญเบ

เป€เบงเบฑเบšเป„เบŠเบ—เปŒเบ—เบฒเบ‡เบเบฒเบ™: tidyverse.org
เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™
เบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ” tidyverse เบ‚เบฝเบ™เป‚เบ”เบ Hedley Wickham, เบ™เบฑเบเบ„เบปเป‰เบ™เบ„เบงเป‰เบฒเบญเบฒเบงเบธเป‚เบชเบ‚เบญเบ‡ RStudio. tidyverse เบ›เบฐโ€‹เบเบญเบšโ€‹เบ”เป‰เบงเบโ€‹เบŠเบธเบ”โ€‹เบ—เบตเปˆโ€‹เบ›เบฐโ€‹เบ—เบฑเบšโ€‹เปƒเบˆโ€‹เบ—เบตเปˆโ€‹เป€เบฎเบฑเบ”โ€‹เปƒเบซเป‰โ€‹เบเบฒเบ™โ€‹เบ›เบธเบ‡โ€‹เปเบ•เปˆเบ‡โ€‹เบ‚เปเป‰โ€‹เบกเบนเบ™โ€‹เบ‡เปˆเบฒเบโ€‹เบ”เบฒเบโ€‹, 5 เปƒเบ™โ€‹เบ™เบฑเป‰เบ™โ€‹เปเบกเปˆเบ™โ€‹เบฅเบงเบกโ€‹เบขเบนเปˆโ€‹เปƒเบ™ 10 เบเบฒเบ™โ€‹เบ”เบฒเบงโ€‹เป‚เบซเบผเบ”โ€‹เบญเบฑเบ™โ€‹เบ”เบฑเบšโ€‹เบ•เบปเป‰เบ™โ€‹เบˆเบฒเบ repository CRANโ€‹.

เบซเบผเบฑเบโ€‹เบ‚เบญเบ‡โ€‹เบซเป‰เบญเบ‡โ€‹เบชเบฐโ€‹เบซเบกเบธเบ”โ€‹เบ›เบฐโ€‹เบเบญเบšโ€‹เบ”เป‰เบงเบโ€‹เบŠเบธเบ”โ€‹เบ”เบฑเปˆเบ‡โ€‹เบ•เปเปˆโ€‹เป„เบ›โ€‹เบ™เบตเป‰โ€‹: ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats. เปเบ•เปˆเบฅเบฐเบŠเบธเบ”เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰เปเบกเปˆเบ™เปเบ™เปƒเบชเปˆเปเบเป‰เป„เบ‚เบšเบฑเบ™เบซเบฒเบชเบฐเป€เบžเบฒเบฐ. เบเบปเบโ€‹เบ•เบปเบงโ€‹เบขเปˆเบฒเบ‡ dplyr เบชเป‰เบฒเบ‡โ€‹เบชเปเบฒโ€‹เบฅเบฑเบšโ€‹เบเบฒเบ™โ€‹เบˆเบฑเบ”โ€‹เบเบฒเบ™โ€‹เบ‚เปเป‰โ€‹เบกเบนเบ™โ€‹, tidyr เบเบฒเบ™โ€‹เบ™เปเบฒโ€‹เป€เบญเบปเบฒโ€‹เบ‚เปเป‰โ€‹เบกเบนเบ™โ€‹เป„เบ›โ€‹เป€เบ›เบฑเบ™โ€‹เบฎเบนเบšโ€‹เปเบšเบšโ€‹เบ—เบตเปˆโ€‹เบฅเบฐโ€‹เบญเบฝเบ”โ€‹, stringr เบ‡เปˆเบฒเบโ€‹เปƒเบ™โ€‹เบเบฒเบ™โ€‹เป€เบฎเบฑเบ”โ€‹เบงเบฝเบโ€‹เบฎเปˆเบงเบกโ€‹เบเบฑเบšโ€‹เบŠเปˆเบญเบโ€‹เปเบ™เปˆโ€‹, เปเบฅเบฐโ€‹ ggplot2 เปเบกเปˆเบ™เบซเบ™เบถเปˆเบ‡เปƒเบ™เป€เบ„เบทเปˆเบญเบ‡เบกเบทเบเบฒเบ™เป€เบšเบดเปˆเบ‡เป€เบซเบฑเบ™เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบ™เบดเบเบปเบกเบซเบผเบฒเบเบ—เบตเปˆเบชเบธเบ”.

เบ›เบฐเป‚เบซเบเบ” tidyverse เปเบกเปˆเบ™ syntax เบ—เบตเปˆเบ‡เปˆเบฒเบเบ”เบฒเบเปเบฅเบฐเบ‡เปˆเบฒเบเบ•เปเปˆเบเบฒเบ™เบญเปˆเบฒเบ™, เป€เบŠเบดเปˆเบ‡เบขเบนเปˆเปƒเบ™เบซเบผเบฒเบเบงเบดเบ—เบตเบ—เบตเปˆเบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เบเบฑเบšเบžเบฒเบชเบฒ SQL query.

เบ•เบฒเบ•เบฐเบฅเบฒเบ‡

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™เป€เบงเบฑเบšเป„เบŠเบ—เปŒเบ—เบฒเบ‡เบเบฒเบ™: r-datatable.com

เป‚เบ”เบเบœเบนเป‰เบ‚เบฝเบ™ data.table เปเบกเปˆเบ™ Matt Dole เบ‚เบญเบ‡ H2O.ai.

เบเบฒเบ™โ€‹เบ›เปˆเบญเบโ€‹เบ•เบปเบงโ€‹เบ„เบฑเป‰เบ‡โ€‹เบ—เปเบฒโ€‹เบญเบดเบ”โ€‹เบ‚เบญเบ‡โ€‹เบซเป‰เบญเบ‡โ€‹เบชเบฐโ€‹เบซเบกเบธเบ”โ€‹เป„เบ”เป‰โ€‹เป€เบเบตเบ”โ€‹เบ‚เบถเป‰เบ™โ€‹เปƒเบ™โ€‹เบ›เบต 2006โ€‹.

syntax เบ‚เบญเบ‡เปเบžเบฑเบเป€เบเบฑเบ”เปเบกเปˆเบ™เบšเปเปˆเบชเบฐเบ”เบงเบเบ„เบทเบเบฑเบšเปƒเบ™ tidyverse เปเบฅเบฐเบกเบต reminiscent เบซเบผเบฒเบเบ‚เบญเบ‡ dataframes เบ„เบฅเบฒเบชเบชเบดเบเปƒเบ™ R, เปเบ•เปˆเปƒเบ™เป€เบงเบฅเบฒเบ”เบฝเบงเบเบฑเบ™เบเบฒเบ™เบ‚เบฐเบซเบเบฒเบเบ•เบปเบงเบขเปˆเบฒเบ‡เบซเบผเบงเบ‡เบซเบผเบฒเบเปƒเบ™เบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบ.

เบเบฒเบ™เบซเบกเบนเบ™เปƒเบŠเป‰เบ—เบฑเบ‡เปเบปเบ”เบเบฑเบšเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปƒเบ™เบŠเบธเบ”เบ™เบตเป‰เปเบกเปˆเบ™เบ–เบทเบเบญเบฐเบ—เบดเบšเบฒเบเป„เบงเป‰เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบผเปˆเบฝเบก, เปเบฅเบฐเบ–เป‰เบฒเบ—เปˆเบฒเบ™เปเบ› syntax. data.table เปƒเบ™ SQL, เบ—เปˆเบฒเบ™เป„เบ”เป‰เบฎเบฑเบšเบšเบฒเบ‡เบชเบดเปˆเบ‡เบšเบฒเบ‡เบขเปˆเบฒเบ‡เป€เบŠเบฑเปˆเบ™เบ™เบตเป‰: data.table[ WHERE, SELECT, GROUP BY ]

เบ„เบงเบฒเบกเป€เบ‚เบฑเป‰เบกเปเบ‚เบ‡เบ‚เบญเบ‡เบŠเบธเบ”เบ™เบตเป‰เปเบกเปˆเบ™เบ„เบงเบฒเบกเป„เบงเปƒเบ™เบเบฒเบ™เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ‚เปเป‰เบกเบนเบ™เบˆเปเบฒเบ™เบงเบ™เบซเบฅเบฒเบ.

เปเบต เปเบžเบ™เบ”เบฒ

เป€เบงเบฑเบšเป„เบŠเบ—เปŒเบ—เบฒเบ‡เบเบฒเบ™: pandas.pydata.org เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เบŠเบทเปˆเบ‚เบญเบ‡เบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ”เบกเบฒเบˆเบฒเบเบ„เปเบฒเป€เบชเบ”เบ–เบฐเบชเบฒเบ” "เบ‚เปเป‰เบกเบนเบ™เบเบฐเบ”เบฒเบ™", เปƒเบŠเป‰เป€เบžเบทเปˆเบญเบญเบฐเบ—เบดเบšเบฒเบเบŠเบธเบ”เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบกเบตเป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบซเบผเบฒเบเบกเบดเบ•เบด.

เป‚เบ”เบเบœเบนเป‰เบ‚เบฝเบ™ pandas เปเบกเปˆเบ™เบŠเบฒเบงเบญเบฒเป€เบกเบฅเบดเบเบฒ Wes McKinney.

เปƒเบ™เป€เบงเบฅเบฒเบ—เบตเปˆเบกเบฑเบ™เบกเบฒเบเบฑเบšเบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ Python, เป€เบ—เบปเปˆเบฒเบ—เบฝเบกเบเบฑเบ™ pandas เบšเปเปˆ. เปเบžเบฑเบเป€เบเบฑเบ”เบ—เบตเปˆเบกเบตเบฅเบฐเบ”เบฑเบšเบชเบนเบ‡เบซเบผเบฒเบเบ›เบฐเบเบฒเบ™เบซเบผเบฒเบเบญเบฑเบ™เบ—เบตเปˆเบŠเปˆเบงเบเปƒเบซเป‰เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบซเบกเบนเบ™เปƒเบŠเป‰เบเบฑเบšเบ‚เปเป‰เบกเบนเบ™, เบˆเบฒเบเบเบฒเบ™เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเปเบซเบผเปˆเบ‡เปƒเบ”เบ™เบถเปˆเบ‡เป„เบ›เบซเบฒเบเบฒเบ™เป€เบšเบดเปˆเบ‡เป€เบซเบฑเบ™เบกเบฑเบ™.

เบเบฒเบ™เบ•เบดเบ”เบ•เบฑเป‰เบ‡เปเบžเบฑเบเป€เบเบ”เป€เบžเบตเปˆเบกเป€เบ•เบตเบก

เบŠเบธเบ”เบ—เบตเปˆเบชเบปเบ™เบ—เบฐเบ™เบฒเปƒเบ™เบšเบปเบ”เบ„เบงเบฒเบกเบ™เบตเป‰เบšเปเปˆเป„เบ”เป‰เบฅเบงเบกเบขเบนเปˆเปƒเบ™เบเบฒเบ™เปเบˆเบเบขเบฒเบ R เปเบฅเบฐ Python เบžเบทเป‰เบ™เบ–เบฒเบ™. เป€เบ–เบดเบ‡เปเบกเปˆเบ™เบงเปˆเบฒเบกเบตเบ„เปเบฒเป€เบ•เบทเบญเบ™เบ‚เบฐเบซเบ™เบฒเบ”เบ™เป‰เบญเบ, เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบ•เบดเบ”เบ•เบฑเป‰เบ‡เบเบฒเบ™เปเบˆเบเบขเบฒเบ Anaconda, เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เปƒเบซเป‰เบ•เบดเบ”เบ•เบฑเป‰เบ‡เป€เบžเบตเปˆเบกเป€เบ•เบตเบก pandas เปเบกเปˆเบ™เบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡.

เบเบฒเบ™เบ•เบดเบ”เบ•เบฑเป‰เบ‡เปเบžเบฑเบเป€เบเบ”เปƒเบ™ R

เบ–เป‰เบฒเบ—เปˆเบฒเบ™เป„เบ”เป‰เป€เบ›เบตเบ”เบชเบฐเบžเบฒเบšเปเบงเบ”เบฅเป‰เบญเบกเบเบฒเบ™เบžเบฑเบ”เบ—เบฐเบ™เบฒ RStudio เบขเปˆเบฒเบ‡เบซเบ™เป‰เบญเบเบซเบ™เบถเปˆเบ‡เบ„เบฑเป‰เบ‡, เบ—เปˆเบฒเบ™เบญเบฒเบ”เบˆเบฐเบฎเบนเป‰เบงเบดเบ—เบตเบเบฒเบ™เบ•เบดเบ”เบ•เบฑเป‰เบ‡เบŠเบธเบ”เบ—เบตเปˆเบเปเบฒเบ™เบปเบ”เป„เบงเป‰เปƒเบ™ R. เป€เบžเบทเปˆเบญเบ•เบดเบ”เบ•เบฑเป‰เบ‡เปเบžเบฑเบเป€เบเบฑเบ”, เปƒเบซเป‰เปƒเบŠเป‰เบ„เปเบฒเบชเบฑเปˆเบ‡เบกเบฒเบ”เบ•เบฐเบ–เบฒเบ™. install.packages() เป‚เบ”เบเบ”เปเบฒเป€เบ™เบตเบ™เบเบฒเบ™เป‚เบ”เบเบเบปเบ‡เปƒเบ™ R เบ•เบปเบงเบ‚เบญเบ‡เบกเบฑเบ™เป€เบญเบ‡.

# ัƒัั‚ะฐะฝะพะฒะบะฐ ะฟะฐะบะตั‚ะพะฒ
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")

เบซเบผเบฑเบ‡เบˆเบฒเบเบเบฒเบ™เบ•เบดเบ”เบ•เบฑเป‰เบ‡, เบเบฒเบ™เบซเบธเป‰เบกเบซเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป€เบŠเบทเปˆเบญเบกเบ•เปเปˆ, เป€เบŠเบดเปˆเบ‡เปƒเบ™เบเปเบฅเบฐเบ™เบตเบซเบผเบฒเบเบ—เบตเปˆเบชเบธเบ”, เบ„เปเบฒเบชเบฑเปˆเบ‡เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰ library().

# ะฟะพะดะบะปัŽั‡ะตะฝะธะต ะธะปะธ ะธะผะฟะพั€ั‚ ะฟะฐะบะตั‚ะพะฒ ะฒ ั€ะฐะฑะพั‡ะตะต ะพะบั€ัƒะถะตะฝะธะต
library(vroom)
library(readr)
library(dplyr)
library(data.table)

เบเบฒเบ™เบ•เบดเบ”เบ•เบฑเป‰เบ‡เปเบžเบฑเบเป€เบเบ”เปƒเบ™ Python

เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบกเบต Python เบšเปเบฅเบดเบชเบธเบ”เบ•เบดเบ”เบ•เบฑเป‰เบ‡, เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™ pandas เบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เบ•เบดเบ”เบ•เบฑเป‰เบ‡เบกเบฑเบ™เบ”เป‰เบงเบเบ•เบปเบ™เป€เบญเบ‡. เป€เบ›เบตเบ”เป€เบชเบฑเป‰เบ™เบ„เปเบฒเบชเบฑเปˆเบ‡, เบซเบผเบท terminal, เบ‚เบถเป‰เบ™เบเบฑเบšเบฅเบฐเบšเบปเบšเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบ‚เบญเบ‡เบ—เปˆเบฒเบ™เปเบฅเบฐเปƒเบชเปˆเบ„เปเบฒเบชเบฑเปˆเบ‡เบ•เปเปˆเป„เบ›เบ™เบตเป‰.

pip install pandas

เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™, เบžเบงเบเป€เบฎเบปเบฒเบเบฑเบšเบ„เบทเบ™เป„เบ›เบซเบฒ Python เปเบฅเบฐเบ™เปเบฒเป€เบ‚เบปเป‰เบฒเบŠเบธเบ”เบ—เบตเปˆเบ•เบดเบ”เบ•เบฑเป‰เบ‡เบ”เป‰เบงเบเบ„เปเบฒเบชเบฑเปˆเบ‡ import.

import pandas as pd

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™

เบเบฒเบ™เบ‚เบธเบ”เบ„เบปเป‰เบ™เบ‚เปเป‰เบกเบนเบ™เปเบกเปˆเบ™เบซเบ™เบถเปˆเบ‡เปƒเบ™เบ‚เบฑเป‰เบ™เบ•เบญเบ™เบ—เบตเปˆเบชเปเบฒเบ„เบฑเบ™เบ—เบตเปˆเบชเบธเบ”เปƒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เปเป‰เบกเบนเบ™. เบ—เบฑเบ‡ Python เปเบฅเบฐ R, เบ–เป‰เบฒเบ•เป‰เบญเบ‡เบเบฒเบ™, เปƒเบซเป‰เบ—เปˆเบฒเบ™เบกเบตเป‚เบญเบเบฒเบ”เบขเปˆเบฒเบ‡เบเบงเป‰เบฒเบ‡เบ‚เบงเบฒเบ‡เบ—เบตเปˆเบˆเบฐเป„เบ”เป‰เบฎเบฑเบšเบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเปเบซเบผเปˆเบ‡เบ•เปˆเบฒเบ‡เป†: เป„เบŸเบฅเปŒเบ—เป‰เบญเบ‡เบ–เบดเปˆเบ™, เป„เบŸเบฅเปŒเบˆเบฒเบเบญเบดเบ™เป€เบ•เบตเป€เบ™เบฑเบ”, เป€เบงเบฑเบšเป„เบŠเบ—เปŒ, เบ—เบธเบเบ›เบฐเป€เบžเบ”เบ‚เบญเบ‡เบ–เบฒเบ™เบ‚เปเป‰เบกเบนเบ™.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เบ•เบฐเบซเบผเบญเบ”เบšเบปเบ”เบ„เบงเบฒเบกเบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบ™เปเบฒเปƒเบŠเป‰เบŠเบธเบ”เบ‚เปเป‰เบกเบนเบ™เบˆเปเบฒเบ™เบงเบ™เบซเบ™เบถเปˆเบ‡:

  1. เบชเบญเบ‡เบ”เบฒเบงเป‚เบซเบผเบ”เบˆเบฒเบ Google Analytics.
  2. เบŠเบธเบ”เบ‚เปเป‰เบกเบนเบ™เบœเบนเป‰เป‚เบ”เบเบชเบฒเบ™ Titanic.

เบ‚เปเป‰เบกเบนเบ™เบ—เบฑเบ‡เบซเบกเบปเบ”เปเบกเปˆเบ™เบขเบนเปˆเปƒเบ™เบ‚เบญเบ‡เบ‚เป‰เบญเบ GitHub เปƒเบ™เบฎเบนเบšเปเบšเบšเบ‚เบญเบ‡เป„เบŸเบฅเปŒ csv เปเบฅเบฐ tsv. เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบฎเป‰เบญเบ‡เบ‚เปเปƒเบซเป‰เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒเบกเบฒเบˆเบฒเบเปƒเบช?

เบเบฒเบ™เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™ R: tidyverse, vroom, readr

เป€เบžเบทเปˆเบญเป‚เบซเบฅเบ”เบ‚เปเป‰เบกเบนเบ™เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบซเป‰เบญเบ‡เบชเบฐเบซเบกเบธเบ” tidyverse เบกเบตเบชเบญเบ‡เบŠเบธเบ”: vroom, readr. vroom เบ—เบฑเบ™เบชเบฐเป„เบซเบกเบซเบผเบฒเบ, เปเบ•เปˆเปƒเบ™เบญเบฐเบ™เบฒเบ„เบปเบ”เบเบฒเบ™เบซเบธเป‰เบกเบซเปเปˆเบญเบฒเบ”เบˆเบฐเบ–เบทเบเบฅเบงเบกเป€เบ‚เบปเป‰เบฒเบเบฑเบ™.

เบญเป‰เบฒเบ‡เบญเบตเบ‡เบˆเบฒเบ เป€เบญเบเบฐเบชเบฒเบ™เบ—เบฒเบ‡เบเบฒเบ™ vroom.

vroom เบ—เบฝเบšเบเบฑเบšเบœเบนเป‰เบญเปˆเบฒเบ™
เบเบฒเบ™เบ›เปˆเบญเบเบ•เบปเบงเบ‚เบญเบ‡ vroom เบซเบกเบฒเบเบ„เบงเบฒเบกเบงเปˆเบฒเบชเปเบฒเบฅเบฑเบš readr? เบชเปเบฒเบฅเบฑเบšเปƒเบ™เบ›เบฑเบ”เบˆเบธเบšเบฑเบ™, เบžเบงเบเป€เบฎเบปเบฒเบงเบฒเบ‡เปเบœเบ™เบ—เบตเปˆเบˆเบฐเปƒเบซเป‰เบ—เบฑเบ‡เบชเบญเบ‡เบŠเบธเบ”เบžเบฑเบ”เบ—เบฐเบ™เบฒเปเบเบเบ•เปˆเบฒเบ‡เบซเบฒเบ, เปเบ•เปˆเป€เบšเบดเปˆเบ‡เบ„เบทเบงเปˆเบฒเบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบฅเบงเบกเป€เบญเบปเบฒเบŠเบธเบ”เบ”เบฑเปˆเบ‡เบเปˆเบฒเบงเปƒเบ™เบญเบฐเบ™เบฒเบ„เบปเบ”. เบ‚เปเป‰เป€เบชเบเปœเบถเปˆเบ‡เบ‚เบญเบ‡เบเบฒเบ™เบญเปˆเบฒเบ™เบ—เบตเปˆเบ‚เบตเป‰เบ„เป‰เบฒเบ™เบ‚เบญเบ‡ vroom เปเบกเปˆเบ™เบšเบฑเบ™เบซเบฒเบ‚เปเป‰เบกเบนเบ™เบšเบฒเบ‡เบขเปˆเบฒเบ‡เบ—เบตเปˆเบšเปเปˆเบชเบฒเบกเบฒเบ”เบฅเบฒเบเบ‡เบฒเบ™เป„เบ”เป‰เบเปˆเบญเบ™เปœเป‰เบฒ, เบชเบฐเบ™เบฑเป‰เบ™เบงเบดเบ—เบตเบ—เบตเปˆเบ”เบตเบ—เบตเปˆเบชเบธเบ”เบ—เบตเปˆเบˆเบฐเบฎเบงเบกเบžเบงเบเบกเบฑเบ™เป„เบ”เป‰เบ•เป‰เบญเบ‡เบ„เบดเบ”เบšเบฒเบ‡เบญเบฑเบ™.

vroom vs readr
เบเบฒเบ™เบ›เปˆเบญเบเบ•เบปเบงเบซเบกเบฒเบเบ„เบงเบฒเบกเบงเปˆเบฒเปเบ™เบงเปƒเบ”? vroom เบเบฒเบ™ readr? เปƒเบ™เป€เบงเบฅเบฒเบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเบงเบฒเบ‡เปเบœเบ™เบ—เบตเปˆเบˆเบฐเบžเบฑเบ”เบ—เบฐเบ™เบฒเปเบžเบฑเบเป€เบเบฑเบ”เบ—เบฑเบ‡เบชเบญเบ‡เปเบเบเบ•เปˆเบฒเบ‡เบซเบฒเบ, เปเบ•เปˆเบžเบงเบเป€เบฎเบปเบฒเบญเบฒเบ”เบˆเบฐเบฅเบงเบกเบžเบงเบเบกเบฑเบ™เปƒเบ™เบญเบฐเบ™เบฒเบ„เบปเบ”. เบซเบ™เบถเปˆเบ‡เปƒเบ™เบ‚เปเป‰เป€เบชเบเบ‚เบญเบ‡เบเบฒเบ™เบญเปˆเบฒเบ™ lazy vroom เปเบกเปˆเบ™เบงเปˆเบฒเบšเบฒเบ‡เบšเบฑเบ™เบซเบฒเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เบšเปเปˆเบชเบฒเบกเบฒเบ”เบฅเบฒเบเบ‡เบฒเบ™เบฅเปˆเบงเบ‡เบซเบ™เป‰เบฒเป„เบ”เป‰, เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™เบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เบ„เบดเบ”เบเปˆเบฝเบงเบเบฑเบšเบงเบดเบ—เบตเบ—เบตเปˆเบ”เบตเบ—เบตเปˆเบชเบธเบ”เบ—เบตเปˆเบˆเบฐเบชเบปเบกเบ—เบปเบšเบžเบงเบเบกเบฑเบ™.

เปƒเบ™เบšเบปเบ”เบ„เบงเบฒเบกเบ™เบตเป‰เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเป€เบšเบดเปˆเบ‡เบ—เบฑเบ‡เบชเบญเบ‡เบŠเบธเบ”เบเบฒเบ™เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™:

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เปƒเบชเปˆเบŠเบธเบ” R: vroom

# install.packages("vroom")
library(vroom)

# ะงั‚ะตะฝะธะต ะดะฐะฝะฝั‹ั…
## vroom
ga_nov  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เปƒเบชเปˆ R: readr

# install.packages("readr")
library(readr)

# ะงั‚ะตะฝะธะต ะดะฐะฝะฝั‹ั…
## readr
ga_nov  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

เปƒเบ™เบŠเบธเบ” vroom, เป‚เบ”เบเบšเปเปˆเบ„เปเบฒเบ™เบถเบ‡เป€เบ–เบดเบ‡เบฎเบนเบšเปเบšเบšเบ‚เปเป‰เบกเบนเบ™ csv / tsv, เบเบฒเบ™เป‚เบซเบผเบ”เปเบกเปˆเบ™เบ”เปเบฒเป€เบ™เบตเบ™เป‚เบ”เบเบซเบ™เป‰เบฒเบ—เบตเปˆเบ‚เบญเบ‡เบŠเบทเปˆเบ”เบฝเบงเบเบฑเบ™. vroom(), เปƒเบ™เบŠเบธเบ” readr เบžเบงเบเป€เบฎเบปเบฒเปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™เบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เบชเปเบฒเบฅเบฑเบšเปเบ•เปˆเบฅเบฐเบฎเบนเบšเปเบšเบš read_tsv() ะธ read_csv().

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เปƒเบชเปˆ R: data.table

ะ’ data.table เบกเบตเบซเบ™เป‰เบฒเบ—เบตเปˆเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™ fread().

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เปƒเบชเปˆเบŠเบธเบ” R: data.table

# install.packages("data.table")
library(data.table)

## data.table
ga_nov  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เปƒเบ™ Python: pandas

เบ–เป‰เบฒเบžเบงเบเป€เบฎเบปเบฒเบ›เบฝเบšเบ—เบฝเบšเบเบฑเบšเบŠเบธเบ” R, เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เปƒเบ™เบเปเบฅเบฐเบ™เบตเบ™เบตเป‰ syntax เปเบกเปˆเบ™เบขเบนเปˆเปƒเบเป‰เบ—เบตเปˆเบชเบธเบ” pandas เบˆเบฐ readr, เป€เบ™เบทเปˆเบญเบ‡เบˆเบฒเบเบงเปˆเบฒ pandas เบชเบฒเบกเบฒเบ”เบฎเป‰เบญเบ‡เบ‚เปเบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเบ—เบธเบเบšเปˆเบญเบ™, เปเบฅเบฐเบกเบตเบซเบ™เป‰เบฒเบ—เบตเปˆเบ—เบฑเบ‡เบซเบกเบปเบ”เปƒเบ™เบŠเบธเบ”เบ™เบตเป‰ read_*().

  • read_csv()
  • read_excel()
  • read_sql()
  • read_json()
  • read_html()

เปเบฅเบฐเบŸเบฑเบ‡เบŠเบฑเบ™เบญเบทเปˆเบ™เป†เบˆเปเบฒเบ™เบงเบ™เบซเบผเบฒเบเบ—เบตเปˆเบ–เบทเบเบญเบญเบเปเบšเบšเบกเบฒเป€เบžเบทเปˆเบญเบญเปˆเบฒเบ™เบ‚เปเป‰เบกเบนเบ™เบˆเบฒเบเบฎเบนเบšเปเบšเบšเบ•เปˆเบฒเบ‡เป†. เปเบ•เปˆเบชเปเบฒเบฅเบฑเบšเบˆเบธเบ”เบ›เบฐเบชเบปเบ‡เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒเบกเบฑเบ™เบžเบฝเบ‡เบžเป read_table() เบซเบผเบท read_csv() เบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ Sep เป€เบžเบทเปˆเบญเบฅเบฐเบšเบธเบ•เบปเบงเปเบเบเบ–เบฑเบ™.

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™เปƒเบ™ Python: pandas

import pandas as pd

ga_nov  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™

เป‚เบ•เบฐ เบเปเบฒเบ›เบฑเปˆเบ™ Titanic, เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเป‚เบซเบฅเบ”, เบกเบตเบžเบฒเบเบชเบฐเบซเบ™เบฒเบก เป€เบžเบ”, เป€เบŠเบดเปˆเบ‡เป€เบเบฑเบšเบฎเบฑเบเบชเบฒเบ•เบปเบงเบฅเบฐเบšเบธเป€เบžเบ”เบ‚เบญเบ‡เบœเบนเป‰เป‚เบ”เบเบชเบฒเบ™.

เปเบ•เปˆเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบ™เปเบฒเบชเบฐเป€เบซเบ™เบตเบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบชเบฐเบ”เบงเบเบเบงเปˆเบฒเปƒเบ™เปเบ‡เปˆเบ‚เบญเบ‡เป€เบžเบ”เบ‚เบญเบ‡เบœเบนเป‰เป‚เบ”เบเบชเบฒเบ™, เบ—เปˆเบฒเบ™เบ„เบงเบ™เปƒเบŠเป‰เบŠเบทเปˆเปเบ—เบ™เบ—เบตเปˆเบˆเบฐเป€เบ›เบฑเบ™เบฅเบฐเบซเบฑเบ”เป€เบžเบ”.

เป€เบžเบทเปˆเบญเป€เบฎเบฑเบ”เบชเบดเปˆเบ‡เบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบชเป‰เบฒเบ‡เป„เบ”เป€เบฅเบเบฐเบ—เปเบฅเบตเบ‚เบฐเบซเบ™เบฒเบ”เบ™เป‰เบญเบ, เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบตเปˆเบˆเบฐเบกเบตเบžเบฝเบ‡เปเบ•เปˆ 2 เบ–เบฑเบ™ (เบฅเบฐเบซเบฑเบ”เปเบฅเบฐเบŠเบทเปˆเป€เบžเบ”) เปเบฅเบฐ 2 เปเบ–เบงเบ•เบฒเบกเบฅเปเบฒเบ”เบฑเบš.

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R: tidyverse, dplyr

เปƒเบ™เบ•เบปเบงเบขเปˆเบฒเบ‡เบฅเบฐเบซเบฑเบ”เบ‚เป‰เบฒเบ‡เบฅเบธเปˆเบกเบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เป‚เบ”เบเปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™ tibble() .

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R: dplyr

## dplyr
### ัะพะทะดะฐั‘ะผ ัะฟั€ะฐะฒะพั‡ะฝะธะบ
gender <- tibble(id = c(1, 2),
                 gender = c("female", "male"))

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R: data.table

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R: data.table

## data.table
### ัะพะทะดะฐั‘ะผ ัะฟั€ะฐะฒะพั‡ะฝะธะบ
gender <- data.table(id = c(1, 2),
                    gender = c("female", "male"))

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ Python: pandas

ะ’ pandas เบเบฒเบ™เบชเป‰เบฒเบ‡เป€เบŸเบฃเบกเปเบกเปˆเบ™เบ”เปเบฒเป€เบ™เบตเบ™เปƒเบ™เบซเบผเบฒเบเบ‚เบฑเป‰เบ™เบ•เบญเบ™, เบ—เปเบฒเบญเบดเบ”เบžเบงเบเป€เบฎเบปเบฒเบชเป‰เบฒเบ‡เบงเบฑเบ”เบˆเบฐเบ™เบฒเบ™เบธเบเบปเบก, เปเบฅเบฐเบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เบžเบงเบเป€เบฎเบปเบฒเบ›เปˆเบฝเบ™เบงเบฑเบ”เบˆเบฐเบ™เบฒเบ™เบธเบเบปเบกเป€เบ›เบฑเบ™เบเบญเบšเบ‚เปเป‰เบกเบนเบ™.

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ Python: pandas

# ัะพะทะดะฐั‘ะผ ะดะฐั‚ะฐ ั„ั€ะตะนะผ
gender_dict = {'id': [1, 2],
               'gender': ["female", "male"]}
# ะฟั€ะตะพะฑั€ะฐะทัƒะตะผ ัะปะพะฒะฐั€ัŒ ะฒ ะดะฐั‚ะฐั„ั€ะตะนะผ
gender = pd.DataFrame.from_dict(gender_dict)

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™

เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบตเปˆเบ—เปˆเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบญเบฒเบ”เบกเบตเบ‚เปเป‰เบกเบนเบ™เบซเบผเบฒเบเบชเบดเบš เบซเบผเบทเบซเบผเบฒเบเบฎเป‰เบญเบเบ–เบฑเบ™. เปเบ•เปˆเป€เบžเบทเปˆเบญเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐ, เบ•เบฒเบกเบเบปเบ”เบฅเบฐเบšเบฝเบš, เบ—เปˆเบฒเบ™เบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เบกเบตเบ„เปเบฅเปเบฒเบ—เบฑเบ‡เบซเบกเบปเบ”เบ—เบตเปˆเบกเบตเบขเบนเปˆเปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบซเบผเปˆเบ‡.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™, เบซเบ™เบถเปˆเบ‡เปƒเบ™เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ—เปเบฒเบญเบดเบ”เบ—เบตเปˆเป€เบˆเบปเป‰เบฒเบˆเบฐเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฑเบšเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบซเบผเปˆเบ‡เปเบกเปˆเบ™เป€เบžเบทเปˆเบญเบฅเป‰เบฒเบ‡เบกเบฑเบ™เบ‚เบญเบ‡เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบšเปเปˆเบˆเปเบฒเป€เบ›เบฑเบ™เปเบฅเบฐเป€เบžเบตเปˆเบกเบ„เบงเบฒเบกเบˆเปเบฒเบ—เบตเปˆเบ‚เปเป‰เบกเบนเบ™เบ™เบตเป‰เบ„เบญเบšเบ„เบญเบ‡.

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™เปƒเบ™ R: tidyverse, dplyr

syntax dplyr เปเบกเปˆเบ™เบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เบเบฑเบšเบžเบฒเบชเบฒ SQL query, เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบ„เบธเป‰เบ™เป€เบ„เบตเบเบเบฑเบšเบกเบฑเบ™, เบ—เปˆเบฒเบ™เบˆเบฐเป€เบ›เบฑเบ™เปเบกเปˆเปเบšเบšเบŠเบธเบ”เบ™เบตเป‰เบขเปˆเบฒเบ‡เป„เบงเบงเบฒ.

เป€เบžเบทเปˆเบญเป€เบฅเบทเบญเบเบ–เบฑเบ™, เปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™ select().

เบ‚เป‰เบฒเบ‡เบฅเบธเปˆเบกเบ™เบตเป‰เปเบกเปˆเบ™เบ•เบปเบงเบขเปˆเบฒเบ‡เบ‚เบญเบ‡เบฅเบฐเบซเบฑเบ”เบ—เบตเปˆเบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เป€เบฅเบทเบญเบเบ„เปเบฅเปเบฒเบ”เป‰เบงเบเบงเบดเบ—เบตเบ•เปเปˆเป„เบ›เบ™เบตเป‰:

  • เบฅเบฒเบเบŠเบทเปˆเบ‚เบญเบ‡เบ–เบฑเบ™เบ—เบตเปˆเบ•เป‰เบญเบ‡เบเบฒเบ™
  • เบญเป‰เบฒเบ‡เป€เบ–เบดเบ‡เบŠเบทเปˆเบ–เบฑเบ™เป‚เบ”เบเปƒเบŠเป‰เบชเบณเบ™เบงเบ™เบ›เบปเบเบเบฐเบ•เบด
  • เป‚เบ”เบเบ›เบฐเป€เบžเบ”เบ‚เปเป‰เบกเบนเบ™เบซเบผเบทเบŠเบฑเบšเบชเบดเบ™เบญเบทเปˆเบ™เป†เบ‚เบญเบ‡เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบกเบตเบขเบนเปˆเปƒเบ™เบ–เบฑเบ™

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™เปƒเบ™ R: dplyr

# ะ’ั‹ะฑะพั€ ะฝัƒะถะฝั‹ั… ัั‚ะพะปะฑั†ะพะฒ
## dplyr
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
select(ga_nov, date, source, sessions)
### ะธัะบะปัŽั‡ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
select(ga_nov, -medium, -bounces)
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ, ัั‚ะพะฑั†ั‹ ะธะผะตะฝะฐ ะบะพั‚ะพั€ั‹ั… ะทะฐะบะฐะฝั‡ะธะฒะฐัŽั‚ัั ะฝะฐ s
select(ga_nov, matches("s$"))
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ัƒัะปะพะฒะธัŽ, ะฒั‹ะฑะธั€ะฐะตะผ ั‚ะพะปัŒะบะพ ั†ะตะปะพั‡ะธัะปะตะฝะฝั‹ะต ัั‚ะพะปะฑั†ั‹
select_if(ga_nov, is.integer)

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™เปƒเบ™ R: data.table

เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ”เบฝเบงเบเบฑเบ™เปƒเบ™ data.table เบ–เบทเบเบ›เบฐเบ•เบดเบšเบฑเบ”เปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เป€เบฅเบฑเบเบ™เป‰เบญเบ, เปƒเบ™เบ•เบญเบ™เบ•เบปเป‰เบ™เบ‚เบญเบ‡เบšเบปเบ”เบ„เบงเบฒเบกเบ‚เป‰เบฒเบžเบฐเป€เบˆเบปเป‰เบฒเป„เบ”เป‰เปƒเบซเป‰เบ„เปเบฒเบญเบฐเบ—เบดเบšเบฒเบเบเปˆเบฝเบงเบเบฑเบšเบชเบดเปˆเบ‡เบ—เบตเปˆเป‚เบ•เป‰เบ–เบฝเบ‡เบขเบนเปˆเปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบฅเปˆเบฝเบกเปƒเบ™. data.table.

DT[i,j,by]

เบšเปˆเบญเบ™เบ—เบตเปˆ:
i - เบšเปˆเบญเบ™เบ—เบตเปˆ, i.e. เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เป‚เบ”เบเปเบ–เบง
j - เป€เบฅเบทเบญเบ|เบญเบฑเบšเป€เบ”เบ”|เป€เบฎเบฑเบ”, i.e. เป€เบฅเบทเบญเบเบ–เบฑเบ™เปเบฅเบฐเบ›เปˆเบฝเบ™เบžเบงเบเบกเบฑเบ™
เป‚เบ”เบ - เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเบ‚เปเป‰เบกเบนเบ™

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™เปƒเบ™ R: data.table

## data.table
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
ga_nov[ , .(date, source, sessions) ]
### ะธัะบะปัŽั‡ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ ัั‚ะพะปะฑั†ะพะฒ
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### ะฒั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ
ga_nov[, .SD, .SDcols = patterns("s$")]

เบ•เบปเบงเบ›เปˆเบฝเบ™เปเบ›เบ‡ .SD เบญเบฐเบ™เบธเบเบฒเบ”เปƒเบซเป‰เบ—เปˆเบฒเบ™เป€เบ‚เบปเป‰เบฒเป€เบ–เบดเบ‡เบ„เปเบฅเปเบฒเบ—เบฑเบ‡เบซเบกเบปเบ”, เปเบฅเบฐ .SDcols เบเบฑเปˆเบ™เบ•เบญเบ‡เบ–เบฑเบ™เบ—เบตเปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เป‚เบ”เบเปƒเบŠเป‰เบเบฒเบ™เบชเบฐเปเบ”เบ‡เบœเบปเบ™เบ›เบปเบเบเบฐเบ•เบด, เบซเบผเบทเบŸเบฑเบ‡เบŠเบฑเบ™เบญเบทเปˆเบ™เป€เบžเบทเปˆเบญเบเบฑเปˆเบ™เบ•เบญเบ‡เบŠเบทเปˆเบ‚เบญเบ‡เบ–เบฑเบ™เบ—เบตเปˆเบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบเบฒเบ™.

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™เปƒเบ™ Python, pandas

เป€เบžเบทเปˆเบญเป€เบฅเบทเบญเบเบ–เบฑเบ™เบ•เบฒเบกเบŠเบทเปˆเปƒเบ™ pandas เบกเบฑเบ™เบžเบฝเบ‡เบžเปเบ—เบตเปˆเบˆเบฐเบชเบฐเบซเบ™เบญเบ‡เบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบ‚เบญเบ‡เบŠเบทเปˆเบ‚เบญเบ‡เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒ. เปเบฅเบฐเป€เบžเบทเปˆเบญเป€เบฅเบทเบญเบเบซเบผเบทเบเบปเบเป€เบงเบฑเป‰เบ™เบ„เปเบฅเปเบฒเบ•เบฒเบกเบŠเบทเปˆเป‚เบ”เบเปƒเบŠเป‰เบเบฒเบ™เบชเบฐเปเบ”เบ‡เบญเบญเบเบ›เบปเบเบเบฐเบ•เบด, เบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เปƒเบŠเป‰เบซเบ™เป‰เบฒเบ—เบตเปˆ drop() ะธ filter(), เปเบฅเบฐเบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ เปเบเบ™=1, เบ—เบตเปˆเบ—เปˆเบฒเบ™เบŠเบตเป‰เบšเบญเบเบงเปˆเบฒเบกเบฑเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ–เบฑเบ™เปเบ—เบ™เบ—เบตเปˆเบˆเบฐเป€เบ›เบฑเบ™เปเบ–เบง.

เป€เบžเบทเปˆเบญเป€เบฅเบทเบญเบเบŠเปˆเบญเบ‡เบ‚เปเป‰เบกเบนเบ™เบ•เบฒเบกเบ›เบฐเป€เบžเบ”เบ‚เปเป‰เบกเบนเบ™, เปƒเบซเป‰เปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™ select_dtypes(), เปเบฅเบฐเป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ เบ›เบฐเบเบญเบšเบ”เป‰เบงเบ เบซเบผเบท เบเบปเบเป€เบงเบฑเป‰เบ™ เบœเปˆเบฒเบ™เบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบ‚เบญเบ‡เบ›เบฐเป€เบžเบ”เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบชเบญเบ”เบ„เป‰เบญเบ‡เบเบฑเบšเบŠเปˆเบญเบ‡เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบเบฒเบ™เป€เบฅเบทเบญเบ.

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™เปƒเบ™ Python: pandas

# ะ’ั‹ะฑะพั€ ะฟะพะปะตะน ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ
ga_nov[['date', 'source', 'sessions']]
# ะ˜ัะบะปัŽั‡ะธั‚ัŒ ะฟะพ ะฝะฐะทะฒะฐะฝะธัŽ
ga_nov.drop(['medium', 'bounces'], axis=1)
# ะ’ั‹ะฑั€ะฐั‚ัŒ ะฟะพ ั€ะตะณัƒะปัั€ะฝะพะผัƒ ะฒั‹ั€ะฐะถะตะฝะธัŽ
ga_nov.filter(regex="s$", axis=1)
# ะ’ั‹ะฑั€ะฐั‚ัŒ ั‡ะธัะปะพะฒั‹ะต ะฟะพะปั
ga_nov.select_dtypes(include=['number'])
# ะ’ั‹ะฑั€ะฐั‚ัŒ ั‚ะตะบัั‚ะพะฒั‹ะต ะฟะพะปั
ga_nov.select_dtypes(include=['object'])

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบง

เบ•เบปเบงเบขเปˆเบฒเบ‡, เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบซเบผเปˆเบ‡เบญเบฒเบ”เบˆเบฐเบ›เบฐเบเบญเบšเบ”เป‰เบงเบเบ‚เปเป‰เบกเบนเบ™เบซเบผเบฒเบเบ›เบต, เปเบ•เปˆเบงเปˆเบฒเบ—เปˆเบฒเบ™เบžเบฝเบ‡เปเบ•เปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเป€เบ”เบทเบญเบ™เบ—เบตเปˆเบœเปˆเบฒเบ™เบกเบฒ. เบญเบตเบเป€เบ—เบทเปˆเบญเบซเบ™เบถเปˆเบ‡, เบชเบฒเบเบžเบดเป€เบชเบ”เบˆเบฐเบŠเป‰เบฒเบฅเบปเบ‡เบ‚เบฐเบšเบงเบ™เบเบฒเบ™เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ‚เปเป‰เบกเบนเบ™เปเบฅเบฐ clog เป€เบ–เบดเบ‡เบซเบ™เปˆเบงเบเบ„เบงเบฒเบกเบˆเปเบฒ PC.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบงเปƒเบ™ R: tydyverse, dplyr

ะ’ dplyr เบŸเบฑเบ‡เบŠเบฑเบ™เปเบกเปˆเบ™เปƒเบŠเป‰เป€เบžเบทเปˆเบญเบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบง filter(). เบกเบฑเบ™เปƒเบŠเป‰เป€เบงเบฅเบฒ dataframe เป€เบ›เบฑเบ™ argument เบ—เปเบฒเบญเบดเบ”, เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เบ—เปˆเบฒเบ™เบฅเบฒเบเบŠเบทเปˆเป€เบ‡เบทเปˆเบญเบ™เป„เบ‚เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡.

เป€เบกเบทเปˆเบญเบ‚เบฝเบ™เบเบฒเบ™เบชเบฐเปเบ”เบ‡เบญเบญเบเบขเปˆเบฒเบ‡เบกเบตเป€เบซเบ”เบœเบปเบ™เป€เบžเบทเปˆเบญเบเบฑเปˆเบ™เบ•เบญเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡, เปƒเบ™เบเปเบฅเบฐเบ™เบตเบ™เบตเป‰, เปƒเบซเป‰เบฅเบฐเบšเบธเบŠเบทเปˆเบ–เบฑเบ™เป‚เบ”เบเบšเปเปˆเบกเบตเบงเบปเบ‡เบขเบทเบกเปเบฅเบฐเบšเปเปˆเบกเบตเบเบฒเบ™เบ›เบฐเบเบฒเบ”เบŠเบทเปˆเบ•เบฒเบ•เบฐเบฅเบฒเบ‡.

เป€เบกเบทเปˆเบญเปƒเบŠเป‰เบซเบผเบฒเบเบ•เบปเบงเบชเบฐเปเบ”เบ‡เป€เบซเบ”เบœเบปเบ™เป€เบžเบทเปˆเบญเบเบฑเปˆเบ™เบ•เบญเบ‡, เปƒเบŠเป‰เบ•เบปเบงเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบ•เปเปˆเป„เบ›เบ™เบตเป‰:

  • & เบซเบผเบทเป€เบ„เบทเปˆเบญเบ‡เปเบฒเบเบˆเบธเบ” - เบกเบตเป€เบซเบ”เบœเบปเบ™ AND
  • | - เบกเบตเป€เบซเบ”เบœเบปเบ™ OR

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบงเปƒเบ™ R: dplyr

# ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ
## dplyr
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
filter(ga_nov, source == "google")
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
filter(ga_nov, source == "google" & sessions >= 10)
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
filter(ga_nov, source == "google" | sessions >= 10)

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบงเปƒเบ™ R: data.table

เบ”เบฑเปˆเบ‡เบ—เบตเปˆเบ‚เป‰เบฒเบžเบฐเป€เบˆเบปเป‰เบฒเป„เบ”เป‰เบ‚เบฝเบ™เป„เบงเป‰เบ‚เป‰เบฒเบ‡เป€เบ—เบดเบ‡, เปƒเบ™ data.table syntax เบเบฒเบ™เปเบ›เบ‡เบ‚เปเป‰เบกเบนเบ™เบ–เบทเบเบ›เบดเบ”เบขเบนเปˆเปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบผเปˆเบฝเบก.

DT[i,j,by]

เบšเปˆเบญเบ™เบ—เบตเปˆ:
i - เบšเปˆเบญเบ™เบ—เบตเปˆ, i.e. เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เป‚เบ”เบเปเบ–เบง
j - เป€เบฅเบทเบญเบ|เบญเบฑเบšเป€เบ”เบ”|เป€เบฎเบฑเบ”, i.e. เป€เบฅเบทเบญเบเบ–เบฑเบ™เปเบฅเบฐเบ›เปˆเบฝเบ™เบžเบงเบเบกเบฑเบ™
เป‚เบ”เบ - เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเบ‚เปเป‰เบกเบนเบ™

argument เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เป€เบžเบทเปˆเบญเบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบง i, เป€เบŠเบดเปˆเบ‡เบกเบตเบ•เปเบฒเปเบซเบ™เปˆเบ‡เบ—เปเบฒเบญเบดเบ”เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบฅเปˆเบฝเบก.

เบ–เบฑเบ™เปเบกเปˆเบ™เป€เบ‚เบปเป‰เบฒเป€เบ–เบดเบ‡เปƒเบ™เบเบฒเบ™เบชเบฐเปเบ”เบ‡เป€เบซเบ”เบœเบปเบ™เป‚เบ”เบเบšเปเปˆเบกเบตเป€เบ„เบทเปˆเบญเบ‡เปเบฒเบเบงเบปเบ‡เบขเบทเบก เปเบฅเบฐ เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™เบฅเบฐเบšเบธเบŠเบทเปˆเบ•เบฒเบ•เบฐเบฅเบฒเบ‡.

เบเบฒเบ™เบชเบฐเปเบ”เบ‡เบญเบญเบเบขเปˆเบฒเบ‡เบกเบตเป€เบซเบ”เบœเบปเบ™เปเบกเปˆเบ™เบเปˆเบฝเบงเบ‚เป‰เบญเบ‡เบเบฑเบšเบเบฑเบ™เปเบฅเบฐเบเบฑเบ™เปƒเบ™เบฅเบฑเบเบชเบฐเบ™เบฐเบ”เบฝเบงเบเบฑเบ™เบเบฑเบšเปƒเบ™ dplyr เป‚เบ”เบเบœเปˆเบฒเบ™ & เปเบฅเบฐ | เบœเบนเป‰เบ›เบฐเบเบญเบšเบเบฒเบ™.

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบงเปƒเบ™ R: data.table

## data.table
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
ga_nov[source == "google"]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
ga_nov[source == "google" & sessions >= 10]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
ga_nov[source == "google" | sessions >= 10]

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เบชเบฒเบเปƒเบ™ Python: pandas

เบเบฑเปˆเบ™เบ•เบญเบ‡เบ•เบฒเบกเปเบ–เบงเปƒเบ™ pandas เบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เบเบฑเบšเบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปƒเบ™ data.table, เปเบฅเบฐเบ–เบทเบเป€เบฎเบฑเบ”เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบผเปˆเบฝเบก.

เปƒเบ™โ€‹เบเปโ€‹เบฅเบฐโ€‹เบ™เบตโ€‹เบ™เบตเป‰โ€‹, เบเบฒเบ™โ€‹เป€เบ‚เบปเป‰เบฒโ€‹เป€เบ–เบดเบ‡โ€‹เบ–เบฑเบ™โ€‹เปเบกเปˆเบ™โ€‹เบ›เบฐโ€‹เบ•เบดโ€‹เบšเบฑเบ”โ€‹เบˆเปเบฒโ€‹เป€เบ›เบฑเบ™โ€‹เป‚เบ”เบโ€‹เบเบฒเบ™โ€‹เบŠเบตเป‰โ€‹เบšเบญเบโ€‹เบŠเบทเปˆโ€‹เบ‚เบญเบ‡ dataframe เป„เบ”เป‰โ€‹, เบซเบผเบฑเบ‡โ€‹เบˆเบฒเบโ€‹เบ™เบฑเป‰เบ™โ€‹เบŠเบทเปˆโ€‹เบ–เบฑเบ™โ€‹เบเบฑเบ‡โ€‹เบชเบฒโ€‹เบกเบฒเบ”โ€‹เป„เบ”เป‰โ€‹เบฎเบฑเบšโ€‹เบเบฒเบ™โ€‹เบŠเบตเป‰โ€‹เบšเบญเบโ€‹เปƒเบ™โ€‹เป€เบ„เบทเปˆเบญเบ‡โ€‹เบซเบกเบฒเบโ€‹เบงเบปเบ‡โ€‹เบขเบทเบกโ€‹เปƒเบ™โ€‹เบงเบปเบ‡โ€‹เป€เบฅเบฑเบšโ€‹เบชเบตเปˆโ€‹เบซเบผเปˆเบฝเบก (เบ•เบปเบงเบขเปˆเบฒเบ‡ df['col_name']), เบซเบผเบทเบšเปเปˆเบกเบตเบงเบปเบ‡เบขเบทเบกเบซเบผเบฑเบ‡เบˆเบฒเบเป„เบฅเบเบฐเป€เบงเบฅเบฒ (เบ•เบปเบงเบขเปˆเบฒเบ‡ df.col_name).

เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบเบฒเบ™เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡ dataframe เป‚เบ”เบเบซเบผเบฒเบเป€เบ‡เบทเปˆเบญเบ™เป„เบ‚, เปเบ•เปˆเบฅเบฐเป€เบ‡เบทเปˆเบญเบ™เป„เบ‚เบ•เป‰เบญเบ‡เบ–เบทเบเบˆเบฑเบ”เปƒเบชเปˆเปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบš. เป€เบ‡เบทเปˆเบญเบ™เป„เบ‚เบ—เบตเปˆเบกเบตเป€เบซเบ”เบœเบปเบ™เปเบกเปˆเบ™เป€เบŠเบทเปˆเบญเบกเบ•เปเปˆเบเบฑเบ™เป‚เบ”เบเบœเบนเป‰เบ›เบฐเบ•เบดเบšเบฑเบ”เบ‡เบฒเบ™ & ะธ |.

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เบชเบฒเบเปƒเบ™ Python: pandas

# ะคะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ั‚ะฐะฑะปะธั†ั‹
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
ga_nov[ ga_nov['source'] == "google" ]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธ
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### ั„ะธะปัŒั‚ั€ ะฟะพ ะดะฒัƒะผ ัƒัะปะพะฒะธัะผ ัะพะตะดะธะฝั‘ะฝะฝั‹ะผ ะปะพะณะธั‡ะตัะบะธะผ ะธะปะธ
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเบ‚เปเป‰เบกเบนเบ™

เบซเบ™เบถเปˆเบ‡เปƒเบ™เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ—เบตเปˆเบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เบซเบผเบฒเบเบ—เบตเปˆเบชเบธเบ”เปƒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เปเป‰เบกเบนเบ™เปเบกเปˆเบ™เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบก.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

syntax เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบ‡เบฒเบ™เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰เปเบกเปˆเบ™เบเบฐเปเบˆเบเบเบฐเบˆเบฒเบเป„เบ›เบ—เบปเปˆเบงเบ—เบธเบเปเบžเบฑเบเป€เบเบฑเบ”เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเบ—เบปเบšเบ—เบงเบ™.

เปƒเบ™เบเปเบฅเบฐเบ™เบตเบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเป€เบญเบปเบฒ dataframe เป€เบ›เบฑเบ™เบ•เบปเบงเบขเปˆเบฒเบ‡ เบเปเบฒเบ›เบฑเปˆเบ™ Titanic, เปเบฅเบฐเบ„เบดเบ”เป„เบฅเปˆเบˆเปเบฒเบ™เบงเบ™เปเบฅเบฐเบฅเบฒเบ„เบฒเบชเบฐเป€เบฅเปˆเบเบ‚เบญเบ‡เบ›เบตเป‰เป‚เบ”เบเบญเบตเบ‡เบ•เบฒเบกเบŠเบฑเป‰เบ™ cabin.

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R: tidyverse, dplyr

ะ’ dplyr เบŸเบฑเบ‡เบŠเบฑเบ™เปเบกเปˆเบ™เปƒเบŠเป‰เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบก group_by(), เปเบฅเบฐเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบฅเบงเบšเบฅเบงเบก summarise(). เปƒเบ™โ€‹เบ„เบงเบฒเบกโ€‹เป€เบ›เบฑเบ™โ€‹เบˆเบดเบ‡, dplyr เบกเบตเบ„เบญเบšเบ„เบปเบงเบ—เบฑเบ‡เบซเบกเบปเบ”เบ‚เบญเบ‡เบซเบ™เป‰เบฒเบ—เบตเปˆ summarise_*(), เปเบ•เปˆเบˆเบธเบ”เบ›เบฐเบชเบปเบ‡เบ‚เบญเบ‡เบšเบปเบ”เบ„เบงเบฒเบกเบ™เบตเป‰เปเบกเปˆเบ™เป€เบžเบทเปˆเบญเบ›เบฝเบšเบ—เบฝเบš syntax เบžเบทเป‰เบ™เบ–เบฒเบ™, เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบšเปเปˆเป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบ›เปˆเบฒเบ”เบฑเปˆเบ‡เบเปˆเบฒเบง.

เบซเบ™เป‰เบฒโ€‹เบ—เบตเปˆโ€‹เบเบฒเบ™โ€‹เบฅเบงเบกโ€‹เบ•เบปเบงโ€‹เบžเบทเป‰เบ™โ€‹เบ–เบฒเบ™โ€‹:

  • sum() - เบชเบฑเบ‡โ€‹เบฅเบงเบกโ€‹
  • min() / max() - เบ„เปˆเบฒโ€‹เบ•เปเบฒโ€‹เปˆโ€‹เบชเบธเบ”โ€‹เบ—เบตเปˆโ€‹เปเบฅเบฐโ€‹เบชเบนเบ‡โ€‹เบชเบธเบ”โ€‹
  • mean() - เบชเบฐเป€เบฅเปˆเบ
  • median() โ€” เบ›เบฒเบ™เบเบฒเบ‡
  • length() - เบ›เบฐเบฅเบดเบกเบฒเบ™

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเปƒเบ™ R: dplyr

## dplyr
### ะณั€ัƒะฟะฟะธั€ะพะฒะบะฐ ะธ ะฐะณั€ะตะณะฐั†ะธั ัั‚ั€ะพะบ
group_by(titanic, Pclass) %>%
  summarise(passangers = length(PassengerId),
            avg_price  = mean(Fare))

เป€เบžเบทเปˆเบญเป€เบฎเบฑเบ”เบงเบฝเบ group_by() เบžเบงเบเป€เบฎเบปเบฒเบœเปˆเบฒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป€เบ›เบฑเบ™เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เบ—เปเบฒเบญเบดเบ” เบเปเบฒเบ›เบฑเปˆเบ™ Titanic, เปเบฅเบฐเบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เบŠเบตเป‰เปƒเบซเป‰เป€เบซเบฑเบ™เบžเบฒเบเบชเบฐเบซเบ™เบฒเบก เบŠเบฑเป‰เบ™เบฎเบฝเบ™, เป‚เบ”เบเบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบˆเบฑเบ”เบเบธเปˆเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ‚เบญเบ‡เบžเบงเบเป€เบฎเบปเบฒ. เบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ‚เบญเบ‡เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ™เบตเป‰เป‚เบ”เบเปƒเบŠเป‰เบ•เบปเบงเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™ %>% เบœเปˆเบฒเบ™เป€เบ›เบฑเบ™เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เบ—เปเบฒเบญเบดเบ”เบเบฑเบšเบŸเบฑเบ‡เบŠเบฑเบ™ summarise(), เปเบฅเบฐเป€เบžเบตเปˆเบกเบญเบตเบ 2 เบŠเปˆเบญเบ‡เบ‚เปเป‰เบกเบนเบ™: เบœเบนเป‰เป‚เบ”เบเบชเบฒเบ™ ะธ เบฅเบฒเบ„เบฒเบชเบฐเป€เบฅเปˆเบ. เปƒเบ™เบ„เบฑเป‰เบ‡เบ—เปเบฒเบญเบดเบ”, เบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบซเบ™เป‰เบฒเบ—เบตเปˆ length() เบ„เบดเบ”เป„เบฅเปˆเบˆเปเบฒเบ™เบงเบ™เบ•เบปเป‹เบง, เปเบฅเบฐเปƒเบ™เบ„เบฑเป‰เบ‡เบ—เบตเบชเบญเบ‡เป‚เบ”เบเปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™ mean() เป„เบ”เป‰เบฎเบฑเบšเบฅเบฒเบ„เบฒเบ›เบตเป‰เป‚เบ”เบเบชเบฐเป€เบฅเปˆเบ.

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R: data.table

ะ’ data.table เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เปเบกเปˆเบ™เปƒเบŠเป‰เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบฅเบงเบšเบฅเบงเบก j เป€เบŠเบดเปˆเบ‡เบกเบตเบ•เบณเปเปœเปˆเบ‡เบ—เบตเบชเบญเบ‡เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบผเปˆเบฝเบก, เปเบฅเบฐเบชเบณเบฅเบฑเบšเบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบก by เบซเบผเบท keyby, เป€เบŠเบดเปˆเบ‡เบกเบตเบ•เปเบฒเปเบซเบ™เปˆเบ‡เบ—เบตเบชเบฒเบก.

เบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบ‚เบญเบ‡เบซเบ™เป‰เบฒเบ—เบตเปˆเบฅเบงเบšเบฅเบงเบกเปƒเบ™เบเปเบฅเบฐเบ™เบตเบ™เบตเป‰เปเบกเปˆเบ™เบ„เบทเบเบฑเบ™เบเบฑเบšเบ—เบตเปˆเบญเบฐเบ—เบดเบšเบฒเบเป„เบงเป‰เปƒเบ™ dplyr, เป€เบ™เบทเปˆเบญเบ‡เบˆเบฒเบเบงเปˆเบฒ เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰เปเบกเปˆเบ™เบซเบ™เป‰เบฒเบ—เบตเปˆเบˆเบฒเบ syntax R เบžเบทเป‰เบ™เบ–เบฒเบ™.

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเปƒเบ™ R: data.table

## data.table
### ั„ะธะปัŒั‚ั€ะฐั†ะธั ัั‚ั€ะพะบ ะฟะพ ะพะดะฝะพะผัƒ ัƒัะปะพะฒะธัŽ
titanic[, .(passangers = length(PassengerId),
            avg_price  = mean(Fare)),
        by = Pclass]

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ Python: pandas

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเบขเบนเปˆเปƒเบ™ pandas เบ„เป‰เบฒเบโ€‹เบ„เบทโ€‹เบเบฑเบš dplyr, เปเบ•เปˆเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเปเบกเปˆเบ™เบšเปเปˆเบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เบเบฑเบš dplyr เบšเปเปˆเบขเบนเปˆ data.table.

เป€เบžเบทเปˆเบญเบˆเบฑเบ”เบเบธเปˆเบก, เปƒเบŠเป‰เบงเบดเบ—เบตเบเบฒเบ™ groupby(), เบ—เบตเปˆเบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป„เบ”เป‰เบœเปˆเบฒเบ™เบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบ‚เบญเบ‡เบ„เปเบฅเปเบฒเป‚เบ”เบเบ—เบตเปˆ dataframe เบˆเบฐเบ–เบทเบเบˆเบฑเบ”เบเบธเปˆเบก.

เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบ™เปเบฒเปƒเบŠเป‰เบงเบดเบ—เบตเบเบฒเบ™ agg()เป€เบŠเบดเปˆเบ‡เบเบญเบกเบฎเบฑเบšเบงเบฑเบ”เบˆเบฐเบ™เบฒเบ™เบธเบเบปเบก. เบ›เบธเปˆเบกเบžเบปเบ”เบˆเบฐเบ™เบฒเบ™เบธเบเบปเบกเปเบกเปˆเบ™เบ–เบฑเบ™เบ—เบตเปˆเป€เบˆเบปเป‰เบฒเบˆเบฐเปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™เบเบฒเบ™เบฅเบงเบšเบฅเบงเบก, เปเบฅเบฐเบ„เปˆเบฒเบ•เปˆเบฒเบ‡เป†เปเบกเปˆเบ™เบŠเบทเปˆเบ‚เบญเบ‡เบŸเบฑเบ‡เบŠเบฑเบ™เบเบฒเบ™เบฅเบงเบšเบฅเบงเบก.

เบŸเบฑเบ‡เบŠเบฑเบ™เบเบฒเบ™เบฅเบงเบšเบฅเบงเบก:

  • sum() - เบชเบฑเบ‡โ€‹เบฅเบงเบกโ€‹
  • min() / max() - เบ„เปˆเบฒโ€‹เบ•เปเบฒโ€‹เปˆโ€‹เบชเบธเบ”โ€‹เบ—เบตเปˆโ€‹เปเบฅเบฐโ€‹เบชเบนเบ‡โ€‹เบชเบธเบ”โ€‹
  • mean() - เบชเบฐเป€เบฅเปˆเบ
  • median() โ€” เบ›เบฒเบ™เบเบฒเบ‡
  • count() - เบ›เบฐเบฅเบดเบกเบฒเบ™

เบเบฒเบ™เบ—เปเบฒเบ‡เบฒเบ™เบ‚เบญเบ‡ reset_index() เปƒเบ™เบ•เบปเบงเบขเปˆเบฒเบ‡เบ‚เป‰เบฒเบ‡เบฅเบธเปˆเบกเบ™เบตเป‰เบกเบฑเบ™เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เป€เบžเบทเปˆเบญเบ›เบฑเบšเบ”เบฑเบ”เบชเบฐเบ™เบตเบ—เบตเปˆเบ•เบดเบ”เบเบฑเบ™เปƒเบซเบกเปˆ pandas เป€เบ›เบฑเบ™เบ„เปˆเบฒเป€เบฅเบตเปˆเบกเบ•เบปเป‰เบ™เบซเบผเบฑเบ‡เบˆเบฒเบเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเบ‚เปเป‰เบกเบนเบ™.

เป‚เบŠเบเบ”เบต เบญเบฐเบ™เบธเบเบฒเบ”เปƒเบซเป‰เบ—เปˆเบฒเบ™เบเป‰เบฒเบเป„เบ›เปเบ–เบงเบ•เปเปˆเป„เบ›.

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบกเปƒเบ™ Python: pandas

# ะณั€ัƒะฟะฟะธั€ะพะฒะบะฐ ะธ ะฐะณั€ะตะณะฐั†ะธั ะดะฐะฝะฝั‹ั…
titanic.groupby(["Pclass"]).
    agg({'PassengerId': 'count', 'Fare': 'mean'}).
        reset_index()

เบเบฒเบ™โ€‹เป€เบŠเบทเปˆเบญเบกโ€‹เบ•เปเปˆโ€‹เบ•เบฑเป‰เบ‡โ€‹เบ‚เบญเบ‡โ€‹เบ•เบฒโ€‹เบ•เบฐโ€‹เบฅเบฒเบ‡โ€‹

เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ—เบตเปˆเบ—เปˆเบฒเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบชเบญเบ‡เบซเบผเบทเบซเบผเบฒเบเบเบงเปˆเบฒเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ‚เบญเบ‡เป‚เบ„เบ‡เบชเป‰เบฒเบ‡เบ”เบฝเบงเบเบฑเบ™. เบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเป‚เบซเบฅเบ”เบ›เบฐเบเบญเบšเบกเบตเบ•เบฒเบ•เบฐเบฅเบฒเบ‡ ga_nov ะธ ga_dec. เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰เปเบกเปˆเบ™เบ„เบทเบเบฑเบ™เปƒเบ™เป‚เบ„เบ‡เบชเป‰เบฒเบ‡, i.e. เบกเบตเบ–เบฑเบ™เบ”เบฝเบงเบเบฑเบ™, เปเบฅเบฐเบ›เบฐเป€เบžเบ”เบ‚เปเป‰เบกเบนเบ™เปƒเบ™เบ–เบฑเบ™เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เบ™เบตเป‰เปเบกเปˆเบ™เบเบฒเบ™เบญเบฑเบšเป‚เบซเบฅเบ”เบˆเบฒเบ Google Analytics เบชเปเบฒเบฅเบฑเบšเป€เบ”เบทเบญเบ™เบžเบฐเบˆเบดเบเปเบฅเบฐเป€เบ”เบทเบญเบ™เบ—เบฑเบ™เบงเบฒ, เปƒเบ™เบžเบฒเบเบ™เบตเป‰เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเบฅเบงเบกเบ‚เปเป‰เบกเบนเบ™เบ™เบตเป‰เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ”เบฝเบง.

เบ•เบฑเป‰เบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเปƒเบ™ R: tidyverse, dplyr

ะ’ dplyr เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบชเบปเบกเบ—เบปเบš 2 เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบซเบ™เบถเปˆเบ‡เป‚เบ”เบเปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™ bind_rows(), เบœเปˆเบฒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป€เบ›เบฑเบ™เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เบ‚เบญเบ‡เบ•เบปเบ™.

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบงเปƒเบ™ R: dplyr

# ะ’ะตั€ั‚ะธะบะฐะปัŒะฝะพะต ะพะฑัŠะตะดะธะฝะตะฝะธะต ั‚ะฐะฑะปะธั†
## dplyr
bind_rows(ga_nov, ga_dec)

เบเบฒเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปƒเบ™เปเบ™เบงเบ•เบฑเป‰เบ‡เปƒเบ™ R: data.table

เบกเบฑเบ™เบเบฑเบ‡เบšเปเปˆเบกเบตเบซเบเบฑเบ‡เบชเบฑเบšเบชเบปเบ™, เปƒเบซเป‰เปƒเบŠเป‰ rbind().

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบงเปƒเบ™ R: data.table

## data.table
rbind(ga_nov, ga_dec)

เบเบฒเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปƒเบ™เปเบ™เบงเบ•เบฑเป‰เบ‡เปƒเบ™ Python: pandas

ะ’ pandas เบซเบ™เป‰เบฒเบ—เบตเปˆเบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เป€เบžเบทเปˆเบญเป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡ concat(), เบ—เบตเปˆเบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป„เบ”เป‰เบœเปˆเบฒเบ™เบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบ‚เบญเบ‡เบเบญเบšเป€เบžเบทเปˆเบญเบชเบปเบกเบ—เบปเบšเปƒเบซเป‰เป€เบ‚เบปเบฒเป€เบˆเบปเป‰เบฒ.

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เบชเบฒเบเปƒเบ™ Python: pandas

# ะฒะตั€ั‚ะธะบะฐะปัŒะฝะพะต ะพะฑัŠะตะดะธะฝะตะฝะธะต ั‚ะฐะฑะปะธั†
pd.concat([ga_nov, ga_dec])

เบเบฒเบ™โ€‹เป€เบ‚เบปเป‰เบฒโ€‹เบฎเปˆเบงเบกโ€‹เบ•เบฒเบกโ€‹เบฅเบงเบ‡โ€‹เบ™เบญเบ™โ€‹เบ‚เบญเบ‡โ€‹เบ•เบฒโ€‹เบ•เบฐโ€‹เบฅเบฒเบ‡โ€‹

เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เบ—เบตเปˆเบ–เบฑเบ™เบˆเบฒเบเบ—เบตเบชเบญเบ‡เบ–เบทเบเป€เบžเบตเปˆเบกเปƒเบชเปˆเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เปเบฒเบญเบดเบ”เป‚เบ”เบเบ„เบต. เบกเบฑเบ™เบกเบฑเบเบˆเบฐเบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เปƒเบ™เป€เบงเบฅเบฒเบ—เบตเปˆเป€เบชเบตเบกเบชเป‰เบฒเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ„เบงเบฒเบกเป€เบ›เบฑเบ™เบˆเบดเบ‡ (เบ•เบปเบงเบขเปˆเบฒเบ‡, เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบตเปˆเบกเบตเบ‚เปเป‰เบกเบนเบ™เบเบฒเบ™เบ‚เบฒเบ) เบ—เบตเปˆเบกเบตเบ‚เปเป‰เบกเบนเบ™เบญเป‰เบฒเบ‡เบญเบตเบ‡เบšเบฒเบ‡เบขเปˆเบฒเบ‡ (เบ•เบปเบงเบขเปˆเบฒเบ‡, เบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบ‚เบญเบ‡เบœเบฐเบฅเบดเบ”เบ•เบฐเบžเบฑเบ™).

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เบกเบตเบซเบผเบฒเบเบ›เบฐเป€เบžเบ”เบ‚เบญเบ‡เบเบฒเบ™เบฎเปˆเบงเบก:

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบตเปˆเป‚เบซเบฅเบ”เบเปˆเบญเบ™เบซเบ™เป‰เบฒเบ™เบตเป‰ เบเปเบฒเบ›เบฑเปˆเบ™ Titanic เบžเบงเบเป€เบฎเบปเบฒเบกเบตเบ–เบฑเบ™ เป€เบžเบ”, เป€เบŠเบดเปˆเบ‡เบเบปเบ‡เบเบฑเบšเบฅเบฐเบซเบฑเบ”เป€เบžเบ”เบ‚เบญเบ‡เบœเบนเป‰เป‚เบ”เบเบชเบฒเบ™:

1 - เป€เบžเบ”เบเบดเบ‡
2 - เบŠเบฒเบ

เบ™เบญเบเบˆเบฒเบเบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบชเป‰เบฒเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡ - เบ›เบทเป‰เบกเบญเป‰เบฒเบ‡เบญเบตเบ‡ เป€เบžเบ”. เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เบ™เปเบฒเบชเบฐเป€เบซเบ™เบตเบ‚เปเป‰เบกเบนเบ™เบ—เบตเปˆเบชเบฐเบ”เบงเบเบเบงเปˆเบฒเบเปˆเบฝเบงเบเบฑเบšเป€เบžเบ”เบ‚เบญเบ‡เบœเบนเป‰เป‚เบ”เบเบชเบฒเบ™, เบžเบงเบเป€เบฎเบปเบฒเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป€เบžเบตเปˆเบกเบŠเบทเปˆเบ‚เบญเบ‡เป€เบžเบ”เบˆเบฒเบเป„เบ”เป€เบฅเบเบฐเบ—เปเบฅเบต. เป€เบžเบ” เบเบฑเบšเบ•เบฒเบ•เบฐเบฅเบฒเบ‡ เบเปเบฒเบ›เบฑเปˆเบ™ Titanic.

เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบ™เบงเบ™เบญเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเปƒเบ™ R: tidyverse, dplyr

ะ’ dplyr เบกเบตเบ„เบญเบšเบ„เบปเบงเบ—เบฑเบ‡เบซเบกเบปเบ”เบ‚เบญเบ‡เบซเบ™เป‰เบฒเบ—เบตเปˆเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบกเปเบ™เบงเบ™เบญเบ™:

  • inner_join()
  • left_join()
  • right_join()
  • full_join()
  • semi_join()
  • nest_join()
  • anti_join()

เบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบ—เบปเปˆเบงเป„เบ›เบ—เบตเปˆเบชเบธเบ”เปƒเบ™เบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบ‚เบญเบ‡เบ‚เป‰เบญเบเปเบกเปˆเบ™ left_join().

เปƒเบ™เบ–เบฒเบ™เบฐเป€เบ›เบฑเบ™เบชเบญเบ‡เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เบ—เปเบฒเบญเบดเบ”, เบซเบ™เป‰เบฒเบ—เบตเปˆเบฅเบฐเบšเบธเป„เบงเป‰เบ‚เป‰เบฒเบ‡เป€เบ—เบดเบ‡เปƒเบŠเป‰เป€เบงเบฅเบฒเบชเบญเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบก, เปเบฅเบฐเป€เบ›เบฑเบ™เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡เบ—เบตเบชเบฒเบก. by เบ—เปˆเบฒเบ™เบ•เป‰เบญเบ‡เบฅเบฐเบšเบธเบ–เบฑเบ™เป€เบžเบทเปˆเบญเป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบก.

เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบ™เบงเบ™เบญเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเปƒเบ™ R: dplyr

# ะพะฑัŠะตะดะธะฝัะตะผ ั‚ะฐะฑะปะธั†ั‹
left_join(titanic, gender,
          by = c("Sex" = "id"))

เบเบฒเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบกเบฅเบงเบ‡เบ™เบญเบ™เบ‚เบญเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปƒเบ™ R: data.table

ะ’ data.table เบ—เปˆเบฒเบ™เบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป‚เบ”เบเบ„เบตเป‚เบ”เบเปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™ merge().

Arguments เป€เบžเบทเปˆเบญ merge() เบŸเบฑเบ‡เบŠเบฑเบ™เปƒเบ™ data.table

  • x, y โ€” เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบก
  • เป‚เบ”เบ โ€” โ€‹โ€‹เบ–เบฑเบ™เบ—เบตเปˆเป€เบ›เบฑเบ™เบเบธเบ™เปเบˆเบ—เบตเปˆเบˆเบฐเป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ–เป‰เบฒเบกเบฑเบ™เบกเบตเบŠเบทเปˆเบ”เบฝเบงเบเบฑเบ™เบขเบนเปˆเปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบฑเบ‡เบชเบญเบ‡
  • by.x, by.y โ€” เบŠเบทเปˆเบ–เบฑเบ™เบ—เบตเปˆเบˆเบฐเบ–เบทเบเบฅเบงเบกเป€เบ‚เบปเป‰เบฒเบเบฑเบ™, เบ–เป‰เบฒเบžเบงเบเบกเบฑเบ™เบกเบตเบŠเบทเปˆเบ•เปˆเบฒเบ‡เบเบฑเบ™เปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡
  • all, all.x, all.y โ€” เบ›เบฐเป€เบžเบ”เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบก, เบ—เบฑเบ‡เปเบปเบ”เบˆเบฐเบชเบปเปˆเบ‡เบ„เบทเบ™เปเบ–เบงเบ—เบฑเบ‡เปเบปเบ”เบˆเบฒเบเบ—เบฑเบ‡เบชเบญเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡, all.x เบเบปเบ‡เบเบฑเบšเบ„เบณเบชเบฑเปˆเบ‡ LEFT JOIN (เบˆเบฐเบญเบญเบเบˆเบฒเบเปเบ–เบงเบ—เบฑเบ‡เปเบปเบ”เบ‚เบญเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบณเบญเบดเบ”), all.y โ€” เบเบปเบ‡เบเบฑเบš เบเบฒเบ™โ€‹เบ”เปเบฒโ€‹เป€เบ™เบตเบ™โ€‹เบ‡เบฒเบ™โ€‹เบเบฒเบ™โ€‹เป€เบ‚เบปเป‰เบฒโ€‹เบฎเปˆเบงเบกโ€‹เบ—เบฒเบ‡โ€‹เบ‚เบงเบฒ (เบˆเบฐโ€‹เบญเบญเบโ€‹เบˆเบฒเบโ€‹เปเบ–เบงโ€‹เบ—เบฑเบ‡โ€‹เบซเบกเบปเบ”โ€‹เบ‚เบญเบ‡โ€‹เบ•เบฒโ€‹เบ•เบฐโ€‹เบฅเบฒเบ‡โ€‹เบ—เบตเปˆโ€‹เบชเบญเบ‡โ€‹)โ€‹.

เบเบฒเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบกเบฅเบงเบ‡เบ™เบญเบ™เบ‚เบญเบ‡เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปƒเบ™ R: data.table

# ะพะฑัŠะตะดะธะฝัะตะผ ั‚ะฐะฑะปะธั†ั‹
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)

เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบ™เบงเบ™เบญเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเปƒเบ™ Python: pandas

เป€เบŠเบฑเปˆเบ™เบ”เบฝเบงเบเบฑเบ™เบเบฑเบšเปƒเบ™ data.table, เปƒเบ™ pandas เบซเบ™เป‰เบฒเบ—เบตเปˆเบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เป€เบžเบทเปˆเบญเป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡ merge().

Arguments เบ‚เบญเบ‡ merge() function เปƒเบ™ pandas

  • เบงเบดเบ—เบตเบเบฒเบ™ - เบ›เบฐเป€เบžเบ”เบเบฒเบ™เป€เบŠเบทเปˆเบญเบกเบ•เปเปˆ: เบŠเป‰เบฒเบ, เบ‚เบงเบฒ, เบ™เบญเบ, เบžเบฒเบเปƒเบ™
  • on โ€” เบ–เบฑเบ™เบ—เบตเปˆเป€เบ›เบฑเบ™เบเบฐเปเบˆเบ–เป‰เบฒเบกเบฑเบ™เบกเบตเบŠเบทเปˆเบ”เบฝเบงเบเบฑเบ™เบขเบนเปˆเปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ—เบฑเบ‡เบชเบญเบ‡
  • left_on, right_on โ€” เบŠเบทเปˆเบ‚เบญเบ‡เบ–เบฑเบ™เบซเบผเบฑเบ, เบ–เป‰เบฒเบžเบงเบเป€เบ‚เบปเบฒเบกเบตเบŠเบทเปˆเบ—เบตเปˆเปเบ•เบเบ•เปˆเบฒเบ‡เบเบฑเบ™เปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡

เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบ™เบงเบ™เบญเบ™เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเปƒเบ™ Python: pandas

# ะพะฑัŠะตะดะธะฝัะตะผ ะฟะพ ะบะปัŽั‡ัƒ
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")

เบซเบ™เป‰เบฒเบ—เบตเปˆเบžเบทเป‰เบ™เบ–เบฒเบ™เบ‚เบญเบ‡เบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปเบฅเบฐเบ–เบฑเบ™เบ—เบตเปˆเบ„เบดเบ”เป„เบฅเปˆ

เบŸเบฑเบ‡เบŠเบฑเบ™เบ‚เบญเบ‡เบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปเบกเปˆเบ™เบ„เป‰เบฒเบเบ„เบทเบเบฑเบ™เปƒเบ™เบ„เบงเบฒเบกเบซเบกเบฒเบเบ‚เบญเบ‡เบซเบ™เป‰เบฒเบ—เบตเปˆเบฅเบงเบšเบฅเบงเบก, เปเบฅเบฐเบเบฑเบ‡เบ–เบทเบเบ™เปเบฒเปƒเบŠเป‰เป€เบฅเบทเป‰เบญเบเป†เปƒเบ™เบเบฒเบ™เบงเบดเป€เบ„เบฒเบฐเบ‚เปเป‰เบกเบนเบ™. เปเบ•เปˆเบšเปเปˆเป€เบซเบกเบทเบญเบ™เบเบฑเบšเบซเบ™เป‰เบฒเบ—เบตเปˆเบฅเบงเบšเบฅเบงเบก, เบซเบ™เป‰เบฒเบ—เบตเปˆเบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเบšเปเปˆเบ›เปˆเบฝเบ™เปเบ›เบ‡เบˆเปเบฒเบ™เบงเบ™เปเบ–เบงเบ‚เบญเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เบ‚เบฒเบญเบญเบ.

เบžเบฒเบชเบฒเปƒเบ”เบ—เบตเปˆเบˆเบฐเป€เบฅเบทเบญเบเบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™ - R เบซเบผเบท Python? เบ—เบฑเบ‡เบชเบญเบ‡! เบเบฒเบ™เป€เบ„เบทเปˆเบญเบ™เบเป‰เบฒเบเบˆเบฒเบ pandas เบเบฑเบš tidyverse เปเบฅเบฐ data.table เปเบฅเบฐเบเบฑเบšเบ„เบทเบ™เป„เบ›เบšเปˆเบญเบ™

เป‚เบ”เบเบžเบทเป‰เบ™เบ–เบฒเบ™เปเบฅเป‰เบง, เบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบซเบ™เป‰เบฒเบ—เบตเปˆเบ›เปˆเบญเบ‡เบขเป‰เบฝเบก, เบžเบงเบเป€เบฎเบปเบฒเปเบšเปˆเบ‡เบ›เบฑเบ™เบเบญเบšเบ‚เปเป‰เบกเบนเบ™เบ‚เบฒเป€เบ‚เบปเป‰เบฒเบญเบญเบเป€เบ›เบฑเบ™เบžเบฒเบเบชเปˆเบงเบ™เบ•เบฒเบกเป€เบ‡เบทเปˆเบญเบ™เป„เบ‚เบšเบฒเบ‡เบขเปˆเบฒเบ‡, i.e. เป‚เบ”เบเบ„เปˆเบฒเบ‚เบญเบ‡เบŠเปˆเบญเบ‡เบ‚เปเป‰เบกเบนเบ™, เบซเบผเบทเบซเบผเบฒเบเบŠเปˆเบญเบ‡เบ‚เปเป‰เบกเบนเบ™. เปเบฅเบฐเบžเบงเบเป€เบฎเบปเบฒเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบ„เบดเบ”เป„เบฅเปˆเป€เบฅเบเบขเบนเปˆเปƒเบ™เปเบ•เปˆเบฅเบฐเบ›เปˆเบญเบ‡เบขเป‰เบฝเบก. เบœเบปเบ™เป„เบ”เป‰เบฎเบฑเบšเบ‚เบญเบ‡เบเบฒเบ™เบ”เปเบฒเป€เบ™เบตเบ™เบ‡เบฒเบ™เป€เบซเบผเบปเปˆเบฒเบ™เบตเป‰เบˆเบฐเบ–เบทเบเบชเบปเปˆเบ‡เบ„เบทเบ™เปƒเบ™เปเบ•เปˆเบฅเบฐเบชเบฒเบ, i.e. เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™เบ›เปˆเบฝเบ™เบˆเปเบฒเบ™เบงเบ™เปเบ–เบงเบ—เบฑเบ‡เบซเบกเบปเบ”เปƒเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡.

เบ•เบปเบงเบขเปˆเบฒเบ‡, เปƒเบซเป‰เป€เบฎเบปเบฒเป€เบญเบปเบฒเบ•เบฒเบ•เบฐเบฅเบฒเบ‡ เบเปเบฒเบ›เบฑเปˆเบ™ Titanic. เบžเบงเบโ€‹เป€เบฎเบปเบฒโ€‹เบชเบฒโ€‹เบกเบฒเบ”โ€‹เบ„เบดเบ”โ€‹เป„เบฅเปˆโ€‹เบญเบฑเบ”โ€‹เบ•เบฒโ€‹เบชเปˆเบงเบ™โ€‹เบ‚เบญเบ‡โ€‹เบ„เปˆเบฒโ€‹เปƒเบŠเป‰โ€‹เบˆเปˆเบฒเบโ€‹เบ‚เบญเบ‡โ€‹เบ›เบตเป‰โ€‹เปเบ•เปˆโ€‹เบฅเบฐโ€‹เบ„เบปเบ™โ€‹เบขเบนเปˆโ€‹เปƒเบ™โ€‹เบซเป‰เบญเบ‡โ€‹เบเบฒเบ™โ€‹เบ‚เบญเบ‡โ€‹เบ•เบปเบ™โ€‹.

เป€เบžเบทเปˆเบญเป€เบฎเบฑเบ”เบชเบดเปˆเบ‡เบ™เบตเป‰, เบžเบงเบเป€เบฎเบปเบฒเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป„เบ”เป‰เบฎเบฑเบšเปƒเบ™เปเบ•เปˆเบฅเบฐเบชเบฒเบเบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบ—เบฑเบ‡เบซเบกเบปเบ”เบ‚เบญเบ‡เบ›เบตเป‰เบชเปเบฒเบฅเบฑเบšเบซเป‰เบญเบ‡เป‚เบ”เบเบชเบฒเบ™เปƒเบ™เบ›เบฐเบˆเบธเบšเบฑเบ™เบ—เบตเปˆเบ›เบตเป‰เบขเบนเปˆเปƒเบ™เบชเบฒเบเบ™เบตเป‰เปเบกเปˆเบ™, เบซเบผเบฑเบ‡เบˆเบฒเบเบ™เบฑเป‰เบ™เปเบšเปˆเบ‡เบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบ‚เบญเบ‡เปเบ•เปˆเบฅเบฐเบ›เบตเป‰เป‚เบ”เบเบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบ—เบฑเบ‡เบซเบกเบปเบ”เบ‚เบญเบ‡เบ›เบตเป‰เบ‚เบญเบ‡เบซเป‰เบญเบ‡เป‚เบ”เบเบชเบฒเบ™เบ”เบฝเบงเบเบฑเบ™. .

เบซเบ™เป‰เบฒเบ—เบตเปˆเบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปƒเบ™ R: tidyverse, dplyr

เป€เบžเบทเปˆเบญเป€เบžเบตเปˆเบกเบ–เบฑเบ™เปƒเปเปˆ, เป‚เบ”เบเบšเปเปˆเบ•เป‰เบญเบ‡เปƒเบŠเป‰เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบ–เบง, in dplyr เป€เบฎเบฑเบ”เบซเบ™เป‰เบฒเบ—เบตเปˆ mutate().

เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เปเบเป‰เป„เบ‚เบšเบฑเบ™เบซเบฒเบ—เบตเปˆเป„เบ”เป‰เบญเบฐเบ—เบดเบšเบฒเบเบ‚เป‰เบฒเบ‡เป€เบ—เบดเบ‡เป‚เบ”เบเบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเบ‚เปเป‰เบกเบนเบ™เบ•เบฒเบกเบŠเปˆเบญเบ‡เบ‚เปเป‰เบกเบนเบ™ เบŠเบฑเป‰เบ™เบฎเบฝเบ™ เปเบฅเบฐเบชเบฐเบซเบผเบธเบšเบžเบฒเบเบชเบฐเบซเบ™เบฒเบกเปƒเบ™เบ–เบฑเบ™เปƒเบซเบกเปˆ เป€เบฎเบฑเบ”เปเบ™เบงเปƒเบ”. เบ•เปเปˆเป„เบ›, เปเบเบเบเบธเปˆเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เปเบฅเบฐเปเบšเปˆเบ‡เบ„เปˆเบฒเบžเบฒเบเบชเบฐเบซเบ™เบฒเบก เป€เบฎเบฑเบ”เปเบ™เบงเปƒเบ” เบเบฑเบšเบชเบดเปˆเบ‡เบ—เบตเปˆเป€เบเบตเบ”เบ‚เบถเป‰เบ™เปƒเบ™เบ‚เบฑเป‰เบ™เบ•เบญเบ™เบ—เบตเปˆเบœเปˆเบฒเบ™เบกเบฒ.

เบซเบ™เป‰เบฒเบ—เบตเปˆเบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปƒเบ™ R: dplyr

group_by(titanic, Pclass) %>%
  mutate(Pclass_cost = sum(Fare)) %>%
  ungroup() %>%
  mutate(ticket_fare_rate = Fare / Pclass_cost)

เบซเบ™เป‰เบฒเบ—เบตเปˆ Window เปƒเบ™ R: data.table

เบชเบนเบ”เบเบฒเบ™เปเบเป‰เป„เบ‚เบšเบฑเบ™เบซเบฒเบเบฑเบ‡เบ„เบปเบ‡เบ„เบทเบเบฑเบ™เบเบฑเบšเปƒเบ™ dplyr, เบžเบงเบเป€เบฎเบปเบฒเบˆเปเบฒเป€เบ›เบฑเบ™เบ•เป‰เบญเบ‡เป„เบ”เป‰เปเบเบเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เป€เบ‚เบปเป‰เบฒเป„เบ›เปƒเบ™เบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเป‚เบ”เบเบžเบฒเบเบชเบฐเบซเบ™เบฒเบก เบŠเบฑเป‰เบ™เบฎเบฝเบ™. เบœเบปเบ™เบœเบฐเบฅเบดเบ”เปƒเบ™เบ–เบฑเบ™เปƒเบซเบกเปˆเบˆเปเบฒเบ™เบงเบ™เบชเปเบฒเบฅเบฑเบšเบเบธเปˆเบกเบ—เบตเปˆเบชเบญเบ”เบ„เป‰เบญเบ‡เบเบฑเบ™เบเบฑเบšเปเบ•เปˆเบฅเบฐเปเบ–เบง, เปเบฅเบฐเป€เบžเบตเปˆเบกเบ„เปเบฅเปเบฒเบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเบ„เบดเบ”เป„เบฅเปˆเบชเปˆเบงเบ™เปเบšเปˆเบ‡เบ‚เบญเบ‡เบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบ‚เบญเบ‡เปเบ•เปˆเบฅเบฐเบ›เบตเป‰เปƒเบ™เบเบธเปˆเบกเบ‚เบญเบ‡เบ•เบปเบ™.

เป€เบžเบทเปˆเบญเป€เบžเบตเปˆเบกเบ–เบฑเบ™เปƒเปเปˆเปƒเบชเปˆ data.table เบ›เบฐเบˆเบธเบšเบฑเบ™เบœเบนเป‰เบ›เบฐเบเบญเบšเบเบฒเบ™ :=. เบ‚เป‰เบฒเบ‡เบฅเบธเปˆเบกเบ™เบตเป‰เปเบกเปˆเบ™เบ•เบปเบงเบขเปˆเบฒเบ‡เบ‚เบญเบ‡เบเบฒเบ™เปเบเป‰เป„เบ‚เบšเบฑเบ™เบซเบฒเป‚เบ”เบเปƒเบŠเป‰เบŠเบธเบ” data.table

เบซเบ™เป‰เบฒเบ—เบตเปˆ Window เปƒเบ™ R: data.table

titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost), 
        by = Pclass]

เบŸเบฑเบ‡เบŠเบฑเบ™เบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปƒเบ™ Python: pandas

เบงเบดเบ—เบตเปœเบถเปˆเบ‡เป€เบžเบทเปˆเบญเป€เบžเบตเปˆเบกเบ–เบฑเบ™เปƒเปเปˆเปƒเบชเปˆ pandas - เบเบฒเบ™โ€‹เบ™เปเบฒโ€‹เปƒเบŠเป‰โ€‹เบซเบ™เป‰เบฒโ€‹เบ—เบตเปˆโ€‹ assign(). เป€เบžเบทเปˆเบญเบชเบฐเบซเบผเบธเบšเบ„เปˆเบฒเปƒเบŠเป‰เบˆเปˆเบฒเบเบ‚เบญเบ‡เบ›เบตเป‰เป‚เบ”เบเบซเป‰เบญเบ‡เบฎเบฝเบ™ cabin, เป‚เบ”เบเบšเปเปˆเบกเบตเบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบ–เบง, เบžเบงเบเป€เบฎเบปเบฒเบˆเบฐเปƒเบŠเป‰เบŸเบฑเบ‡เบŠเบฑเบ™ transform().

เบ‚เป‰เบฒเบ‡เบฅเบธเปˆเบกเบ™เบตเป‰เปเบกเปˆเบ™เบ•เบปเบงเบขเปˆเบฒเบ‡เบ‚เบญเบ‡เบเบฒเบ™เปเบเป‰เป„เบ‚เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเป€เบžเบตเปˆเบกเปƒเบชเปˆเบ•เบฒเบ•เบฐเบฅเบฒเบ‡ เบเปเบฒเบ›เบฑเปˆเบ™ Titanic เบ”เบฝเบงเบเบฑเบ™ 2 เบ–เบฑเบ™.

เบŸเบฑเบ‡เบŠเบฑเบ™เบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปƒเบ™ Python: pandas

titanic.assign(Pclass_cost      =  titanic.groupby('Pclass').Fare.transform(sum),
               ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])

เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบเบฒเบ™เบ•เบญเบšเบชเบฐ เปœเบญเบ‡ เบซเบ™เป‰เบฒเบ—เบตเปˆเปเบฅเบฐเบงเบดเบ—เบตเบเบฒเบ™

เบ‚เป‰เบฒเบ‡เบฅเบธเปˆเบกเบ™เบตเป‰เปเบกเปˆเบ™เบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบเบฒเบ™เบ•เบดเบ”เบ•เปเปˆเบฅเบฐเบซเบงเปˆเบฒเบ‡เบงเบดเบ—เบตเบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™เบ•เปˆเบฒเบ‡เป†เบ—เบตเปˆเบกเบตเบ‚เปเป‰เบกเบนเบ™เปƒเบ™เบŠเบธเบ”เบ—เบตเปˆเบžเบงเบเป€เบฎเบปเบฒเป„เบ”เป‰เบžเบดเบˆเบฒเบฅเบฐเบ™เบฒ.

เบฅเบฒเบโ€‹เบฅเบฐโ€‹เบญเบฝเบ”
เป€เบ›เบฑเบ™เบฅเบฐเบšเบฝเบšเบฎเบฝเบšเบฎเป‰เบญเบ
เบ•เบฒเบ•เบฐเบฅเบฒเบ‡
เปเบต เปเบžเบ™เบ”เบฒ

เบเบณเบฅเบฑเบ‡เป‚เบซเบผเบ”เบ‚เปเป‰เบกเบนเบ™
vroom()/ readr::read_csv() / readr::read_tsv()
fread()
read_csv()

เบเบฒเบ™เบชเป‰เบฒเบ‡เบเบญเบšเบ‚เปเป‰เบกเบนเบ™
tibble()
data.table()
dict() + from_dict()

เบเบฒเบ™เป€เบฅเบทเบญเบเบ–เบฑเบ™
select()
เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ j, เบ•เปเบฒเปเบซเบ™เปˆเบ‡เบ—เบตเบชเบญเบ‡เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบฅเปˆเบฝเบก
เบžเบงเบเป€เบฎเบปเบฒเบœเปˆเบฒเบ™เบšเบฑเบ™เบŠเบตเบฅเบฒเบเบŠเบทเปˆเบ‚เบญเบ‡เบ–เบฑเบ™เบ—เบตเปˆเบ•เป‰เบญเบ‡เบเบฒเบ™เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบผเปˆเบฝเบก / drop() / filter() / select_dtypes()

เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปเบ–เบง
filter()
เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ i, เบ•เปเบฒเปเบซเบ™เปˆเบ‡เบ—เปเบฒเบญเบดเบ”เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบฅเปˆเบฝเบก
เบžเบงเบเป€เบฎเบปเบฒเบฅเบฒเบเบŠเบทเปˆเป€เบ‡เบทเปˆเบญเบ™เป„เบ‚เบเบฒเบ™เบเบฑเปˆเบ™เบ•เบญเบ‡เปƒเบ™เบงเบปเบ‡เป€เบฅเบฑเบšเบชเบตเปˆเบซเบฅเปˆเบฝเบก / filter()

เบเบฒเบ™เบˆเบฑเบ”เบเบธเปˆเบกเปเบฅเบฐเบเบฒเบ™เบฅเบงเบšเบฅเบงเบก
group_by() + summarise()
เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ j + by
groupby() + agg()

เบชเบฐโ€‹เบซเบฐโ€‹เบžเบฒเบšโ€‹เบ•เบฑเป‰เบ‡โ€‹เบ‚เบญเบ‡โ€‹เบ•เบฒโ€‹เบ•เบฐโ€‹เบฅเบฒเบ‡ (UNIONโ€‹)
bind_rows()
rbind()
concat()

เบเบฒเบ™เบฅเบงเบกเบ•เบฒเบ•เบฐเบฅเบฒเบ‡เบ•เบฒเบกเบฅเบงเบ‡เบ™เบญเบ™ (เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบก)
left_join() / *_join()
merge()
merge()

เบซเบ™เป‰เบฒเบ—เบตเปˆเบžเบทเป‰เบ™เบ–เบฒเบ™เบ‚เบญเบ‡เบ›เปˆเบญเบ‡เบขเป‰เบฝเบกเปเบฅเบฐเบเบฒเบ™เป€เบžเบตเปˆเบกเบ„เปเบฅเปเบฒเบ—เบตเปˆเบ„เบดเบ”เป„เบฅเปˆ
group_by() + mutate()
เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ j เบเบฒเบ™เบ™เปเบฒเปƒเบŠเป‰เบ•เบปเบงเบ›เบฐเบ•เบดเบšเบฑเบ”เบเบฒเบ™ := + เบเบฒเบ™เป‚เบ•เป‰เบ–เบฝเบ‡ by
transform() + assign()

เบชเบฐเบซเบฅเบธเบš

เบšเบฒเบ‡เบ—เบตเปƒเบ™เบšเบปเบ”เบ„เบงเบฒเบกเบ—เบตเปˆเบ‚เป‰เบฒเบžเบฐเป€เบˆเบปเป‰เบฒเบญเบฐเบ—เบดเบšเบฒเบเบšเปเปˆเปเบกเปˆเบ™เบเบฒเบ™เบ›เบฐเบ•เบดเบšเบฑเบ”เบ—เบตเปˆเบ”เบตเบ—เบตเปˆเบชเบธเบ”เบ‚เบญเบ‡เบเบฒเบ™เบ›เบธเบ‡เปเบ•เปˆเบ‡เบ‚เปเป‰เบกเบนเบ™, เบ”เบฑเปˆเบ‡เบ™เบฑเป‰เบ™เบ‚เป‰เบญเบเบˆเบฐเบ”เบตเปƒเบˆเบ–เป‰เบฒเบ—เปˆเบฒเบ™เปเบเป‰เป„เบ‚เบ‚เปเป‰เบœเบดเบ”เบžเบฒเบ”เบ‚เบญเบ‡เบ‚เป‰เบญเบเปƒเบ™เบ„เปเบฒเป€เบซเบฑเบ™, เบซเบผเบทเบžเบฝเบ‡เปเบ•เปˆเบ•เบทเปˆเบกเบ‚เปเป‰เบกเบนเบ™เปƒเบชเปˆเปƒเบ™เบšเบปเบ”เบ„เบงเบฒเบกเบ”เป‰เบงเบเป€เบ•เบฑเบเบ™เบดเบเบญเบทเปˆเบ™เป†เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฎเบฑเบ”เบงเบฝเบเบเบฑเบšเบ‚เปเป‰เบกเบนเบ™เปƒเบ™ R / Python.

เบ”เบฑเปˆเบ‡เบ—เบตเปˆเบ‚เป‰เบฒเบžเบฐเป€เบˆเบปเป‰เบฒเบ‚เบฝเบ™เป„เบงเป‰เบ‚เป‰เบฒเบ‡เป€เบ—เบดเบ‡, เบˆเบธเบ”เบ›เบฐเบชเบปเบ‡เบ‚เบญเบ‡เบšเบปเบ”เบ„เบงเบฒเบกเบšเปเปˆเป„เบ”เป‰เบเปเบฒเบ™เบปเบ”เบ„เบงเบฒเบกเบ„เบดเบ”เป€เบซเบฑเบ™เบ‚เบญเบ‡เบ„เบปเบ™เบซเบ™เบถเปˆเบ‡เบงเปˆเบฒเบžเบฒเบชเบฒเปƒเบ”เบ”เบตเบเบงเปˆเบฒ, เปเบ•เปˆเป€เบžเบทเปˆเบญเป€เบฎเบฑเบ”เปƒเบซเป‰เป‚เบญเบเบฒเบ”เบ—เบตเปˆเบˆเบฐเบฎเบฝเบ™เบฎเบนเป‰เบ—เบฑเบ‡เบชเบญเบ‡เบžเบฒเบชเบฒ, เบซเบผเบท, เบ–เป‰เบฒเบˆเปเบฒเป€เบ›เบฑเบ™, เบเป‰เบฒเบเบฅเบฐเบซเบงเปˆเบฒเบ‡เบžเบงเบเป€เบ‚เบปเบฒ.

เบ–เป‰เบฒเบ—เปˆเบฒเบ™เบกเบฑเบเบšเบปเบ”เบ„เบงเบฒเบก, เบ‚เป‰เบญเบเบˆเบฐเบ”เบตเปƒเบˆเบ—เบตเปˆเบกเบตเบœเบนเป‰เบชเบฐเบซเบกเบฑเบเปƒเบซเบกเปˆเบ‚เบญเบ‡เบ‚เป‰เบญเบ youtube ะธ เป‚เบ—เบฅเบฐเป€เบฅเบ เบŠเปˆเบญเบ‡.

Poll

เปเบžเบฑเบเป€เบเบ”เปƒเบ”เบ•เปเปˆเป„เบ›เบ™เบตเป‰เบ—เบตเปˆเบ—เปˆเบฒเบ™เปƒเบŠเป‰เปƒเบ™เบงเบฝเบเบ‚เบญเบ‡เป€เบˆเบปเป‰เบฒ?

เปƒเบ™เบ„เปเบฒเป€เบซเบฑเบ™เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เบ‚เบฝเบ™เป€เบซเบ”เบœเบปเบ™เบชเปเบฒเบฅเบฑเบšเบเบฒเบ™เป€เบฅเบทเบญเบเบ‚เบญเบ‡เบ—เปˆเบฒเบ™.

เบžเบฝเบ‡เปเบ•เปˆเบœเบนเป‰เปƒเบŠเป‰เบฅเบปเบ‡เบ—เบฐเบšเบฝเบ™เบชเบฒเบกเบฒเบ”เป€เบ‚เบปเป‰เบฒเบฎเปˆเบงเบกเปƒเบ™เบเบฒเบ™เบชเปเบฒเบซเบผเบงเบ”. เป€เบ‚เบปเป‰เบฒโ€‹เบชเบนเปˆโ€‹เบฅเบฐโ€‹เบšเบปเบšเบเบฐเบฅเบธเบ™เบฒ.

เบ—เปˆเบฒเบ™เปƒเบŠเป‰เบŠเบธเบ”เบ›เบฐเบกเบงเบ™เบœเบปเบ™เบ‚เปเป‰เบกเบนเบ™เปƒเบ” (เบ—เปˆเบฒเบ™เบชเบฒเบกเบฒเบ”เป€เบฅเบทเบญเบเบซเบผเบฒเบเบ—เบฒเบ‡เป€เบฅเบทเบญเบ)

  • 45,2%tidyverse19

  • 33,3%data.table14

  • 54,8%pandas23

เบœเบนเป‰เปƒเบŠเป‰ 42 เบ„เบปเบ™เบฅเบปเบ‡เบ„เบฐเปเบ™เบ™เบชเบฝเบ‡. 9 เบœเบนเป‰เปƒเบŠเป‰เบ‡เบปเบ”.

เปเบซเบผเปˆเบ‡เบ‚เปเป‰เบกเบนเบ™: www.habr.com

เป€เบžเบตเปˆเบกเบ„เบงเบฒเบกเบ„เบดเบ”เป€เบซเบฑเบ™