αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αžŠαŸ„αž™αž€αžΆαžšαžŸαŸ’αžœαŸ‚αž„αžšαž€ R ឬ Python αž“αŸ…αž›αžΎαž’αŸŠαžΈαž“αž’αžΊαžŽαž·αž αž’αŸ’αž“αž€αž“αžΉαž„αžƒαžΎαž‰αž’αžαŸ’αžαž”αž‘αžšαžΆαž”αŸ‹αž›αžΆαž“ αž“αž·αž„αž‚αžΈαž‘αžΌαž˜αŸ‰αŸ‚αžαŸ’αžšαž“αŸƒαž€αžΆαžšαž–αž·αž—αžΆαž€αŸ’αžŸαžΆαž›αžΎαž”αŸ’αžšαž’αžΆαž“αž”αž‘αžŠαŸ‚αž›αž˜αž½αž™αžŽαžΆαž›αŸ’αž’αž‡αžΆαž„ αž›αžΏαž“ αž“αž·αž„αž„αžΆαž™αžŸαŸ’αžšαž½αž›αž‡αžΆαž„αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™αŸ” αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž‡αžΆαž’αž€αž»αžŸαž› αž’αžαŸ’αžαž”αž‘ αž“αž·αž„αž‡αž˜αŸ’αž›αŸ„αŸ‡αž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž“αŸαŸ‡αž˜αž·αž“αž˜αžΆαž“αž”αŸ’αžšαž™αŸ„αž‡αž“αŸαž‡αžΆαž–αž·αžŸαŸαžŸαž“αŸ„αŸ‡αž‘αŸαŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αž‚αŸ„αž›αž”αŸ†αžŽαž„αž“αŸƒαž’αžαŸ’αžαž”αž‘αž“αŸαŸ‡αž‚αžΊαžŠαžΎαž˜αŸ’αž”αžΈαž”αŸ’αžšαŸ€αž”αž’αŸ€αž”αž”αž…αŸ’αž…αŸαž€αž‘αŸαžŸαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™αž‡αžΆαž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“αž“αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹αž–αŸαž‰αž“αž·αž™αž˜αž”αŸ†αž•αž»αžαž“αŸƒαž—αžΆαžŸαžΆαž‘αžΆαŸ†αž„αž–αžΈαžšαŸ” αž αžΎαž™β€‹αž‡αž½αž™β€‹αž’αŸ’αž“αž€β€‹αž’αžΆαž“β€‹αž±αŸ’αž™β€‹αž†αžΆαž”αŸ‹β€‹αž™αž›αŸ‹β€‹αž–αžΈβ€‹αž’αŸ’αžœαžΈβ€‹αžŠαŸ‚αž›β€‹αž–αž½αž€αž‚αŸβ€‹αž˜αž·αž“β€‹αž‘αžΆαž“αŸ‹β€‹αžŠαžΉαž„αŸ” αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αž“αž€αžŠαŸ‚αž›αžŸαžšαžŸαŸαžšαž€αŸ’αž“αž»αž„ Python αžŸαŸ’αžœαŸ‚αž„αž™αž›αŸ‹αž–αžΈαžšαž”αŸ€αž”αž’αŸ’αžœαžΎαžŠαžΌαž…αž‚αŸ’αž“αžΆαž“αŸ…αž€αŸ’αž“αž»αž„ R αž“αž·αž„αž…αŸ’αžšαžΆαžŸαž˜αž€αžœαž·αž‰αŸ”

αž€αŸ’αž“αž»αž„αž’αŸ†αž‘αž»αž„αž–αŸαž›αž’αžαŸ’αžαž”αž‘ αž™αžΎαž„αž“αžΉαž„αžœαž·αž—αžΆαž‚αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž“αŸƒαž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž–αŸαž‰αž“αž·αž™αž˜αž”αŸ†αž•αž»αžαž“αŸ…αž€αŸ’αž“αž»αž„ R. αž‘αžΆαŸ†αž„αž“αŸαŸ‡αž‚αžΊαž‡αžΆαž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αžšαž½αž˜αž”αž‰αŸ’αž…αžΌαž›αž“αŸ…αž€αŸ’αž“αž»αž„αž”αžŽαŸ’αžŽαžΆαž›αŸαž™ tidyverseαž“αž·αž„αž€αž‰αŸ’αž…αž”αŸ‹αž•αž„αžŠαŸ‚αžšαŸ” data.table. αž αžΎαž™αž”αŸ’αžšαŸ€αž”αž’αŸ€αž”αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αžšαž”αžŸαŸ‹αž–αž½αž€αž‚αŸαž‡αžΆαž˜αž½αž™ pandasαžŠαŸ‚αž›αž‡αžΆαž€αž‰αŸ’αž…αž”αŸ‹αžœαž·αž—αžΆαž‚αž‘αž·αž“αŸ’αž“αž“αŸαž™αž–αŸαž‰αž“αž·αž™αž˜αž”αŸ†αž•αž»αžαž“αŸ…αž€αŸ’αž“αž»αž„ Python αŸ”

αž™αžΎαž„αž“αžΉαž„αž‘αŸ…αž˜αž½αž™αž‡αŸ†αž αžΆαž“αž˜αŸ’αžαž„αŸ—αžαžΆαž˜αžšαž™αŸˆαž•αŸ’αž›αžΌαžœαž‘αžΆαŸ†αž„αž˜αžΌαž›αž“αŸƒαž€αžΆαžšαžœαž·αž—αžΆαž‚αž‘αž·αž“αŸ’αž“αž“αŸαž™αž–αžΈαž€αžΆαžšαž•αŸ’αž‘αž»αž€αžœαžΆαž‘αŸ…αž€αžΆαžšαž’αž“αž»αžœαžαŸ’αžαž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž…αžœαž·αž—αžΆαž‚αžŠαŸ„αž™αž”αŸ’αžšαžΎ Python αž“αž·αž„ R αŸ”

αž˜αžΆαžαž·αž€αžΆ

αž’αžαŸ’αžαž”αž‘αž“αŸαŸ‡αž’αžΆαž…αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαž‡αžΆαžŸαž“αŸ’αž›αžΉαž€αž”αž“αŸ’αž›αŸ† αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž—αŸ’αž›αŸαž…αž–αžΈαžšαž”αŸ€αž”αž’αŸ’αžœαžΎαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™αž˜αž½αž™αž…αŸ†αž“αž½αž“αž“αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹αž˜αž½αž™αž€αŸ’αž“αž»αž„αž…αŸ†αžŽαŸ„αž˜αž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž€αŸ†αž–αž»αž„αž–αž·αž…αžΆαžšαžŽαžΆαŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

  1. αž—αžΆαž–αžαž»αžŸαž‚αŸ’αž“αžΆαžŸαŸ†αžαžΆαž“αŸ‹αžšαžœαžΆαž„ R αž“αž·αž„ Python
    1.1. αž€αžΆαžšαž…αžΌαž›αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžšαž€αž‰αŸ’αž…αž”αŸ‹
    1.2. αž€αž·αž…αŸ’αž…αž€αžΆαžš
    1.3. αž€αžΆαžšαž’αŸ’αžœαžΎαž›αž·αž”αž·αž€αŸ’αžšαž˜
    1.4. αžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αžαž“αž·αž„ OOP
    1.5. αž”αŸ†αž–αž„αŸ‹
    1.6. αžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž‘αž·αž“αŸ’αž“αž“αŸαž™
  2. αž–αžΆαž€αŸ’αž™αž–αžΈαžšαž”αžΈαž’αŸ†αž–αžΈαž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž™αžΎαž„αž“αžΉαž„αž”αŸ’αžšαžΎ
    2.1. tidyverse
    2.2. αžαžΆαžšαžΆαž„αž‘αž·αž“αŸ’αž“αž“αŸαž™
    2.3. αžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆ
  3. αž€αžΆαžšαžŠαŸ†αž‘αžΎαž„αž€αž‰αŸ’αž…αž”αŸ‹
  4. αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™
  5. αž€αžΆαžšαž”αž„αŸ’αž€αžΎαžαžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™
  6. αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž€αžΆαžš
  7. αžαŸ’αžšαž„αž‡αž½αžš
  8. αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†
  9. αž€αžΆαžšαžšαž½αž”αžšαž½αž˜αž“αŸƒαžαžΆαžšαžΆαž„αž”αž‰αŸ’αžˆαžš (UNION)
  10. αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αžαžΆαžšαžΆαž„αž•αŸ’αžŠαŸαž€ (αž…αžΌαž›αžšαž½αž˜)
  11. αž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž…αž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“ αž“αž·αž„αž‡αž½αžšαžˆαžšαž‚αžŽαž“αžΆ
  12. αžαžΆαžšαžΆαž„αž†αŸ’αž›αžΎαž™αž†αŸ’αž›αž„αžšαžœαžΆαž„αžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžαŸ’αžšαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™αž€αŸ’αž“αž»αž„ R αž“αž·αž„ Python
  13. αžŸαŸαž…αž€αŸ’αžαžΈαžŸαž“αŸ’αž“αž·αžŠαŸ’αž‹αžΆαž“
  14. αž€αžΆαžšαžŸαŸ’αž‘αž„αŸ‹αž˜αžαž·αžαŸ’αž›αžΈαž’αŸ†αž–αžΈαž€αž‰αŸ’αž…αž”αŸ‹αž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αž’αŸ’αž“αž€αž”αŸ’αžšαžΎ

αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž…αžΆαž”αŸ‹αž’αžΆαžšαž˜αŸ’αž˜αžŽαŸαž›αžΎαž€αžΆαžšαžœαž·αž—αžΆαž‚αž‘αž·αž“αŸ’αž“αž“αŸαž™ αž’αŸ’αž“αž€αž’αžΆαž…αžŸαŸ’αžœαŸ‚αž„αžšαž€αžšαž”αžŸαŸ‹αžαŸ’αž‰αž»αŸ† αž‘αžΌαžšαž›αŸαž ΠΈ YouTube αž†αžΆαž“αŸ‚αž›αŸ” αž˜αžΆαžαž·αž€αžΆαž—αžΆαž‚αž…αŸ’αžšαžΎαž“αžαŸ’αžšαžΌαžœαž”αžΆαž“αž§αž‘αŸ’αž‘αž·αžŸαžŠαž›αŸ‹αž—αžΆαžŸαžΆ R αŸ”

αž—αžΆαž–αžαž»αžŸαž‚αŸ’αž“αžΆαžŸαŸ†αžαžΆαž“αŸ‹αžšαžœαžΆαž„ R αž“αž·αž„ Python

αžŠαžΎαž˜αŸ’αž”αžΈαž’αŸ’αžœαžΎαž±αŸ’αž™αžœαžΆαž€αžΆαž“αŸ‹αžαŸ‚αž„αžΆαž™αžŸαŸ’αžšαž½αž›αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αž“αž€αž€αŸ’αž“αž»αž„αž€αžΆαžšαž”αŸ’αžαžΌαžšαž–αžΈ Python αž‘αŸ… R αž¬αž•αŸ’αž‘αž»αž™αž˜αž€αžœαž·αž‰ αžαŸ’αž‰αž»αŸ†αž“αžΉαž„αž•αŸ’αžαž›αŸ‹αž…αŸ†αžŽαž»αž…αžŸαŸ†αžαžΆαž“αŸ‹αŸ—αž˜αž½αž™αž…αŸ†αž“αž½αž“αžŠαŸ‚αž›αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž™αž€αž…αž·αžαŸ’αžαž‘αž»αž€αžŠαžΆαž€αŸ‹αŸ”

αž€αžΆαžšαž…αžΌαž›αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžšαž€αž‰αŸ’αž…αž”αŸ‹

αž“αŸ…αž–αŸαž›αžŠαŸ‚αž›αž€αž‰αŸ’αž…αž”αŸ‹αž˜αž½αž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αž•αŸ’αž‘αž»αž€αž‘αŸ…αž€αŸ’αž“αž»αž„ R αž’αŸ’αž“αž€αž˜αž·αž“αž…αžΆαŸ†αž”αžΆαž…αŸ‹αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αžˆαŸ’αž˜αŸ„αŸ‡αž€αž‰αŸ’αž…αž”αŸ‹αžŠαžΎαž˜αŸ’αž”αžΈαž…αžΌαž›αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžšαžšαž”αžŸαŸ‹αžœαžΆαž“αŸ„αŸ‡αž‘αŸαŸ” αž€αŸ’αž“αž»αž„αž€αžšαžŽαžΈαž—αžΆαž‚αž…αŸ’αžšαžΎαž“ αž“αŸαŸ‡αž˜αž·αž“αž˜αŸ‚αž“αž‡αžΆαžšαžΏαž„αž’αž˜αŸ’αž˜αžαžΆαž‘αŸαž“αŸ…αž€αŸ’αž“αž»αž„ R αž”αŸ‰αž»αž“αŸ’αžαŸ‚αžœαžΆαž’αžΆαž…αž‘αž‘αž½αž›αž™αž€αž”αžΆαž“αŸ” αž’αŸ’αž“αž€αž˜αž·αž“αž…αžΆαŸ†αž”αžΆαž…αŸ‹αž“αžΆαŸ†αž…αžΌαž›αž€αž‰αŸ’αž…αž”αŸ‹αž’αŸ’αžœαžΈαž‘αžΆαŸ†αž„αž’αžŸαŸ‹ αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž€αžΆαžšαž˜αž»αžαž„αžΆαžšαžŽαžΆαž˜αž½αž™αžšαž”αžŸαŸ‹αžœαžΆαž“αŸ…αž€αŸ’αž“αž»αž„αž€αžΌαžŠαžšαž”αžŸαŸ‹αž’αŸ’αž“αž€ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž‚αŸ’αžšαžΆαž“αŸ‹αžαŸ‚αž αŸ…αžœαžΆαžŠαŸ„αž™αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αžˆαŸ’αž˜αŸ„αŸ‡αž€αž‰αŸ’αž…αž”αŸ‹ αž“αž·αž„αžˆαŸ’αž˜αŸ„αŸ‡αž˜αž»αžαž„αžΆαžšαŸ” αžŸαž‰αŸ’αž‰αžΆαž”αŸ†αž”αŸ‚αž€αžšαžœαžΆαž„αžˆαŸ’αž˜αŸ„αŸ‡αž€αž‰αŸ’αž…αž”αŸ‹ αž“αž·αž„αž˜αž»αžαž„αžΆαžšαž€αŸ’αž“αž»αž„ R αž‚αžΊαž‡αžΆαžŸαž‰αŸ’αž‰αžΆαž–αžΈαžšαŸ” package_name::function_name().

αž“αŸ…αž€αŸ’αž“αž»αž„ Python αž•αŸ’αž‘αž»αž™αž‘αŸ…αžœαž·αž‰ αžœαžΆαžαŸ’αžšαžΌαžœαž”αžΆαž“αž‚αŸαž…αžΆαžαŸ‹αž‘αž»αž€αžαžΆαž‡αžΆαž”αž»αžšαžΆαžŽαžŠαžΎαž˜αŸ’αž”αžΈαž αŸ…αž˜αž»αžαž„αžΆαžšαž“αŸƒαž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ„αž™αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αž™αŸ‰αžΆαž„αž…αŸ’αž”αžΆαžŸαŸ‹αž–αžΈαžˆαŸ’αž˜αŸ„αŸ‡αžšαž”αžŸαŸ‹αžœαžΆαŸ” αž“αŸ…αž–αŸαž›αžŠαŸ‚αž›αž€αž‰αŸ’αž…αž”αŸ‹αž˜αž½αž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αž‘αžΆαž‰αž™αž€ αž‡αžΆαž’αž˜αŸ’αž˜αžαžΆαžœαžΆαžαŸ’αžšαžΌαžœαž”αžΆαž“αž•αŸ’αžαž›αŸ‹αžˆαŸ’αž˜αŸ„αŸ‡αžαŸ’αž›αžΈ ឧ. pandas αž‡αžΆβ€‹αž’αž˜αŸ’αž˜αžαžΆβ€‹αžˆαŸ’αž˜αŸ„αŸ‡β€‹αž€αŸ’αž›αŸ‚αž„αž€αŸ’αž›αžΆαž™β€‹αžαŸ’αžšαžΌαžœβ€‹αž”αžΆαž“β€‹αž”αŸ’αžšαžΎ pd. αž˜αž»αžαž„αžΆαžšαž€αž‰αŸ’αž…αž”αŸ‹αžαŸ’αžšαžΌαžœαž”αžΆαž“αž…αžΌαž›αž”αŸ’αžšαžΎαžαžΆαž˜αžšαž™αŸˆαž…αŸ†αž“αž»αž… package_name.function_name().

αž€αž·αž…αŸ’αž…αž€αžΆαžš

αž“αŸ…αž€αŸ’αž“αž»αž„ R αžœαžΆαž‡αžΆαžšαžΏαž„αž’αž˜αŸ’αž˜αžαžΆαž€αŸ’αž“αž»αž„αž€αžΆαžšαž”αŸ’αžšαžΎαž–αŸ’αžšαž½αž‰αžŠαžΎαž˜αŸ’αž”αžΈαž•αŸ’αžαž›αŸ‹αžαž˜αŸ’αž›αŸƒαž‘αŸ…αžœαžαŸ’αžαž»αž˜αž½αž™αŸ” obj_name <- valueαž‘αŸ„αŸ‡αž”αžΈαž‡αžΆαžŸαž‰αŸ’αž‰αžΆαžŸαŸ’αž˜αžΎαžαŸ‚αž˜αž½αž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž€αŸαžŠαŸ„αž™ αžŸαž‰αŸ’αž‰αžΆαžŸαŸ’αž˜αžΎαž‚αŸ’αž“αžΆαžαŸ‚αž˜αž½αž™αž“αŸ…αž€αŸ’αž“αž»αž„ R αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαž‡αžΆαž…αž˜αŸ’αž”αž„αžŠαžΎαž˜αŸ’αž”αžΈαž”αž‰αŸ’αž‡αžΌαž“αžαž˜αŸ’αž›αŸƒαž‘αŸ…αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αž˜αž»αžαž„αžΆαžšαŸ”

αž“αŸ…αž€αŸ’αž“αž»αž„ Python αž€αž·αž…αŸ’αž…αž€αžΆαžšαžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž‰αŸ’αž…αž”αŸ‹αž‘αžΆαŸ†αž„αžŸαŸ’αžšαž»αž„αžŠαŸ„αž™αžŸαž‰αŸ’αž‰αžΆαžŸαŸ’αž˜αžΎαžαŸ‚αž˜αž½αž™ obj_name = value.

αž€αžΆαžšαž’αŸ’αžœαžΎαž›αž·αž”αž·αž€αŸ’αžšαž˜

αžœαžΆαž€αŸαž˜αžΆαž“αž—αžΆαž–αžαž»αžŸαž‚αŸ’αž“αžΆαžαŸ’αž›αžΆαŸ†αž„αž“αŸ…αž‘αžΈαž“αŸαŸ‡αž•αž„αžŠαŸ‚αžšαŸ” αž“αŸ…αž€αŸ’αž“αž»αž„ R αž€αžΆαžšαž”αž„αŸ’αž€αžΎαžαž›αž·αž”αž·αž€αŸ’αžšαž˜αž…αžΆαž”αŸ‹αž•αŸ’αžαžΎαž˜αž“αŸ…αž˜αž½αž™ αž αžΎαž™αžšαž½αž˜αž”αž‰αŸ’αž…αžΌαž›αž’αžΆαžαž»αžŠαŸ‚αž›αž”αžΆαž“αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„αž‡αž½αžšαž›αž‘αŸ’αž’αž•αž›αŸ”

αž“αŸ…αž€αŸ’αž“αž»αž„ Python αž€αžΆαžšαž”αž„αŸ’αž€αžΎαžαž›αž·αž”αž·αž€αŸ’αžšαž˜αž…αžΆαž”αŸ‹αž•αŸ’αžαžΎαž˜αž–αžΈαžŸαžΌαž“αŸ’αž™ αž αžΎαž™αž‡αž½αžšαžŠαŸ‚αž›αž”αžΆαž“αž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž˜αž·αž“αžšαž½αž˜αž”αž‰αŸ’αž…αžΌαž›αž’αžΆαžαž»αž…αž»αž„αž€αŸ’αžšαŸ„αž™αžŠαŸ‚αž›αž”αžΆαž“αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„αž›αž·αž”αž·αž€αŸ’αžšαž˜αž“αŸ„αŸ‡αž‘αŸαŸ” αžŠαžΌαž…αŸ’αž“αŸαŸ‡αž€αžΆαžšαžšαž…αž“αžΆ x[i:j] αž“αŸ…αž€αŸ’αž“αž»αž„ Python αž“αžΉαž„αž˜αž·αž“αžšαž½αž˜αž”αž‰αŸ’αž…αžΌαž›αž’αžΆαžαž» j αž‘αŸαŸ”

αžœαžΆαž€αŸαž˜αžΆαž“αž—αžΆαž–αžαž»αžŸαž”αŸ’αž›αŸ‚αž€αž‚αŸ’αž“αžΆαž€αŸ’αž“αž»αž„αž€αžΆαžšαž’αŸ’αžœαžΎαž›αž·αž”αž·αž€αŸ’αžšαž˜αž’αžœαž·αž‡αŸ’αž‡αž˜αžΆαž“αž“αŸ…αž€αŸ’αž“αž»αž„αžŸαž‰αŸ’αž‰αžΆ R x[-1] αž“αžΉαž„αžαŸ’αžšαž‘αž”αŸ‹αž’αžΆαžαž»αž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž“αŸƒαžœαŸ‰αž·αž…αž‘αŸαžš αž›αžΎαž€αž›αŸ‚αž„αžαŸ‚αž’αžΆαžαž»αž…αž»αž„αž€αŸ’αžšαŸ„αž™αŸ” αž“αŸ…αž€αŸ’αž“αž»αž„ Python αžŸαž‰αŸ’αž‰αžΆαžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆαž“αžΉαž„αžαŸ’αžšαž‘αž”αŸ‹αžαŸ‚αž’αžΆαžαž»αž…αž»αž„αž€αŸ’αžšαŸ„αž™αž”αŸ‰αž»αžŽαŸ’αžŽαŸ„αŸ‡αŸ”

αžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αžαž“αž·αž„ OOP

R αž’αž“αž»αžœαžαŸ’αž OOP αž“αŸ…αž€αŸ’αž“αž»αž„αžœαž·αž’αžΈαž•αŸ’αž‘αžΆαž›αŸ‹αžαŸ’αž›αž½αž“αžšαž”αžŸαŸ‹αžαŸ’αž‰αž»αŸ†αžαŸ’αž‰αž»αŸ†αž”αžΆαž“αžŸαžšαžŸαŸαžšαž’αŸ†αž–αžΈαžšαžΏαž„αž“αŸαŸ‡αž“αŸ…αž€αŸ’αž“αž»αž„αž’αžαŸ’αžαž”αž‘ "OOP αž‡αžΆαž—αžΆαžŸαžΆ R (αž•αŸ’αž“αŸ‚αž€αž‘αžΈ 1): αžαŸ’αž“αžΆαž€αŸ‹ S3". αž‡αžΆαž‘αžΌαž‘αŸ… R αž‚αžΊαž‡αžΆαž—αžΆαžŸαžΆαžŠαŸ‚αž›αž˜αžΆαž“αž˜αž»αžαž„αžΆαžš αž αžΎαž™αž’αŸ’αžœαžΈαž‚αŸ’αžšαž”αŸ‹αž™αŸ‰αžΆαž„αž“αŸ…αž€αŸ’αž“αž»αž„αžœαžΆαžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž„αŸ’αž€αžΎαžαž‘αžΎαž„αž“αŸ…αž›αžΎαž˜αž»αžαž„αžΆαžšαŸ” αžŠαžΌαž…αŸ’αž“αŸαŸ‡αž§αž‘αžΆαž αžšαžŽαŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αž“αž€αž”αŸ’αžšαžΎαž”αŸ’αžšαžΆαžŸαŸ‹ Excel αžŸαžΌαž˜αž…αžΌαž›αž‘αŸ…αž€αžΆαž“αŸ‹ tydiverse αžœαžΆαž“αžΉαž„αž„αžΆαž™αžŸαŸ’αžšαž½αž›αž‡αžΆαž„ pandas. αž‘αŸ„αŸ‡αž”αžΈαž“αŸαŸ‡αž’αžΆαž…αž‡αžΆαž‚αŸ†αž“αž·αžαžšαž”αžŸαŸ‹αžαŸ’αž‰αž»αŸ†αž€αŸαžŠαŸ„αž™αŸ”

αžŸαžšαž»αž”αž˜αž€ αžœαžαŸ’αžαž»αž€αŸ’αž“αž»αž„ R αž˜αž·αž“αž˜αžΆαž“αžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αž (αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž™αžΎαž„αž“αž·αž™αžΆαž™αž’αŸ†αž–αžΈαžαŸ’αž“αžΆαž€αŸ‹ S3 αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž˜αžΆαž“αž€αžΆαžšαž’αž“αž»αžœαžαŸ’αž OOP αž•αŸ’αžŸαŸαž„αž‘αŸ€αžαžŠαŸ‚αž›αž˜αž·αž“αžŸαžΌαžœαž˜αžΆαž“αž…αŸ’αžšαžΎαž“αž‘αŸ)αŸ” αžœαžΆβ€‹αž˜αžΆαž“β€‹αžαŸ‚β€‹αž˜αž»αžαž„αžΆαžšβ€‹αž‘αžΌαž‘αŸ…β€‹αž”αŸ‰αž»αžŽαŸ’αžŽαŸ„αŸ‡β€‹αžŠαŸ‚αž›β€‹αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšβ€‹αž–αž½αž€αžœαžΆβ€‹αžαž»αžŸβ€‹αž‚αŸ’αž“αžΆβ€‹αž’αžΆαžŸαŸ’αžšαŸαž™β€‹αž›αžΎβ€‹αžαŸ’αž“αžΆαž€αŸ‹β€‹αžšαž”αžŸαŸ‹β€‹αžœαžαŸ’αžαž»αŸ”

αž”αŸ†αž–αž„αŸ‹

αž”αŸ’αžšαž αŸ‚αž›αž‡αžΆαž“αŸαŸ‡αž‡αžΆαžˆαŸ’αž˜αŸ„αŸ‡αžŸαž˜αŸ’αžšαžΆαž”αŸ‹ pandas αžœαžΆαž“αžΉαž„αž˜αž·αž“αžαŸ’αžšαžΉαž˜αžαŸ’αžšαžΌαžœαž‘αžΆαŸ†αž„αžŸαŸ’αžšαž»αž„αž‘αŸ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αžαŸ’αž‰αž»αŸ†αž“αžΉαž„αž–αŸ’αž™αžΆαž™αžΆαž˜αž–αž“αŸ’αž™αž›αŸ‹αž’αžαŸ’αžαž“αŸαž™αŸ”

αžŠαžΎαž˜αŸ’αž”αžΈαž€αž»αŸ†αž±αŸ’αž™αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž€αžΆαžšαž‚αžŽαž“αžΆαž€αž˜αŸ’αžšαž·αžαž˜αž’αŸ’αž™αž˜αž“αž·αž„αž˜αž·αž“αž•αž›αž·αžαžœαžαŸ’αžαž»αžŠαŸ‚αž›αž˜αž·αž“αž…αžΆαŸ†αž”αžΆαž…αŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„αž”αžšαž·αž™αžΆαž€αžΆαžŸαž€αžΆαžšαž„αžΆαžšαž’αŸ’αž“αž€αž’αžΆαž…αž”αŸ’αžšαžΎαž”αŸ’αžšαž—αŸαž‘αž“αŸƒαž”αŸ†αž–αž„αŸ‹αŸ” αž‘αžΆαŸ†αž„αž“αŸ„αŸ‡αŸ” αž”αž‰αŸ’αž‡αžΌαž“αž›αž‘αŸ’αž’αž•αž›αž“αŸƒαž€αžΆαžšαž‚αžŽαž“αžΆαž–αžΈαž˜αž»αžαž„αžΆαžšαž˜αž½αž™αž‘αŸ…αž˜αž»αžαž„αžΆαžšαž”αž“αŸ’αž‘αžΆαž”αŸ‹ αž αžΎαž™αž€αž»αŸ†αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž›αž‘αŸ’αž’αž•αž›αž€αž˜αŸ’αžšαž·αžαž˜αž’αŸ’αž™αž˜αŸ”

αž…αžΌαžšαž™αžΎαž„αž™αž€αž§αž‘αžΆαž αžšαžŽαŸαž€αžΌαžŠαžαžΆαž„αž€αŸ’αžšαŸ„αž˜ αžŠαŸ‚αž›αž™αžΎαž„αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž€αžΆαžšαž‚αžŽαž“αžΆαž€αž˜αŸ’αžšαž·αžαž˜αž’αŸ’αž™αž˜αž€αŸ’αž“αž»αž„αžœαžαŸ’αžαž»αžŠαžΆαž…αŸ‹αžŠαŸ„αž™αž‘αŸ‚αž€αŸ–

temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )

αž™αžΎαž„αž’αŸ’αžœαžΎαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž…αŸ†αž“αž½αž“ 3 αž‡αžΆαž”αž“αŸ’αžαž”αž“αŸ’αž‘αžΆαž”αŸ‹ αž αžΎαž™αž›αž‘αŸ’αž’αž•αž›αž“αžΈαž˜αž½αž™αŸ—αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž€αŸ’αž“αž»αž„αžœαžαŸ’αžαž»αžŠαžΆαž…αŸ‹αžŠαŸ„αž™αž‘αŸ‚αž€αž˜αž½αž™αŸ” αž”αŸ‰αž»αž“αŸ’αžαŸ‚αžαžΆαž˜αž–αž·αžαž‘αŸ… αž™αžΎαž„αž˜αž·αž“αžαŸ’αžšαžΌαžœαž€αžΆαžšαžœαžαŸ’αžαž»αž˜αž’αŸ’αž™αž˜αž‘αžΆαŸ†αž„αž“αŸαŸ‡αž‘αŸαŸ”

αž¬αžŸαžΌαž˜αŸ’αž”αžΈαžαŸ‚αž’αžΆαž€αŸ’αžšαž€αŸ‹αž‡αžΆαž„αž“αŸαŸ‡ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž€αžΆαž“αŸ‹αžαŸ‚αžŸαŸŠαžΆαŸ†αž“αžΉαž„αž’αŸ’αž“αž€αž”αŸ’αžšαžΎαž”αŸ’αžšαžΆαžŸαŸ‹ Excel αŸ”

obj  <- func3(func2(func1()))

αž€αŸ’αž“αž»αž„αž€αžšαžŽαžΈαž“αŸαŸ‡ αž™αžΎαž„αž˜αž·αž“αž”αžΆαž“αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž›αž‘αŸ’αž’αž•αž›αž“αŸƒαž€αžΆαžšαž‚αžŽαž“αžΆαž€αž˜αŸ’αžšαž·αžαž˜αž’αŸ’αž™αž˜αž‘αŸ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž€αžΆαžšαž’αžΆαž“αž€αžΌαžŠαžŠαŸ‚αž›αž˜αžΆαž“αž˜αž»αžαž„αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αž‚αŸ’αž“αžΆαž‚αžΊαž‡αžΆαž€αžΆαžšαžšαž’αžΆαž€αŸ‹αžšαž’αž½αž›αžαŸ’αž›αžΆαŸ†αž„αž”αŸ†αž•αž»αžαŸ”

αž™αžΎαž„αž“αžΉαž„αž–αž·αž“αž·αžαŸ’αž™αž˜αžΎαž›αžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αžαž‡αžΆαž…αŸ’αžšαžΎαž“αž…αŸ†αž–αŸ„αŸ‡αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™αž€αŸ’αž“αž»αž„ R αž αžΎαž™αž–αž½αž€αž‚αŸαž’αŸ’αžœαžΎαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆαžαžΆαž˜αžœαž·αž’αžΈαž•αŸ’αžŸαŸαž„αŸ—αž‚αŸ’αž“αžΆαŸ”

αž”αŸ†αž–αž„αŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„αž”αžŽαŸ’αžŽαžΆαž›αŸαž™ tidyverse αž’αž“αž»αžœαžαŸ’αžαžŠαŸ„αž™αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžš %>%.

obj <- func1() %>% 
            func2() %>%
            func3()

αžŠαžΌαž…αŸ’αž“αŸαŸ‡αž™αžΎαž„αž™αž€αž›αž‘αŸ’αž’αž•αž›αž“αŸƒαž€αžΆαžšαž„αžΆαžš func1() αž αžΎαž™αž†αŸ’αž›αž„αž€αžΆαžαŸ‹αžœαžΆαž‡αžΆαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžŠαŸ†αž”αžΌαž„ func2()αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αž™αžΎαž„αž†αŸ’αž›αž„αž€αžΆαžαŸ‹αž›αž‘αŸ’αž’αž•αž›αž“αŸƒαž€αžΆαžšαž‚αžŽαž“αžΆαž“αŸαŸ‡αž‡αžΆαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžŠαŸ†αž”αžΌαž„ func3(). αž αžΎαž™αž“αŸ…αž‘αžΈαž”αž‰αŸ’αž…αž”αŸ‹αž™αžΎαž„αžŸαžšαžŸαŸαžšαž€αžΆαžšαž‚αžŽαž“αžΆαž‘αžΆαŸ†αž„αž’αžŸαŸ‹αžŠαŸ‚αž›αž”αžΆαž“αž’αž“αž»αžœαžαŸ’αžαž‘αŸ…αž€αŸ’αž“αž»αž„αžœαžαŸ’αžαž» obj <-.

αž‘αžΆαŸ†αž„β€‹αž’αžŸαŸ‹β€‹αžαžΆαž„β€‹αž›αžΎβ€‹αžαŸ’αžšαžΌαžœβ€‹αž”αžΆαž“β€‹αž”αž„αŸ’αž αžΆαž‰β€‹αž™αŸ‰αžΆαž„β€‹αž›αŸ’αž’β€‹αž‡αžΆαž„β€‹αž–αžΆαž€αŸ’αž™β€‹αžŠαŸ„αž™ meme αž“αŸαŸ‡αŸ–
αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

Π’ data.table αžαŸ’αžŸαŸ‚αžŸαž„αŸ’αžœαžΆαž€αŸ‹αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžαžΆαž˜αžšαž”αŸ€αž”αžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆαŸ”

newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]

αž“αŸ…αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸαž“αžΈαž˜αž½αž™αŸ—αž’αŸ’αž“αž€αž’αžΆαž…αž”αŸ’αžšαžΎαž›αž‘αŸ’αž’αž•αž›αž“αŸƒαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž˜αž»αž“αŸ”

Π’ pandas αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž”αŸ‚αž”αž“αŸαŸ‡αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ†αž”αŸ‚αž€αžŠαŸ„αž™αž…αŸ†αžŽαž»αž…αŸ”

obj = df.fun1().fun2().fun3()

αž‘αžΆαŸ†αž„αž“αŸ„αŸ‡αŸ” αž™αžΎαž„αž™αž€αžαž»αžšαž”αžŸαŸ‹αž™αžΎαž„αŸ” df αž αžΎαž™αž”αŸ’αžšαžΎαžœαž·αž’αžΈαžšαž”αžŸαŸ‹αž“αžΆαž„ fun1()αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αž™αžΎαž„αž’αž“αž»αžœαžαŸ’αžαžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αžαž‘αŸ…αž“αžΉαž„αž›αž‘αŸ’αž’αž•αž›αžŠαŸ‚αž›αž‘αž‘αž½αž›αž”αžΆαž“ fun2()αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž–αžΈ fun3(). αž›αž‘αŸ’αž’αž•αž›αžŠαŸ‚αž›αž‘αž‘αž½αž›αž”αžΆαž“αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž€αŸ’αž“αž»αž„αžœαžαŸ’αžαž»αž˜αž½αž™αŸ” obj .

αžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž‘αž·αž“αŸ’αž“αž“αŸαž™

αžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„ R αž“αž·αž„ Python αž‚αžΊαžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž˜αžΆαž“αžˆαŸ’αž˜αŸ„αŸ‡αž•αŸ’αžŸαŸαž„αž‚αŸ’αž“αžΆαŸ”

αž”αžšαž·αž™αžΆαž™
αžˆαŸ’αž˜αŸ„αŸ‡αž“αŸ…αž€αŸ’αž“αž»αž„ R
αžˆαŸ’αž˜αŸ„αŸ‡αž“αŸ…αž€αŸ’αž“αž»αž„ Python/pandas

αžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αžαžΆαžšαžΆαž„
data.frame, data.table, tibble
DataFrame

αž”αž‰αŸ’αž‡αžΈαžαž˜αŸ’αž›αŸƒαž˜αž½αž™αžœαž·αž˜αžΆαžαŸ’αžš
αžœαŸ‰αž·αž…αž‘αŸαžš
αžŸαŸŠαŸαžšαžΈαž“αŸ…αž€αŸ’αž“αž»αž„αž•αŸαž“αžŠαžΆ αž¬αž”αž‰αŸ’αž‡αžΈαž“αŸ…αž€αŸ’αž“αž»αž„ Python αžŸαž»αž‘αŸ’αž’

αžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž˜αž·αž“αž˜αŸ‚αž“αžαžΆαžšαžΆαž„αž–αž αž»αž€αž˜αŸ’αžšαž·αž
αž”αž‰αŸ’αž‡αžΈ
αžœαž…αž“αžΆαž“αž»αž€αŸ’αžšαž˜ (αžœαž…αž“αžΆαž“αž»αž€αŸ’αžšαž˜)

αž™αžΎαž„αž“αžΉαž„αž–αž·αž“αž·αžαŸ’αž™αž˜αžΎαž›αž›αž€αŸ’αžαžŽαŸˆαž–αž·αžŸαŸαžŸ αž“αž·αž„αž—αžΆαž–αžαž»αžŸαž‚αŸ’αž“αžΆαž˜αž½αž™αž…αŸ†αž“αž½αž“αž•αŸ’αžŸαŸαž„αž‘αŸ€αžαž“αŸ…αž€αŸ’αž“αž»αž„αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αŸ”

αž–αžΆαž€αŸ’αž™αž–αžΈαžšαž”αžΈαž’αŸ†αž–αžΈαž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž™αžΎαž„αž“αžΉαž„αž”αŸ’αžšαžΎ

αž‡αžΆαžŠαŸ†αž”αžΌαž„ αžαŸ’αž‰αž»αŸ†αž“αžΉαž„αž”αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αž“αž€αž”αž“αŸ’αžαž·αž…αž’αŸ†αž–αžΈαž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž’αŸ’αž“αž€αž“αžΉαž„αžŸαŸ’αž‚αžΆαž›αŸ‹αž€αŸ’αž“αž»αž„αž’αŸ†αž‘αž»αž„αž–αŸαž›αž’αžαŸ’αžαž”αž‘αž“αŸαŸ‡αŸ”

tidyverse

αžœαŸαž”αžŸαžΆαž™αž•αŸ’αž›αžΌαžœαž€αžΆαžš: tidyverse.org
αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰
αž”αžŽαŸ’αžŽαžΆαž›αŸαž™ tidyverse αžŸαžšαžŸαŸαžšαžŠαŸ„αž™ Hedley Wickham αž’αŸ’αž“αž€αžŸαŸ’αžšαžΆαžœαž‡αŸ’αžšαžΆαžœαž‡αžΆαž“αŸ‹αžαŸ’αž–αžŸαŸ‹αž“αŸ… RStudio αŸ” tidyverse αž˜αžΆαž“αžŸαŸ†αžŽαž»αŸ†αž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸαž‚αž½αžšαž±αŸ’αž™αž…αžΆαž”αŸ‹αž’αžΆαžšαž˜αŸ’αž˜αžŽαŸαžŠαŸ‚αž›αžŸαž˜αŸ’αžšαž½αž›αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™ 5 αžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαž½αž˜αž”αž‰αŸ’αž…αžΌαž›αž“αŸ…αž€αŸ’αž“αž»αž„αž€αžΆαžšαž‘αžΆαž‰αž™αž€αž€αŸ†αž–αžΌαž›αž‘αžΆαŸ†αž„ 10 αž–αžΈαžƒαŸ’αž›αžΆαŸ†αž„ CRAN αŸ”

αžŸαŸ’αž“αžΌαž›αž“αŸƒαž”αžŽαŸ’αžŽαžΆαž›αŸαž™αž˜αžΆαž“αž€αž‰αŸ’αž…αž”αŸ‹αžŠαžΌαž…αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αŸˆ ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats. αž€αž‰αŸ’αž…αž”αŸ‹αž“αžΈαž˜αž½αž™αŸ—αž‘αžΆαŸ†αž„αž“αŸαŸ‡αž˜αžΆαž“αž‚αŸ„αž›αž”αŸ†αžŽαž„αžŠαŸ„αŸ‡αžŸαŸ’αžšαžΆαž™αž”αž‰αŸ’αž αžΆαž‡αžΆαž€αŸ‹αž›αžΆαž€αŸ‹αž˜αž½αž™αŸ” αž§αž‘αžΆαž αžšαžŽαŸ dplyr αž”αž„αŸ’αž€αžΎαžαž‘αžΎαž„αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαž‚αŸ’αžšαž”αŸ‹αž‚αŸ’αžšαž„αž‘αž·αž“αŸ’αž“αž“αŸαž™, tidyr αžŠαžΎαž˜αŸ’αž”αžΈαž“αžΆαŸ†αž™αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αŸ…αž‡αžΆαž‘αž˜αŸ’αžšαž„αŸ‹αžŸαŸ’αž’αžΆαž stringr αžŸαž˜αŸ’αžšαž½αž›αž€αžΆαžšαž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αžαŸ’αžŸαŸ‚αž’αž€αŸ’αžŸαžš αž“αž·αž„ ggplot2 αž‚αžΊαž‡αžΆαž§αž”αž€αžšαžŽαŸαž˜αžΎαž›αžƒαžΎαž‰αž‘αž·αž“αŸ’αž“αž“αŸαž™αžŠαŸαž–αŸαž‰αž“αž·αž™αž˜αž”αŸ†αž•αž»αžαž˜αž½αž™αŸ”

αž‚αž»αžŽαž”αŸ’αžšαž™αŸ„αž‡αž“αŸ tidyverse αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αž“αŸ’αž’αž—αžΆαž–αžŸαžΆαž˜αž‰αŸ’αž‰ αž“αž·αž„αž„αžΆαž™αžŸαŸ’αžšαž½αž›αž’αžΆαž“ αžŠαŸ‚αž›αž˜αžΆαž“αž›αž€αŸ’αžαžŽαŸˆαžŸαŸ’αžšαžŠαŸ€αž„αž“αžΉαž„αž—αžΆαžŸαžΆαžŸαŸ†αžŽαž½αžš SQL αŸ”

αžαžΆαžšαžΆαž„αž‘αž·αž“αŸ’αž“αž“αŸαž™

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰αžœαŸαž”αžŸαžΆαž™αž•αŸ’αž›αžΌαžœαž€αžΆαžš: r-datatable.com

αžŠαŸ„αž™ data.table αž‚αžΊ Matt Dole αž“αŸƒ H2O.ai αŸ”

αž€αžΆαžšαž…αŸαž‰αž•αŸ’αžŸαžΆαž™αž”αžŽαŸ’αžŽαžΆαž›αŸαž™αžŠαŸ†αž”αžΌαž„αž”αžΆαž“αž’αŸ’αžœαžΎαž‘αžΎαž„αž“αŸ…αž†αŸ’αž“αžΆαŸ† 2006 αŸ”

αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž€αž‰αŸ’αž…αž”αŸ‹αž˜αž·αž“αž„αžΆαž™αžŸαŸ’αžšαž½αž›αžŠαžΌαž…αž“αŸ…αž€αŸ’αž“αž»αž„ tidyverse αž αžΎαž™β€‹αž˜αžΆαž“β€‹αž€αžΆαžšβ€‹αž…αž„αž…αžΆαŸ†β€‹αž…αŸ’αžšαžΎαž“β€‹αž‡αžΆαž„β€‹αž“αŸƒβ€‹αžŸαŸŠαž»αž˜β€‹αž‘αž·αž“αŸ’αž“αž“αŸαž™β€‹αž”αž»αžšαžΆαžŽβ€‹αž€αŸ’αž“αž»αž„ R αž”αŸ‰αž»αž“αŸ’αžαŸ‚β€‹αž“αŸ…β€‹αž–αŸαž›β€‹αž‡αžΆαž˜αž½αž™β€‹αž‚αŸ’αž“αžΆβ€‹αž“αŸαŸ‡β€‹αž”αžΆαž“β€‹αž–αž„αŸ’αžšαžΈαž€β€‹αž™αŸ‰αžΆαž„β€‹αžαŸ’αž›αžΆαŸ†αž„β€‹αž€αŸ’αž“αž»αž„β€‹αž˜αž»αžαž„αžΆαžšαŸ”

αž§αž”αžΆαž™αž€αž›αž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž‡αžΆαž˜αž½αž™αžαžΆαžšαžΆαž„αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹αž“αŸαŸ‡αžαŸ’αžšαžΌαžœαž”αžΆαž“αž–αž·αž–αžŽαŸŒαž“αžΆαž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸ αž αžΎαž™αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž”αž€αž”αŸ’αžšαŸ‚αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’ data.table αž“αŸ…αž€αŸ’αž“αž»αž„ SQL αž’αŸ’αž“αž€αž‘αž‘αž½αž›αž”αžΆαž“αž’αŸ’αžœαžΈαž˜αž½αž™αžŠαžΌαž…αž“αŸαŸ‡αŸ– data.table[ WHERE, SELECT, GROUP BY ]

αž—αžΆαž–αžαŸ’αž›αžΆαŸ†αž„αž“αŸƒαž€αž‰αŸ’αž…αž”αŸ‹αž“αŸαŸ‡αž‚αžΊαž›αŸ’αž”αžΏαž“αž“αŸƒαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™αžŠαŸαž’αŸ†αŸ”

αžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆ

αžœαŸαž”αžŸαžΆαž™αž•αŸ’αž›αžΌαžœαž€αžΆαžš: pandas.pydata.org αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αžˆαŸ’αž˜αŸ„αŸ‡αž”αžŽαŸ’αžŽαžΆαž›αŸαž™αž”αžΆαž“αž˜αž€αž–αžΈαž–αžΆαž€αŸ’αž™αžŸαŸαžŠαŸ’αž‹αž€αž·αž…αŸ’αž… "αž‘αž·αž“αŸ’αž“αž“αŸαž™αž”αž“αŸ’αž‘αŸ‡" αžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŠαžΎαž˜αŸ’αž”αžΈαž–αž·αž–αžŽαŸŒαž“αžΆαž’αŸ†αž–αžΈαžŸαŸ†αžŽαž»αŸ†αž–αŸαžαŸŒαž˜αžΆαž“αžŠαŸ‚αž›αž˜αžΆαž“αžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž–αž αž»αžœαž·αž˜αžΆαžαŸ’αžšαŸ”

αžŠαŸ„αž™ pandas αž‚αžΊαž‡αž“αž‡αžΆαžαž·αž’αžΆαž˜αŸαžšαž·αž€ Wes McKinney αŸ”

αž“αŸ…αž–αŸαž›αžŠαŸ‚αž›αžœαžΆαž˜αž€αžŠαž›αŸ‹αž€αžΆαžšαžœαž·αž—αžΆαž‚αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„ Python αžŸαŸ’αž˜αžΎ pandas αž‘αŸ αž€αž‰αŸ’αž…αž”αŸ‹αž–αž αž»αž˜αž»αžαž„αžΆαžšαž€αž˜αŸ’αžšαž·αžαžαŸ’αž–αžŸαŸ‹αžŠαŸ‚αž›αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αž’αž“αž»αžœαžαŸ’αžαž€αžΆαžšαž…αžΆαžαŸ‹αž…αŸ‚αž„αžŽαžΆαž˜αž½αž™αž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ αž…αžΆαž”αŸ‹αž–αžΈαž€αžΆαžšαž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž–αžΈαž”αŸ’αžšαž—αž–αžŽαžΆαž˜αž½αž™αžšαž αžΌαžαžŠαž›αŸ‹αž€αžΆαžšαž˜αžΎαž›αžƒαžΎαž‰αžœαžΆαŸ”

αž€αžΆαžšαžŠαŸ†αž‘αžΎαž„αž€αž‰αŸ’αž…αž”αŸ‹αž”αž“αŸ’αžαŸ‚αž˜

αž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž”αžΆαž“αž–αž·αž—αžΆαž€αŸ’αžŸαžΆαž“αŸ…αž€αŸ’αž“αž»αž„αž’αžαŸ’αžαž”αž‘αž“αŸαŸ‡αž˜αž·αž“αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαž½αž˜αž”αž‰αŸ’αž…αžΌαž›αž“αŸ…αž€αŸ’αž“αž»αž„αž€αžΆαžšαž…αŸ‚αž€αž…αžΆαž™ R αž“αž·αž„ Python αž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“αž‘αŸαŸ” αž‘αŸ„αŸ‡αž”αžΈαž‡αžΆαž˜αžΆαž“αž€αžΆαžšαž–αŸ’αžšαž˜αžΆαž“αžαžΌαž…αž˜αž½αž™αž€αŸαžŠαŸ„αž™αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž”αžΆαž“αžŠαŸ†αž‘αžΎαž„αž€αžΆαžšαž…αŸ‚αž€αž…αžΆαž™ Anaconda αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αžŠαŸ†αž‘αžΎαž„αž”αž“αŸ’αžαŸ‚αž˜ pandas αž˜αž·αž“β€‹αžαŸ’αžšαžΌαžœαž€αžΆαžšαŸ”

αž€αžΆαžšαžŠαŸ†αž‘αžΎαž„αž€αž‰αŸ’αž…αž”αŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„ R

αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž”αžΆαž“αž”αžΎαž€αž”αžšαž·αž™αžΆαž€αžΆαžŸαž’αž—αž·αžœαžŒαŸ’αžαž“αŸ RStudio αž™αŸ‰αžΆαž„αž αŸ„αž…αžŽαžΆαžŸαŸ‹αž˜αŸ’αžαž„ αž’αŸ’αž“αž€αž”αŸ’αžšαž αŸ‚αž›αž‡αžΆαžŠαžΉαž„αž–αžΈαžšαž”αŸ€αž”αžŠαŸ†αž‘αžΎαž„αž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž€αžΆαžšαž“αŸ…αž€αŸ’αž“αž»αž„ RαŸ” αžŠαžΎαž˜αŸ’αž”αžΈαžŠαŸ†αž‘αžΎαž„αž€αž‰αŸ’αž…αž”αŸ‹ αžŸαžΌαž˜αž”αŸ’αžšαžΎαž–αžΆαž€αŸ’αž™αž”αž‰αŸ’αž‡αžΆαžŸαŸ’αžαž„αŸ‹αžŠαžΆαžš install.packages() αžŠαŸ„αž™αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαžœαžΆαžŠαŸ„αž™αž•αŸ’αž‘αžΆαž›αŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„ R αžαŸ’αž›αž½αž“αžœαžΆαž•αŸ’αž‘αžΆαž›αŸ‹αŸ”

# установка ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ²
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")

αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž–αžΈαžŠαŸ†αž‘αžΎαž„αžšαž½αž… αž€αž‰αŸ’αž…αž”αŸ‹αžαŸ’αžšαžΌαžœαž—αŸ’αž‡αžΆαž”αŸ‹ αžŠαŸ‚αž›αž€αŸ’αž“αž»αž„αž€αžšαžŽαžΈαž—αžΆαž‚αž…αŸ’αžšαžΎαž“ αž–αžΆαž€αŸ’αž™αž”αž‰αŸ’αž‡αžΆαžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαž”αŸ’αžšαžΆαžŸαŸ‹ library().

# ΠΏΠΎΠ΄ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΈΠ»ΠΈ ΠΈΠΌΠΏΠΎΡ€Ρ‚ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² Π² Ρ€Π°Π±ΠΎΡ‡Π΅Π΅ ΠΎΠΊΡ€ΡƒΠΆΠ΅Π½ΠΈΠ΅
library(vroom)
library(readr)
library(dplyr)
library(data.table)

αž€αžΆαžšαžŠαŸ†αž‘αžΎαž„αž€αž‰αŸ’αž…αž”αŸ‹αž“αŸ…αž€αŸ’αž“αž»αž„ Python

αžŠαžΌαž…αŸ’αž“αŸαŸ‡αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž”αžΆαž“αžŠαŸ†αž‘αžΎαž„ Python αžŸαž»αž‘αŸ’αž’αž“αŸ„αŸ‡ αž’αž‰αŸ’αž…αžΉαž„ pandas αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαžŠαŸ†αž‘αžΎαž„αžœαžΆαžŠαŸ„αž™αžŠαŸƒαŸ” αž”αžΎαž€αž”αž“αŸ’αž‘αžΆαžαŸ‹αž–αžΆαž€αŸ’αž™αž”αž‰αŸ’αž‡αžΆ αž¬αžŸαŸ’αžαžΆαž“αžΈαž™ αž’αžΆαžŸαŸ’αžšαŸαž™αž›αžΎαž”αŸ’αžšαž–αŸαž“αŸ’αž’αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžšαž”αžŸαŸ‹αž’αŸ’αž“αž€ αž αžΎαž™αž”αž‰αŸ’αž…αžΌαž›αž–αžΆαž€αŸ’αž™αž”αž‰αŸ’αž‡αžΆαžαžΆαž„αž€αŸ’αžšαŸ„αž˜αŸ”

pip install pandas

αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αž™αžΎαž„αžαŸ’αžšαž›αž”αŸ‹αž‘αŸ… Python αž αžΎαž™αž“αžΆαŸ†αž…αžΌαž›αž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž”αžΆαž“αžŠαŸ†αž‘αžΎαž„αžŠαŸ„αž™αž”αŸ’αžšαžΎαž–αžΆαž€αŸ’αž™αž”αž‰αŸ’αž‡αžΆ import.

import pandas as pd

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™

αž€αžΆαžšαž‡αžΈαž€αž™αž€αžšαŸ‰αŸ‚αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‚αžΊαž‡αžΆαž‡αŸ†αž αžΆαž“αžŠαŸαžŸαŸ†αžαžΆαž“αŸ‹αž”αŸ†αž•αž»αžαž˜αž½αž™αž€αŸ’αž“αž»αž„αž€αžΆαžšαžœαž·αž—αžΆαž‚αž‘αž·αž“αŸ’αž“αž“αŸαž™αŸ” αž‘αžΆαŸ†αž„ Python αž“αž·αž„ R αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž…αž„αŸ‹αž”αžΆαž“ αž•αŸ’αžαž›αŸ‹αž±αŸ’αž™αž’αŸ’αž“αž€αž“αžΌαžœαž±αž€αžΆαžŸαž™αŸ‰αžΆαž„αž‘αžΌαž›αŸ†αž‘αžΌαž›αžΆαž™αž€αŸ’αž“αž»αž„αž€αžΆαžšαž‘αž‘αž½αž›αž”αžΆαž“αž‘αž·αž“αŸ’αž“αž“αŸαž™αž–αžΈαž”αŸ’αžšαž—αž–αžŽαžΆαž˜αž½αž™αŸ– αž―αž€αžŸαžΆαžšαž€αŸ’αž“αž»αž„αžŸαŸ’αžšαž»αž€ αž―αž€αžŸαžΆαžšαž–αžΈαž’αŸŠαžΈαž“αž’αžΊαžŽαž·αž αž‚αŸαž αž‘αŸ†αž–αŸαžš αž‚αŸ’αžšαž”αŸ‹αž”αŸ’αžšαž—αŸαž‘αž“αŸƒαž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“αž‘αž·αž“αŸ’αž“αž“αŸαž™αŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αž–αŸαž‰αž˜αž½αž™αž’αžαŸ’αžαž”αž‘ αž™αžΎαž„αž“αžΉαž„αž”αŸ’αžšαžΎαžŸαŸ†αžŽαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‡αžΆαž…αŸ’αžšαžΎαž“αŸ–

  1. αž€αžΆαžšαž‘αžΆαž‰αž™αž€αž–αžΈαžšαž–αžΈ Google Analytics αŸ”
  2. αžŸαŸ†αžŽαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžšαž‘αžΈαžαžΆαž“αž·αž…αŸ”

αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž‚αžΊαž“αŸ…αž›αžΎαžšαž”αžŸαŸ‹αžαŸ’αž‰αž»αŸ† GitHub αž€αŸ’αž“αž»αž„αž‘αž˜αŸ’αžšαž„αŸ‹αž‡αžΆαž―αž€αžŸαžΆαžš csv αž“αž·αž„ tsv αŸ” αžαžΎαž™αžΎαž„αž“αžΉαž„αžŸαŸ’αž“αžΎαžŸαž»αŸ†αž–αž½αž€αž‚αŸαž–αžΈαžŽαžΆ?

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αŸ…αž€αŸ’αž“αž»αž„ R: tidyverse, vroom, readr

αžŠαžΎαž˜αŸ’αž”αžΈαž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αŸ…αž€αŸ’αž“αž»αž„αž”αžŽαŸ’αžŽαžΆαž›αŸαž™ tidyverse αž˜αžΆαž“αž–αžΈαžšαž€αž‰αŸ’αž…αž”αŸ‹αŸ– vroom, readr. vroom αž‘αŸ†αž“αžΎαž”αž‡αžΆαž„αž˜αž»αž“ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž“αŸ…αž–αŸαž›αž’αž“αžΆαž‚αž αž€αž‰αŸ’αž…αž”αŸ‹αž’αžΆαž…αž“αžΉαž„αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž‰αŸ’αž…αžΌαž›αž‚αŸ’αž“αžΆαŸ”

αžŠαž€αžŸαŸ’αžšαž„αŸ‹αž–αžΈ αž―αž€αžŸαžΆαžšαž•αŸ’αž›αžΌαžœαž€αžΆαžš vroom.

vroom αž‘αž›αŸ‹αž“αžΉαž„αž’αŸ’αž“αž€αž’αžΆαž“
αžαžΎαž€αžΆαžšαž…αŸαž‰αž•αŸ’αžŸαžΆαž™αž’αŸ’αžœαžΈ vroom αž˜αžΆαž“αž“αŸαž™αžŸαž˜αŸ’αžšαžΆαž”αŸ‹ readr? αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž–αŸαž›αž“αŸαŸ‡ αž™αžΎαž„αž˜αžΆαž“αž‚αž˜αŸ’αžšαŸ„αž„αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž€αž‰αŸ’αž…αž”αŸ‹αž‘αžΆαŸ†αž„αž–αžΈαžšαžœαž·αžœαžŒαŸ’αžαž“αŸαžŠαŸ„αž™αž‘αŸ‚αž€αž–αžΈαž‚αŸ’αž“αžΆ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž‘αŸ†αž“αž„αž‡αžΆαž™αžΎαž„αž“αžΉαž„αž”αž„αŸ’αžšαž½αž”αž”αž„αŸ’αžšαž½αž˜αž€αž‰αŸ’αž…αž”αŸ‹αž“αžΆαž–αŸαž›αž’αž“αžΆαž‚αžαŸ” αž‚αž»αžŽαžœαž·αž”αžαŸ’αžαž·αž˜αž½αž™αž…αŸ†αž–αŸ„αŸ‡αž€αžΆαžšαž’αžΆαž“αžŠαŸαžαŸ’αž‡αž·αž›αžšαž”αžŸαŸ‹ vroom αž‚αžΊαž”αž‰αŸ’αž αžΆαž‘αž·αž“αŸ’αž“αž“αŸαž™αž˜αž½αž™αž…αŸ†αž“αž½αž“αž˜αž·αž“αž’αžΆαž…αžšαžΆαž™αž€αžΆαžšαžŽαŸαž‡αžΆαž˜αž»αž“αž”αžΆαž“αž‘αŸ αžŠαžΌαž…αŸ’αž“αŸαŸ‡αžœαž·αž’αžΈαžŠαŸ‚αž›αž›αŸ’αž’αž”αŸ†αž•αž»αžαž€αŸ’αž“αž»αž„αž€αžΆαžšαž”αž„αŸ’αžšαž½αž”αž”αž„αŸ’αžšαž½αž˜αž–αž½αž€αžœαžΆαžαž˜αŸ’αžšαžΌαžœαž±αŸ’αž™αž˜αžΆαž“αž€αžΆαžšαž‚αž·αžαžαŸ’αž›αŸ‡αŸ—αŸ”

vroom αž‘αž›αŸ‹αž“αžΉαž„αž’αŸ’αž“αž€αž’αžΆαž“
αžαžΎαž€αžΆαžšαžŠαŸ„αŸ‡αž›αŸ‚αž„αž˜αžΆαž“αž“αŸαž™αž™αŸ‰αžΆαž„αžŽαžΆ? vroom αžŸαž˜αŸ’αžšαžΆαž”αŸ‹ readr? αž“αŸ…αž–αŸαž›αž“αŸαŸ‡ αž™αžΎαž„αž˜αžΆαž“αž‚αž˜αŸ’αžšαŸ„αž„αž’αž—αž·αžœαžŒαŸ’αžαž€αž‰αŸ’αž…αž”αŸ‹αž‘αžΆαŸ†αž„αž–αžΈαžšαžŠαŸ„αž™αž‘αŸ‚αž€αž–αžΈαž‚αŸ’αž“αžΆ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž™αžΎαž„αž”αŸ’αžšαž αŸ‚αž›αž‡αžΆαž“αžΉαž„αž”αž‰αŸ’αž…αžΌαž›αž‚αŸ’αž“αžΆαž“αŸ…αž–αŸαž›αž’αž“αžΆαž‚αžαŸ” αž‚αž»αžŽαžœαž·αž”αžαŸ’αžαž·αž˜αž½αž™αž“αŸƒαž—αžΆαž–αžαŸ’αž‡αž·αž›αž’αžΆαž“ vroom αž‚αžΊαžαžΆαž”αž‰αŸ’αž αžΆαž˜αž½αž™αž…αŸ†αž“αž½αž“αž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™αž˜αž·αž“αž’αžΆαž…αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαžΆαž™αž€αžΆαžšαžŽαŸαž‡αžΆαž˜αž»αž“αž‘αŸ αžŠαžΌαž…αŸ’αž“αŸαŸ‡αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž‚αž·αžαž’αŸ†αž–αžΈαžšαž”αŸ€αž”αžŠαŸ‚αž›αž›αŸ’αž’αž”αŸ†αž•αž»αžαž€αŸ’αž“αž»αž„αž€αžΆαžšαž•αŸ’αžŸαŸ†αž–αž½αž€αžœαžΆαŸ”

αž“αŸ…αž€αŸ’αž“αž»αž„αž’αžαŸ’αžαž”αž‘αž“αŸαŸ‡ αž™αžΎαž„αž“αžΉαž„αž–αž·αž“αž·αžαŸ’αž™αž˜αžΎαž›αž€αž‰αŸ’αž…αž”αŸ‹αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αžΆαŸ†αž„αž–αžΈαžšαŸ–

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹ R: vroom

# install.packages("vroom")
library(vroom)

# Π§Ρ‚Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…
## vroom
ga_nov  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αŸ…αž€αŸ’αž“αž»αž„ R: readr

# install.packages("readr")
library(readr)

# Π§Ρ‚Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…
## readr
ga_nov  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

αž“αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹ vroomαžŠαŸ„αž™αž˜αž·αž“αž‚αž·αžαž–αžΈαž‘αž˜αŸ’αžšαž„αŸ‹αž‘αž·αž“αŸ’αž“αž“αŸαž™ csv / tsv αž€αžΆαžšαž•αŸ’αž‘αž»αž€αžαŸ’αžšαžΌαžœαž”αžΆαž“αž’αž“αž»αžœαžαŸ’αžαžŠαŸ„αž™αž˜αž»αžαž„αžΆαžšαž“αŸƒαžˆαŸ’αž˜αŸ„αŸ‡αžŠαžΌαž…αž‚αŸ’αž“αžΆ vroom(), αž“αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹ readr αž™αžΎαž„αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžšαž•αŸ’αžŸαŸαž„αž‚αŸ’αž“αžΆαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž‘αž˜αŸ’αžšαž„αŸ‹αž“αžΈαž˜αž½αž™αŸ— read_tsv() ΠΈ read_csv().

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αŸ…αž€αŸ’αž“αž»αž„ R: data.table

Π’ data.table αž˜αžΆαž“αž˜αž»αžαž„αžΆαžšαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™ fread().

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹ R: data.table

# install.packages("data.table")
library(data.table)

## data.table
ga_nov  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž™αžΎαž„αž”αŸ’αžšαŸ€αž”αž’αŸ€αž”αž‡αžΆαž˜αž½αž™αž€αž‰αŸ’αž…αž”αŸ‹ R αž“αŸ„αŸ‡αž€αŸ’αž“αž»αž„αž€αžšαžŽαžΈαž“αŸαŸ‡αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž‚αžΊαž“αŸ…αž‡αž·αžαž”αŸ†αž•αž»αžαŸ” pandas αž“αžΉαž„αž˜αžΆαž“ readr, αžŠαŸ„αž™αžŸαžΆαžšαžαŸ‚ pandas αž’αžΆαž…αžŸαŸ’αž“αžΎαžŸαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™αž–αžΈαž‚αŸ’αžšαž”αŸ‹αž‘αž·αžŸαž‘αžΈ αž αžΎαž™αž˜αžΆαž“αž˜αž»αžαž„αžΆαžšαž‚αŸ’αžšαž½αžŸαžΆαžšαž‘αžΆαŸ†αž„αž˜αžΌαž›αž“αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹αž“αŸαŸ‡αŸ” read_*().

  • read_csv()
  • read_excel()
  • read_sql()
  • read_json()
  • read_html()

αž“αž·αž„αž˜αž»αžαž„αžΆαžšαž‡αžΆαž…αŸ’αžšαžΎαž“αž‘αŸ€αžαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαž…αž“αžΆαž‘αžΎαž„αžŠαžΎαž˜αŸ’αž”αžΈαž’αžΆαž“αž‘αž·αž“αŸ’αž“αž“αŸαž™αž–αžΈαž‘αž˜αŸ’αžšαž„αŸ‹αž•αŸ’αžŸαŸαž„αŸ—αŸ” αž”αŸ‰αž»αž“αŸ’αžαŸ‚αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž‚αŸ„αž›αž”αŸ†αžŽαž„αžšαž”αžŸαŸ‹αž™αžΎαž„αžœαžΆαž‚αŸ’αžšαž”αŸ‹αž‚αŸ’αžšαžΆαž“αŸ‹αž αžΎαž™αŸ” read_table() ឬ read_csv() αžŠαŸ„αž™αž”αŸ’αžšαžΎαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ αž€αž‰αŸ’αž‰αžΆ αžŠαžΎαž˜αŸ’αž”αžΈαž”αž‰αŸ’αž‡αžΆαž€αŸ‹αžŸαž‰αŸ’αž‰αžΆαž”αŸ†αž”αŸ‚αž€αž‡αž½αžšαžˆαžšαŸ”

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

import pandas as pd

ga_nov  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαžαžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™

តុ αž‘αž·αž…αž“αž·αž€αžŠαŸ‚αž›αž™αžΎαž„αž•αŸ’αž‘αž»αž€αž˜αžΆαž“αžœαžΆαž›αž˜αž½αž™αŸ” αž€αžΆαžšαžšαž½αž˜αž—αŸαž‘αžŠαŸ‚αž›αžšαž€αŸ’αžŸαžΆαž‘αž»αž€αž’αžαŸ’αžαžŸαž‰αŸ’αž‰αžΆαžŽαž™αŸαž“αžŒαŸαžšαžšαž”αžŸαŸ‹αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžšαŸ”

αž”αŸ‰αž»αž“αŸ’αžαŸ‚αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαž”αž„αŸ’αž αžΆαž‰αž€αžΆαž“αŸ‹αžαŸ‚αž„αžΆαž™αžŸαŸ’αžšαž½αž›αž“αŸƒαž‘αž·αž“αŸ’αž“αž“αŸαž™αž‘αžΆαž€αŸ‹αž‘αž„αž“αžΉαž„αž—αŸαž‘αžšαž”αžŸαŸ‹αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžš αž’αŸ’αž“αž€αž‚αž½αžšαžαŸ‚αž”αŸ’αžšαžΎαžˆαŸ’αž˜αŸ„αŸ‡αž‡αžΆαž‡αžΆαž„αž›αŸαžαž€αžΌαžŠαž—αŸαž‘αŸ”

αžŠαžΎαž˜αŸ’αž”αžΈαž’αŸ’αžœαžΎαžŠαžΌαž…αŸ’αž“αŸαŸ‡ αž™αžΎαž„αž“αžΉαž„αž”αž„αŸ’αž€αžΎαžαžαžαžαžΌαž…αž˜αž½αž™ αžαžΆαžšαžΆαž„αžŠαŸ‚αž›αž“αžΉαž„αž˜αžΆαž“αžαŸ’αžšαžΉαž˜αžαŸ‚ 2 αž‡αž½αžš (αž€αžΌαžŠ αž“αž·αž„αžˆαŸ’αž˜αŸ„αŸ‡αž—αŸαž‘) αž“αž·αž„ 2 αž‡αž½αžšαžšαŸ€αž„αž‚αŸ’αž“αžΆαŸ”

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαž dataframe αž€αŸ’αž“αž»αž„ R: tidyverse, dplyr

αž€αŸ’αž“αž»αž„αž§αž‘αžΆαž αžšαžŽαŸαž€αžΌαžŠαžαžΆαž„αž€αŸ’αžšαŸ„αž˜ αž™αžΎαž„αž”αž„αŸ’αž€αžΎαž dataframe αžŠαŸ‚αž›αž…αž„αŸ‹αž”αžΆαž“αžŠαŸ„αž™αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš tibble() .

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαž Dataframe αž€αŸ’αž“αž»αž„ R: dplyr

## dplyr
### создаём справочник
gender <- tibble(id = c(1, 2),
                 gender = c("female", "male"))

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαž dataframe αž€αŸ’αž“αž»αž„ R: data.table

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαž dataframe αž€αŸ’αž“αž»αž„ R: data.table

## data.table
### создаём справочник
gender <- data.table(id = c(1, 2),
                    gender = c("female", "male"))

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαž Dataframe αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

Π’ pandas αž€αžΆαžšαž”αž„αŸ’αž€αžΎαžαžŸαŸŠαž»αž˜αžαŸ’αžšαžΌαžœαž”αžΆαž“αž’αž“αž»αžœαžαŸ’αžαž€αŸ’αž“αž»αž„αžŠαŸ†αžŽαžΆαž€αŸ‹αž€αžΆαž›αž‡αžΆαž…αŸ’αžšαžΎαž“ αžŠαŸ„αž™αžŠαŸ†αž”αžΌαž„αž™αžΎαž„αž”αž„αŸ’αž€αžΎαžαžœαž…αž“αžΆαž“αž»αž€αŸ’αžšαž˜ αž αžΎαž™αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αž™αžΎαž„αž”αž˜αŸ’αž›αŸ‚αž„αžœαž…αž“αžΆαž“αž»αž€αŸ’αžšαž˜αž‘αŸ…αž‡αžΆαžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™αŸ”

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαž Dataframe αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

# создаём Π΄Π°Ρ‚Π° Ρ„Ρ€Π΅ΠΉΠΌ
gender_dict = {'id': [1, 2],
               'gender': ["female", "male"]}
# ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ΅ΠΌ ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ Π² Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ
gender = pd.DataFrame.from_dict(gender_dict)

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžš

αžαžΆαžšαžΆαž„αžŠαŸ‚αž›αž’αŸ’αž“αž€αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž’αžΆαž…αž˜αžΆαž“αž‘αž·αž“αŸ’αž“αž“αŸαž™αžšαžΆαž”αŸ‹αžŸαž·αž” αž¬αžšαžΆαž”αŸ‹αžšαž™αž‡αž½αžšαŸ” αž”αŸ‰αž»αž“αŸ’αžαŸ‚αžŠαžΎαž˜αŸ’αž”αžΈαž’αž“αž»αžœαžαŸ’αžαž€αžΆαžšαžœαž·αž—αžΆαž‚αž‡αžΆαž€αŸ’αž”αž½αž“αž’αŸ’αž“αž€αž˜αž·αž“αžαŸ’αžšαžΌαžœαž€αžΆαžšαž‡αž½αžšαžˆαžšαž‘αžΆαŸ†αž„αž’αžŸαŸ‹αžŠαŸ‚αž›αž˜αžΆαž“αž“αŸ…αž€αŸ’αž“αž»αž„αžαžΆαžšαžΆαž„αž”αŸ’αžšαž—αž–αž‘αŸαŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αžŠαžΌαž…αŸ’αž“αŸαŸ‡ αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžŠαŸ†αž”αžΌαž„αž˜αž½αž™αžŠαŸ‚αž›αž’αŸ’αž“αž€αž“αžΉαž„αž’αž“αž»αžœαžαŸ’αžαž‡αžΆαž˜αž½αž™αžαžΆαžšαžΆαž„αž”αŸ’αžšαž—αž–αž‚αžΊαžŠαžΎαž˜αŸ’αž”αžΈαž‡αž˜αŸ’αžšαŸ‡αžœαžΆαž–αžΈαž–αŸαžαŸŒαž˜αžΆαž“αžŠαŸ‚αž›αž˜αž·αž“αž…αžΆαŸ†αž”αžΆαž…αŸ‹ αž“αž·αž„αž”αž„αŸ’αž€αžΎαž“αž’αž„αŸ’αž‚αž…αž„αž…αžΆαŸ†αžŠαŸ‚αž›αž–αŸαžαŸŒαž˜αžΆαž“αž“αŸαŸ‡αž€αžΆαž“αŸ‹αž€αžΆαž”αŸ‹αŸ”

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž€αŸ’αž“αž»αž„ R: tidyverse, dplyr

αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’ dplyr αž‚αžΊαžŸαŸ’αžšαžŠαŸ€αž„αž‘αŸ…αž“αžΉαž„αž—αžΆαžŸαžΆαžŸαŸ†αžŽαž½αžš SQL αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αžŸαŸ’αž‚αžΆαž›αŸ‹αžœαžΆ αž’αŸ’αž“αž€αž“αžΉαž„αž’αŸ’αžœαžΎαž‡αžΆαž˜αŸ’αž…αžΆαžŸαŸ‹αž€αž‰αŸ’αž…αž”αŸ‹αž“αŸαŸ‡αž™αŸ‰αžΆαž„αž†αžΆαž”αŸ‹αžšαž αŸαžŸαŸ”

αžŠαžΎαž˜αŸ’αž”αžΈαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžš αžŸαžΌαž˜αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš select().

αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αž“αŸαŸ‡αž‡αžΆαž§αž‘αžΆαž αžšαžŽαŸαž“αŸƒαž€αžΌαžŠαžŠαŸ‚αž›αž’αŸ’αž“αž€αž’αžΆαž…αž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαžαžΆαž˜αžœαž·αž’αžΈαžŠαžΌαž…αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αŸˆ

  • αžšαžΆαž™αžˆαŸ’αž˜αŸ„αŸ‡αž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž€αžΆαžš
  • αž™αŸ„αž„αž‘αŸ…αžˆαŸ’αž˜αŸ„αŸ‡αž‡αž½αžšαžˆαžšαžŠαŸ„αž™αž”αŸ’αžšαžΎαž€αž“αŸ’αžŸαŸ„αž˜αž’αž˜αŸ’αž˜αžαžΆαŸ”
  • αžαžΆαž˜αž”αŸ’αžšαž—αŸαž‘αž‘αž·αž“αŸ’αž“αž“αŸαž™ αž¬αž‘αŸ’αžšαž–αŸ’αž™αžŸαž˜αŸ’αž”αžαŸ’αžαž·αž•αŸ’αžŸαŸαž„αž‘αŸ€αžαž“αŸƒαž‘αž·αž“αŸ’αž“αž“αŸαž™αžŠαŸ‚αž›αž˜αžΆαž“αž€αŸ’αž“αž»αž„αž‡αž½αžšαžˆαžš

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž€αŸ’αž“αž»αž„ R: dplyr

# Π’Ρ‹Π±ΠΎΡ€ Π½ΡƒΠΆΠ½Ρ‹Ρ… столбцов
## dplyr
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ названию столбцов
select(ga_nov, date, source, sessions)
### ΠΈΡΠΊΠ»ΡŽΡ‡ΡŒ ΠΏΠΎ названию столбцов
select(ga_nov, -medium, -bounces)
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ рСгулярному Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ, стобцы ΠΈΠΌΠ΅Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π·Π°ΠΊΠ°Π½Ρ‡ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π½Π° s
select(ga_nov, matches("s$"))
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ, Π²Ρ‹Π±ΠΈΡ€Π°Π΅ΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ цСлочислСнныС столбцы
select_if(ga_nov, is.integer)

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž€αŸ’αž“αž»αž„ R: data.table

αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžŠαžΌαž…αž‚αŸ’αž“αžΆαž“αŸ…αž€αŸ’αž“αž»αž„ data.table αžαŸ’αžšαžΌαžœβ€‹αž”αžΆαž“β€‹αž’αž“αž»αžœαžαŸ’αžβ€‹αžαž»αžŸβ€‹αž‚αŸ’αž“αžΆβ€‹αž”αž“αŸ’αžαž·αž… αž“αŸ…β€‹αžŠαžΎαž˜β€‹αž’αžαŸ’αžαž”αž‘β€‹αžŠαŸ‚αž›β€‹αžαŸ’αž‰αž»αŸ†β€‹αž”αžΆαž“β€‹αž•αŸ’αžαž›αŸ‹β€‹αž€αžΆαžšβ€‹αž–αž·αž–αžŽαŸŒαž“αžΆβ€‹αž’αŸ†αž–αžΈβ€‹αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹β€‹αž’αŸ’αžœαžΈβ€‹αžŠαŸ‚αž›β€‹αž˜αžΆαž“β€‹αž“αŸ…β€‹αž€αŸ’αž“αž»αž„β€‹αžαž„αŸ’αž€αŸ€αž”β€‹αž€αžΆαžšαŸ‰αŸβ€‹αž€αŸ’αž“αž»αž„ data.table.

DT[i,j,by]

αž“αŸ…αž‘αžΈαžŽαžΆ:
αžαŸ’αž‰αž»αŸ† - αž€αž“αŸ’αž›αŸ‚αž„αžŽαžΆ, i.e. αžαŸ’αžšαž„αžαžΆαž˜αž‡αž½αžš
j - αž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸ|αž’αŸ’αžœαžΎαž”αž…αŸ’αž…αž»αž”αŸ’αž”αž“αŸ’αž“αž—αžΆαž–|αž’αŸ’αžœαžΎ, i.e. αž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž“αž·αž„αž”αŸ†αž”αŸ’αž›αŸ‚αž„αž–αž½αž€αžœαžΆ
αžŠαŸ„αž™ - αž€αŸ’αžšαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž€αŸ’αž“αž»αž„ R: data.table

## data.table
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ названию столбцов
ga_nov[ , .(date, source, sessions) ]
### ΠΈΡΠΊΠ»ΡŽΡ‡ΡŒ ΠΏΠΎ названию столбцов
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ рСгулярному Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ
ga_nov[, .SD, .SDcols = patterns("s$")]

ធថេរ .SD αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αž…αžΌαž›αž”αŸ’αžšαžΎαž‡αž½αžšαžˆαžšαž‘αžΆαŸ†αž„αž’αžŸαŸ‹ αž“αž·αž„ .SDcols αžαŸ’αžšαž„αž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž€αžΆαžšαžŠαŸ„αž™αž”αŸ’αžšαžΎαž€αž“αŸ’αžŸαŸ„αž˜αž’αž˜αŸ’αž˜αžαžΆ αž¬αž˜αž»αžαž„αžΆαžšαž•αŸ’αžŸαŸαž„αž‘αŸ€αžαžŠαžΎαž˜αŸ’αž”αžΈαžαŸ’αžšαž„αžˆαŸ’αž˜αŸ„αŸ‡αž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž€αžΆαžšαŸ”

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž“αŸ…αž€αŸ’αž“αž»αž„ Python, pandas

αžŠαžΎαž˜αŸ’αž”αžΈαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαžαžΆαž˜αžˆαŸ’αž˜αŸ„αŸ‡αž€αŸ’αž“αž»αž„ pandas αžœαžΆαž‚αŸ’αžšαž”αŸ‹αž‚αŸ’αžšαžΆαž“αŸ‹αž€αŸ’αž“αž»αž„αž€αžΆαžšαž•αŸ’αžαž›αŸ‹αž”αž‰αŸ’αž‡αžΈαžˆαŸ’αž˜αŸ„αŸ‡αžšαž”αžŸαŸ‹αž–αž½αž€αž‚αŸαŸ” αž αžΎαž™αžŠαžΎαž˜αŸ’αž”αžΈαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸ αž¬αžŠαž€αž‡αž½αžšαžˆαžšαžαžΆαž˜αžˆαŸ’αž˜αŸ„αŸ‡αžŠαŸ„αž™αž”αŸ’αžšαžΎαž€αž“αŸ’αžŸαŸ„αž˜αž’αž˜αŸ’αž˜αžαžΆ αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš drop() ΠΈ filter(), αž“αž·αž„αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ αž’αŸαž€αŸ’αžŸ = 1αžŠαŸ‚αž›αž’αŸ’αž“αž€αž”αž„αŸ’αž αžΆαž‰αžαžΆαžœαžΆαž…αžΆαŸ†αž”αžΆαž…αŸ‹αžŠαžΎαž˜αŸ’αž”αžΈαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‡αž½αžšαžˆαžšαž‡αžΆαž‡αžΆαž„αž‡αž½αžšαžŠαŸαž€αŸ”

αžŠαžΎαž˜αŸ’αž”αžΈαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžœαžΆαž›αž˜αž½αž™αžαžΆαž˜αž”αŸ’αžšαž—αŸαž‘αž‘αž·αž“αŸ’αž“αž“αŸαž™ αžŸαžΌαž˜αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš select_dtypes()αž“αž·αž„αž“αŸ…αž€αŸ’αž“αž»αž„αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ αžšαž½αž˜αž”αž‰αŸ’αž…αžΌαž›αž‘αžΆαŸ†αž„ ឬ αžŠαž€αž…αŸαž‰ αž†αŸ’αž›αž„αž€αžΆαžαŸ‹αž”αž‰αŸ’αž‡αžΈαž“αŸƒαž”αŸ’αžšαž—αŸαž‘αž‘αž·αž“αŸ’αž“αž“αŸαž™αžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž“αžΉαž„αžœαžΆαž›αžŠαŸ‚αž›αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαŸ”

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

# Π’Ρ‹Π±ΠΎΡ€ ΠΏΠΎΠ»Π΅ΠΉ ΠΏΠΎ названию
ga_nov[['date', 'source', 'sessions']]
# Π˜ΡΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ ΠΏΠΎ названию
ga_nov.drop(['medium', 'bounces'], axis=1)
# Π’Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ рСгулярному Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ
ga_nov.filter(regex="s$", axis=1)
# Π’Ρ‹Π±Ρ€Π°Ρ‚ΡŒ числовыС поля
ga_nov.select_dtypes(include=['number'])
# Π’Ρ‹Π±Ρ€Π°Ρ‚ΡŒ тСкстовыС поля
ga_nov.select_dtypes(include=['object'])

αžαŸ’αžšαž„αž‡αž½αžš

αž§αž‘αžΆαž αžšαžŽαŸ αžαžΆαžšαžΆαž„αž”αŸ’αžšαž—αž–αž’αžΆαž…αž˜αžΆαž“αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‡αžΆαž…αŸ’αžšαžΎαž“αž†αŸ’αž“αžΆαŸ† αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž’αŸ’αž“αž€αž‚αŸ’αžšαžΆαž“αŸ‹αžαŸ‚αžαŸ’αžšαžΌαžœαžœαž·αž—αžΆαž‚αžαŸ‚αž…αž»αž„αž€αŸ’αžšαŸ„αž™αž”αŸ‰αž»αžŽαŸ’αžŽαŸ„αŸ‡αŸ” αž‡αžΆαžαŸ’αž˜αžΈαž˜αŸ’αžαž„αž‘αŸ€αž αž”αž“αŸ’αž‘αžΆαžαŸ‹αž”αž“αŸ’αžαŸ‚αž˜αž“αžΉαž„αž”αž“αŸ’αžαž™αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™ αž“αž·αž„αžŸαŸ’αž‘αŸ‡αž’αž„αŸ’αž‚αž…αž„αž…αžΆαŸ†αž€αž»αŸ†αž–αŸ’αž™αžΌαž‘αŸαžšαŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αžαž˜αŸ’αžšαž„αž‡αž½αžšαž€αŸ’αž“αž»αž„ R: tydyverse, dplyr

Π’ dplyr αž˜αž»αžαž„αžΆαžšαž“αŸαŸ‡αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŠαžΎαž˜αŸ’αž”αžΈαžαŸ’αžšαž„αž‡αž½αžš filter(). αžœαžΆαž™αž€αžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‡αžΆαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžŠαŸ†αž”αžΌαž„ αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αž’αŸ’αž“αž€αžšαžΆαž™αž”αž‰αŸ’αž‡αžΈαž›αž€αŸ’αžαžαžŽαŸ’αžŒαžαž˜αŸ’αžšαž„αŸ”

αž“αŸ…αž–αŸαž›αžŸαžšαžŸαŸαžšαž€αž“αŸ’αžŸαŸ„αž˜αž‘αžΌαž‡αžΈαžαž›αžŠαžΎαž˜αŸ’αž”αžΈαžαŸ’αžšαž„αžαžΆαžšαžΆαž„ αž€αŸ’αž“αž»αž„αž€αžšαžŽαžΈαž“αŸαŸ‡ αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αžˆαŸ’αž˜αŸ„αŸ‡αž‡αž½αžšαžˆαžšαžŠαŸ„αž™αž‚αŸ’αž˜αžΆαž“αžŸαž‰αŸ’αž‰αžΆαžŸαž˜αŸ’αžšαž„αŸ‹ αž“αž·αž„αžŠαŸ„αž™αž˜αž·αž“αž”αŸ’αžšαž€αžΆαžŸαžˆαŸ’αž˜αŸ„αŸ‡αžαžΆαžšαžΆαž„αŸ”

αž“αŸ…αž–αŸαž›αž”αŸ’αžšαžΎαž€αž“αŸ’αžŸαŸ„αž˜αž‘αžΌαž‡αžΈαžαž›αž…αŸ’αžšαžΎαž“αžŠαžΎαž˜αŸ’αž”αžΈαžαŸ’αžšαž„ αžŸαžΌαž˜αž”αŸ’αžšαžΎαžŸαž‰αŸ’αž‰αžΆαž”αŸ’αžšαž˜αžΆαžŽαžœαž·αž’αžΈαžαžΆαž„αž€αŸ’αžšαŸ„αž˜αŸ–

  • & αž¬αžŸαž‰αŸ’αž‰αžΆαž€αŸ’αž”αŸ€αžŸ - αž‘αžΌαž‡αžΈαžαž› AND
  • | - αž‘αžΌαž‡αžΈαžαž› OR

αžαž˜αŸ’αžšαž„αž‡αž½αžšαž€αŸ’αž“αž»αž„ R: dplyr

# Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк
## dplyr
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
filter(ga_nov, source == "google")
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈ
filter(ga_nov, source == "google" & sessions >= 10)
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈΠ»ΠΈ
filter(ga_nov, source == "google" | sessions >= 10)

αžαŸ’αžšαž„αž‡αž½αžšαž€αŸ’αž“αž»αž„ R: data.table

αžŠαžΌαž…αžŠαŸ‚αž›αžαŸ’αž‰αž»αŸ†αž”αžΆαž“αžŸαžšαžŸαŸαžšαžαžΆαž„αž›αžΎαžšαž½αž…αž αžΎαž™αž“αŸ…αž€αŸ’αž“αž»αž„ data.table αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž”αŸ†αž”αŸ’αž›αŸ‚αž„αž‘αž·αž“αŸ’αž“αž“αŸαž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αžšαž»αŸ†αž–αŸαž‘αŸ’αž’αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸαŸ”

DT[i,j,by]

αž“αŸ…αž‘αžΈαžŽαžΆ:
αžαŸ’αž‰αž»αŸ† - αž€αž“αŸ’αž›αŸ‚αž„αžŽαžΆ, i.e. αžαŸ’αžšαž„αžαžΆαž˜αž‡αž½αžš
j - αž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸ|αž’αŸ’αžœαžΎαž”αž…αŸ’αž…αž»αž”αŸ’αž”αž“αŸ’αž“αž—αžΆαž–|αž’αŸ’αžœαžΎ, i.e. αž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžšαž“αž·αž„αž”αŸ†αž”αŸ’αž›αŸ‚αž„αž–αž½αž€αžœαžΆ
αžŠαŸ„αž™ - αž€αŸ’αžšαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™

αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŠαžΎαž˜αŸ’αž”αžΈαžαŸ’αžšαž„αž‡αž½αžš iαžŠαŸ‚αž›αž˜αžΆαž“αž‘αžΈαžαžΆαŸ†αž„αžŠαŸ†αž”αžΌαž„αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸαŸ”

αž‡αž½αžšαžˆαžšαžαŸ’αžšαžΌαžœαž”αžΆαž“αž…αžΌαž›αž”αŸ’αžšαžΎαž€αŸ’αž“αž»αž„αž€αž“αŸ’αžŸαŸ„αž˜αž‘αžΌαž‡αžΈαžαž›αžŠαŸ„αž™αž‚αŸ’αž˜αžΆαž“αžŸαž‰αŸ’αž‰αžΆαžŸαž˜αŸ’αžšαž„αŸ‹ αž“αž·αž„αžŠαŸ„αž™αž˜αž·αž“αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αžˆαŸ’αž˜αŸ„αŸ‡αžαžΆαžšαžΆαž„αŸ”

αž€αž“αŸ’αžŸαŸ„αž˜αž‘αžΌαž‡αžΈαžαž›αž‚αžΊαž‘αžΆαž€αŸ‹αž‘αž„αž‚αŸ’αž“αžΆαž‘αŸ…αžœαž·αž‰αž‘αŸ…αž˜αž€αžαžΆαž˜αžšαž”αŸ€αž”αžŠαžΌαž…αž‚αŸ’αž“αžΆαž“αžΉαž„αž“αŸ…αž€αŸ’αž“αž»αž„ dplyr αžαžΆαž˜αžšαž™αŸˆαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžš & αž“αž·αž„ | αŸ”

αžαŸ’αžšαž„αž‡αž½αžšαž€αŸ’αž“αž»αž„ R: data.table

## data.table
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
ga_nov[source == "google"]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈ
ga_nov[source == "google" & sessions >= 10]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈΠ»ΠΈ
ga_nov[source == "google" | sessions >= 10]

αžαŸ’αžšαž„αžαŸ’αžŸαŸ‚αž’αž€αŸ’αžŸαžšαž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

αžαŸ’αžšαž„αžαžΆαž˜αž‡αž½αžšαž€αŸ’αž“αž»αž„ pandas αžŸαŸ’αžšαžŠαŸ€αž„αž“αžΉαž„αž€αžΆαžšαžαŸ’αžšαž„ data.tableαž αžΎαž™αžαŸ’αžšαžΌαžœαž”αžΆαž“αž’αŸ’αžœαžΎαž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸαŸ”

αž€αŸ’αž“αž»αž„β€‹αž€αžšαžŽαžΈβ€‹αž“αŸαŸ‡ αž€αžΆαžšβ€‹αž…αžΌαž›β€‹αž‘αŸ…β€‹αž€αžΆαž“αŸ‹β€‹αž‡αž½αžšβ€‹αžˆαžšβ€‹αžαŸ’αžšαžΌαžœβ€‹αž”αžΆαž“β€‹αž’αž“αž»αžœαžαŸ’αžβ€‹αž‡αžΆβ€‹αž…αžΆαŸ†αž”αžΆαž…αŸ‹β€‹αžŠαŸ„αž™β€‹αž€αžΆαžšβ€‹αž”αž„αŸ’αž αžΆαž‰β€‹αžˆαŸ’αž˜αŸ„αŸ‡β€‹αž“αŸƒ dataframe αž”αž“αŸ’αž‘αžΆαž”αŸ‹β€‹αž˜αž€β€‹αžˆαŸ’αž˜αŸ„αŸ‡β€‹αž‡αž½αžšβ€‹αžˆαžšβ€‹αž€αŸβ€‹αž’αžΆαž…β€‹αžαŸ’αžšαžΌαžœβ€‹αž”αžΆαž“β€‹αž”αž„αŸ’αž αžΆαž‰β€‹αž€αŸ’αž“αž»αž„β€‹αžŸαž‰αŸ’αž‰αžΆβ€‹αžŸαž˜αŸ’αžšαž„αŸ‹β€‹αž€αŸ’αž“αž»αž„β€‹αžαž„αŸ’αž€αŸ€αž”β€‹αž€αžΆαžšαŸ‰αŸ (αž§αž‘αžΆαž αžšαžŽαŸ df['col_name']) αž¬αžŠαŸ„αž™αž‚αŸ’αž˜αžΆαž“αžŸαž˜αŸ’αžšαž„αŸ‹αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž–αžΈαžšαž™αŸˆαž–αŸαž› (αž§αž‘αžΆαž αžšαžŽαŸ df.col_name).

αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž€αžΆαžšαžαŸ’αžšαž„ dataframe αžŠαŸ„αž™αž›αž€αŸ’αžαžαžŽαŸ’αžŒαž‡αžΆαž…αŸ’αžšαžΎαž“ αž›αž€αŸ’αžαžαžŽαŸ’αžŒαž“αžΈαž˜αž½αž™αŸ—αžαŸ’αžšαžΌαžœαžαŸ‚αžŠαžΆαž€αŸ‹αž€αŸ’αž“αž»αž„αžœαž„αŸ‹αž€αŸ’αžšαž…αž€αŸ” αž›αž€αŸ’αžαžαžŽαŸ’αžŒαž‘αžΌαž‡αžΈαžαž›αžαŸ’αžšαžΌαžœαž”αžΆαž“αž—αŸ’αž‡αžΆαž”αŸ‹αž‚αŸ’αž“αžΆαž‘αŸ…αžœαž·αž‰αž‘αŸ…αž˜αž€αžŠαŸ„αž™αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžš & ΠΈ |.

αžαŸ’αžšαž„αžαŸ’αžŸαŸ‚αž’αž€αŸ’αžŸαžšαž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

# Π€ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
ga_nov[ ga_nov['source'] == "google" ]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈ
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈΠ»ΠΈ
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™

αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž˜αž½αž™αž€αŸ’αž“αž»αž„αž…αŸ†αžŽαŸ„αž˜αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžŠαŸ‚αž›αž”αŸ’αžšαžΎαž‡αžΆαž‘αžΌαž‘αŸ…αž”αŸ†αž•αž»αžαž€αŸ’αž“αž»αž„αž€αžΆαžšαžœαž·αž—αžΆαž‚αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‚αžΊαž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αž“αž»αžœαžαŸ’αžαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž‘αžΆαŸ†αž„αž“αŸαŸ‡αžαŸ’αžšαžΌαžœαž”αžΆαž“αžαŸ’αž…αžΆαžαŸ‹αžαŸ’αž…αžΆαž™αž“αŸ…αž‘αžΌαž‘αžΆαŸ†αž„αž€αž‰αŸ’αž…αž”αŸ‹αž‘αžΆαŸ†αž„αž’αžŸαŸ‹αžŠαŸ‚αž›αž™αžΎαž„αž–αž·αž“αž·αžαŸ’αž™αž˜αžΎαž›αŸ”

αž€αŸ’αž“αž»αž„αž€αžšαžŽαžΈαž“αŸαŸ‡ αž™αžΎαž„αž“αžΉαž„αž›αžΎαž€αž™αž€ dataframe αž‡αžΆαž§αž‘αžΆαž αžšαžŽαŸ αž‘αž·αž…αž“αž·αž€αž αžΎαž™αž‚αžŽαž“αžΆαž…αŸ†αž“αž½αž“ αž“αž·αž„αžαž˜αŸ’αž›αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαž‡αžΆαž˜αž’αŸ’αž™αž˜αž’αžΆαžŸαŸ’αžšαŸαž™αž›αžΎαžαŸ’αž“αžΆαž€αŸ‹αž€αžΆαž”αŸŠαžΈαž“αŸ”

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™αž€αŸ’αž“αž»αž„ R: tidyverse, dplyr

Π’ dplyr αž˜αž»αžαž„αžΆαžšβ€‹αžαŸ’αžšαžΌαžœβ€‹αž”αžΆαž“β€‹αž”αŸ’αžšαžΎβ€‹αžŸαž˜αŸ’αžšαžΆαž”αŸ‹β€‹αž€αžΆαžšβ€‹αžŠαžΆαž€αŸ‹β€‹αž‡αžΆβ€‹αž€αŸ’αžšαž»αž˜ group_by()αž“αž·αž„αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ† summarise(). αžαžΆαž˜αž–αž·αžαž‘αŸ… dplyr αž˜αžΆαž“αž‚αŸ’αžšαž½αžŸαžΆαžšαž‘αžΆαŸ†αž„αž˜αžΌαž›αž“αŸƒαž˜αž»αžαž„αžΆαžš summarise_*()αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž‚αŸ„αž›αž”αŸ†αžŽαž„αž“αŸƒαž’αžαŸ’αžαž”αž‘αž“αŸαŸ‡αž‚αžΊαžŠαžΎαž˜αŸ’αž”αžΈαž”αŸ’αžšαŸ€αž”αž’αŸ€αž”αžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“ αžŠαžΌαž…αŸ’αž“αŸαŸ‡αž™αžΎαž„αž“αžΉαž„αž˜αž·αž“αž…αžΌαž›αž‘αŸ…αž€αŸ’αž“αž»αž„αž–αŸ’αžšαŸƒαž”αŸ‚αž”αž“αŸαŸ‡αž‘αŸαŸ”

αž˜αž»αžαž„αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž‡αžΆαž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“αŸ–

  • sum() - αžŸαž„αŸ’αžαŸαž”
  • min() / max() - αžαž˜αŸ’αž›αŸƒαž’αž”αŸ’αž”αž”αžšαž˜αžΆ αž“αž·αž„αž’αžαž·αž”αžšαž˜αžΆ
  • mean() - αž˜αž’αŸ’αž™αž˜
  • median() - αž˜αž’αŸ’αž™αž˜
  • length() - αž”αžšαž·αž˜αžΆαžŽ

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž“αŸ…αž€αŸ’αž“αž»αž„ R: dplyr

## dplyr
### Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΠΎΠ²ΠΊΠ° ΠΈ агрСгация строк
group_by(titanic, Pclass) %>%
  summarise(passangers = length(PassengerId),
            avg_price  = mean(Fare))

αžŠαžΎαž˜αŸ’αž”αžΈαžŠαŸ†αžŽαžΎαžšαž€αžΆαžš group_by() αž™αžΎαž„αž”αžΆαž“αž†αŸ’αž›αž„αž€αžΆαžαŸ‹αžαžΆαžšαžΆαž„αž‡αžΆαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžŠαŸ†αž”αžΌαž„ αž‘αž·αž…αž“αž·αž€αž αžΎαž™αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αž”αžΆαž“αž…αž„αŸ’αž’αž»αž›αž”αž„αŸ’αž αžΆαž‰αžœαžΆαž› PclassαžŠαŸ‚αž›αž™αžΎαž„αž“αžΉαž„αžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜αžαžΆαžšαžΆαž„αžšαž”αžŸαŸ‹αž™αžΎαž„αŸ” αž›αž‘αŸ’αž’αž•αž›αž“αŸƒαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž“αŸαŸ‡αžŠαŸ„αž™αž”αŸ’αžšαžΎαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžš %>% αž”αžΆαž“αž†αŸ’αž›αž„αž€αžΆαžαŸ‹αž‡αžΆαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžŠαŸ†αž”αžΌαž„αž…αŸ†αž–αŸ„αŸ‡αž˜αž»αžαž„αžΆαžš summarise()αž“αž·αž„αž”αžΆαž“αž”αž“αŸ’αžαŸ‚αž˜αžœαžΆαž›αž…αŸ†αž“αž½αž“ 2 αž”αž“αŸ’αžαŸ‚αž˜αž‘αŸ€αžαŸ– αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžš ΠΈ αžαž˜αŸ’αž›αŸƒαž‡αžΆαž˜αž’αŸ’αž™αž˜. αž‘αžΈαž˜αž½αž™αžŠαŸ„αž™αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš length() αž”αžΆαž“αž‚αžŽαž“αžΆαž…αŸ†αž“αž½αž“αžŸαŸ†αž”αž»αžαŸ’αžš αž αžΎαž™αž“αŸ…αž€αŸ’αž“αž»αž„αž‘αžΈαž–αžΈαžšαžŠαŸ„αž™αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš mean() αž”αžΆαž“αž‘αž‘αž½αž›αžαž˜αŸ’αž›αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαž‡αžΆαž˜αž’αŸ’αž™αž˜αŸ”

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™αž€αŸ’αž“αž»αž„ R: data.table

Π’ data.table αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ† j αžŠαŸ‚αž›αž˜αžΆαž“αž‘αžΈαžαžΆαŸ†αž„αž‘αžΈαž–αžΈαžšαž“αŸ…αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸ αž“αž·αž„αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ by ឬ keybyαžŠαŸ‚αž›αž˜αžΆαž“αžαŸ†αžŽαŸ‚αž„αž‘αžΈαž”αžΈαŸ”

αž”αž‰αŸ’αž‡αžΈαž“αŸƒαž˜αž»αžαž„αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž€αŸ’αž“αž»αž„αž€αžšαžŽαžΈαž“αŸαŸ‡αž‚αžΊαžŠαžΌαž…αž‚αŸ’αž“αžΆαž”αŸαŸ‡αž”αž·αž‘αž‘αŸ…αž“αžΉαž„αž’αŸ’αžœαžΈαžŠαŸ‚αž›αž”αžΆαž“αž–αž·αž–αžŽαŸŒαž“αžΆαž“αŸ…αž€αŸ’αž“αž»αž„ dplyr, αžŠαŸ„αž™αžŸαžΆαžšαžαŸ‚ αž‘αžΆαŸ†αž„αž“αŸαŸ‡αž‚αžΊαž‡αžΆαž˜αž»αžαž„αžΆαžšαž–αžΈαžœαžΆαž€αŸ’αž™αžŸαž˜αŸ’αž–αŸαž“αŸ’αž’ R αž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“αŸ”

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž“αŸ…αž€αŸ’αž“αž»αž„ R: data.table

## data.table
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
titanic[, .(passangers = length(PassengerId),
            avg_price  = mean(Fare)),
        by = Pclass]

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ pandas αžŸαŸ’αžšαžŠαŸ€αž„αž‘αŸ…αž“αžΉαž„ dplyrαž”αŸ‰αž»αž“αŸ’αžαŸ‚αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž˜αž·αž“αžŸαŸ’αžšαžŠαŸ€αž„αž“αžΉαž„ dplyr αž˜αž·αž“αž“αŸ…αž›αžΎ data.table.

αžŠαžΎαž˜αŸ’αž”αžΈαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αžŸαžΌαž˜αž”αŸ’αžšαžΎαžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžαŸ’αžš groupby()αžŠαŸ‚αž›αž’αŸ’αž“αž€αž…αžΆαŸ†αž”αžΆαž…αŸ‹αžαŸ’αžšαžΌαžœαž†αŸ’αž›αž„αž€αžΆαžαŸ‹αž”αž‰αŸ’αž‡αžΈαž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αžΉαž„αžαŸ’αžšαžΌαžœαž”αžΆαž“αžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜αŸ”

αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž’αŸ’αž“αž€αž’αžΆαž…αž”αŸ’αžšαžΎαžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αž agg()αžŠαŸ‚αž›αž‘αž‘αž½αž›αž™αž€αžœαž…αž“αžΆαž“αž»αž€αŸ’αžšαž˜αŸ” αž‚αŸ’αžšαžΆαž”αŸ‹αž…αž»αž…αžœαž…αž“αžΆαž“αž»αž€αŸ’αžšαž˜αž‚αžΊαž‡αžΆαž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αž’αŸ’αž“αž€αž“αžΉαž„αž’αž“αž»αžœαžαŸ’αžαž˜αž»αžαž„αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ† αž αžΎαž™αžαž˜αŸ’αž›αŸƒαž‚αžΊαž‡αžΆαžˆαŸ’αž˜αŸ„αŸ‡αž“αŸƒαž˜αž»αžαž„αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αŸ”

αž˜αž»αžαž„αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αŸ–

  • sum() - αžŸαž„αŸ’αžαŸαž”
  • min() / max() - αžαž˜αŸ’αž›αŸƒαž’αž”αŸ’αž”αž”αžšαž˜αžΆ αž“αž·αž„αž’αžαž·αž”αžšαž˜αžΆ
  • mean() - αž˜αž’αŸ’αž™αž˜
  • median() - αž˜αž’αŸ’αž™αž˜
  • count() - αž”αžšαž·αž˜αžΆαžŽ

αž˜αž»αžαž„αžΆαžš reset_index() αž€αŸ’αž“αž»αž„αž§αž‘αžΆαž αžšαžŽαŸαžαžΆαž„αž€αŸ’αžšαŸ„αž˜αžœαžΆαžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŠαžΎαž˜αŸ’αž”αžΈαž€αŸ†αžŽαžαŸ‹αž›αž·αž”αž·αž€αŸ’αžšαž˜αžŠαŸ‚αž›αž”αžΆαž“αžŠαžΆαž€αŸ‹αž‘αžΎαž„αžœαž·αž‰αž“αŸ„αŸ‡αŸ” pandas αž›αŸ†αž“αžΆαŸ†αžŠαžΎαž˜αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž–αžΈαž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž‘αž·αž“αŸ’αž“αž“αŸαž™αŸ”

ស៊ីម αž’αž“αž»αž‰αŸ’αž‰αžΆαžαž±αŸ’αž™αž’αŸ’αž“αž€αž•αŸ’αž›αžΆαžŸαŸ‹αž‘αžΈαž‘αŸ…αž”αž“αŸ’αž‘αžΆαžαŸ‹αž”αž“αŸ’αž‘αžΆαž”αŸ‹αŸ”

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

# Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΠΎΠ²ΠΊΠ° ΠΈ агрСгация Π΄Π°Π½Π½Ρ‹Ρ…
titanic.groupby(["Pclass"]).
    agg({'PassengerId': 'count', 'Fare': 'mean'}).
        reset_index()

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αž”αž‰αŸ’αžˆαžšαž“αŸƒαžαžΆαžšαžΆαž„

αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžŠαŸ‚αž›αž’αŸ’αž“αž€αž…αžΌαž›αžšαž½αž˜αžαžΆαžšαžΆαž„αž–αžΈαžš αž¬αž…αŸ’αžšαžΎαž“αž“αŸƒαžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’αžŠαžΌαž…αž‚αŸ’αž“αžΆαŸ” αž‘αž·αž“αŸ’αž“αž“αŸαž™αžŠαŸ‚αž›αž™αžΎαž„αž•αŸ’αž‘αž»αž€αž˜αžΆαž“αžαžΆαžšαžΆαž„ ga_nov ΠΈ ga_dec. αžαžΆαžšαžΆαž„αž‘αžΆαŸ†αž„αž“αŸαŸ‡αž‚αžΊαžŠαžΌαž…αž‚αŸ’αž“αžΆαž”αŸαŸ‡αž”αž·αž‘αž“αŸ…αž€αŸ’αž“αž»αž„αžšαž…αž“αžΆαžŸαž˜αŸ’αž–αŸαž“αŸ’αž’, i.e. αž˜αžΆαž“αž‡αž½αžšαžˆαžšαžŠαžΌαž…αž‚αŸ’αž“αžΆ αž“αž·αž„αž”αŸ’αžšαž—αŸαž‘αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„αž‡αž½αžšαžˆαžšαž‘αžΆαŸ†αž„αž“αŸαŸ‡αŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αž“αŸαŸ‡αž‚αžΊαž‡αžΆαž€αžΆαžšαž”αž„αŸ’αž αŸ„αŸ‡αž–αžΈ Google Analytics αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αžαŸ‚αžœαž·αž…αŸ’αž†αž·αž€αžΆ αž“αž·αž„αž’αŸ’αž“αžΌ αž“αŸ…αž€αŸ’αž“αž»αž„αž•αŸ’αž“αŸ‚αž€αž“αŸαŸ‡ αž™αžΎαž„αž“αžΉαž„αž”αž‰αŸ’αž…αžΌαž›αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸαŸ‡αž‘αŸ…αž€αŸ’αž“αž»αž„αžαžΆαžšαžΆαž„αžαŸ‚αž˜αž½αž™αŸ”

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αžαžΆαžšαžΆαž„αž”αž‰αŸ’αžˆαžšαž€αŸ’αž“αž»αž„ R: tidyverse, dplyr

Π’ dplyr αž’αŸ’αž“αž€αž’αžΆαž…αž”αž‰αŸ’αž…αžΌαž›αž‚αŸ’αž“αžΆαž“αžΌαžœαžαžΆαžšαžΆαž„αž…αŸ†αž“αž½αž“ 2 αž…αžΌαž›αž‘αŸ…αž€αŸ’αž“αž»αž„αž˜αž½αž™αžŠαŸ„αž™αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš bind_rows()αž†αŸ’αž›αž„αž€αžΆαžαŸ‹αžαžΆαžšαžΆαž„αžŠαŸ‚αž›αž‡αžΆαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžšαž”αžŸαŸ‹αžœαžΆαŸ”

αžαž˜αŸ’αžšαž„αž‡αž½αžšαž€αŸ’αž“αž»αž„ R: dplyr

# Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠ΅ объСдинСниС Ρ‚Π°Π±Π»ΠΈΡ†
## dplyr
bind_rows(ga_nov, ga_dec)

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αžαžΆαžšαžΆαž„αž”αž‰αŸ’αžˆαžšαž€αŸ’αž“αž»αž„ R: data.table

αžœαžΆαž˜αž·αž“αž˜αžΆαž“αž’αŸ’αžœαžΈαžŸαŸ’αž˜αž»αž‚αžŸαŸ’αž˜αžΆαž‰αž‘αŸ αžαŸ„αŸ‡αž”αŸ’αžšαžΎ rbind().

αžαŸ’αžšαž„αž‡αž½αžšαž€αŸ’αž“αž»αž„ R: data.table

## data.table
rbind(ga_nov, ga_dec)

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αžαžΆαžšαžΆαž„αž”αž‰αŸ’αžˆαžšαž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

Π’ pandas αž˜αž»αžαž„αžΆαžšαžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŠαžΎαž˜αŸ’αž”αžΈαž—αŸ’αž‡αžΆαž”αŸ‹αžαžΆαžšαžΆαž„ concat()αžŠαŸ‚αž›αž’αŸ’αž“αž€αž…αžΆαŸ†αž”αžΆαž…αŸ‹αžαŸ’αžšαžΌαžœαž†αŸ’αž›αž„αž€αžΆαžαŸ‹αž”αž‰αŸ’αž‡αžΈαž“αŸƒαžŸαŸŠαž»αž˜αžŠαžΎαž˜αŸ’αž”αžΈαž•αŸ’αžŸαŸ†αž–αž½αž€αžœαžΆαŸ”

αžαŸ’αžšαž„αžαŸ’αžŸαŸ‚αž’αž€αŸ’αžŸαžšαž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

# Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠ΅ объСдинСниС Ρ‚Π°Π±Π»ΠΈΡ†
pd.concat([ga_nov, ga_dec])

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αž•αŸ’αžŠαŸαž€αž“αŸƒαžαžΆαžšαžΆαž„

αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαžŠαŸ‚αž›αž‡αž½αžšαžˆαžšαž–αžΈαž‘αžΈαž–αžΈαžšαžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αž“αŸ’αžαŸ‚αž˜αž‘αŸ…αžαžΆαžšαžΆαž„αž‘αžΈαž˜αž½αž™αžŠαŸ„αž™αž‚αŸ’αžšαžΆαž”αŸ‹αž…αž»αž…αŸ” αžœαžΆαžαŸ’αžšαžΌαžœαž”αžΆαž“αž‚αŸαž”αŸ’αžšαžΎαž‡αžΆαž‰αžΉαž€αž‰αžΆαž”αŸ‹αž“αŸ…αž–αŸαž›αž–αž„αŸ’αžšαžΉαž„αžαžΆαžšαžΆαž„αž€αžΆαžšαž–αž·αž (αž§αž‘αžΆαž αžšαžŽαŸαžαžΆαžšαžΆαž„αžŠαŸ‚αž›αž˜αžΆαž“αž‘αž·αž“αŸ’αž“αž“αŸαž™αž›αž€αŸ‹) αž‡αžΆαž˜αž½αž™αž“αžΉαž„αž‘αž·αž“αŸ’αž“αž“αŸαž™αž™αŸ„αž„αž˜αž½αž™αž…αŸ†αž“αž½αž“ (αž§αž‘αžΆαž αžšαžŽαŸ αžαž˜αŸ’αž›αŸƒαž“αŸƒαž•αž›αž·αžαž•αž›)αŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αž˜αžΆαž“αž”αŸ’αžšαž—αŸαž‘αž‡αžΆαž…αŸ’αžšαžΎαž“αž“αŸƒαž€αžΆαžšαž…αžΌαž›αžšαž½αž˜αŸ–

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αž“αŸ…αž€αŸ’αž“αž»αž„αžαžΆαžšαžΆαž„αžŠαŸ‚αž›αž”αžΆαž“αž•αŸ’αž‘αž»αž€αž–αžΈαž˜αž»αž“ αž‘αž·αž…αž“αž·αž€ αž™αžΎαž„αž˜αžΆαž“αž‡αž½αžšαžˆαžšαž˜αž½αž™αŸ” αž€αžΆαžšαžšαž½αž˜αž—αŸαž‘αžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž“αžΉαž„αž›αŸαžαž€αžΌαžŠαž—αŸαž‘αžšαž”αžŸαŸ‹αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžšαŸ–

៑-αžŸαŸ’αžšαžΈ
្-β€‹αž”αž»αžšαžŸ

αžŠαžΌαž…αž‚αŸ’αž“αžΆαž“αŸαŸ‡αž•αž„αžŠαŸ‚αžšαž™αžΎαž„αž”αžΆαž“αž”αž„αŸ’αž€αžΎαžαžαžΆαžšαžΆαž„αž˜αž½αž™ - αžŸαŸ€αžœαž—αŸ…αž™αŸ„αž„ αž™αŸ‚αž“αžŒαŸαžš. αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαž”αž„αŸ’αž αžΆαž‰αž€αžΆαž“αŸ‹αžαŸ‚αž„αžΆαž™αžŸαŸ’αžšαž½αž›αž“αŸƒαž‘αž·αž“αŸ’αž“αž“αŸαž™αžŸαŸ’αžαžΈαž–αžΈαž—αŸαž‘αžšαž”αžŸαŸ‹αž’αŸ’αž“αž€αžŠαŸ†αžŽαžΎαžš αž™αžΎαž„αžαŸ’αžšαžΌαžœαž”αž“αŸ’αžαŸ‚αž˜αžˆαŸ’αž˜αŸ„αŸ‡αž—αŸαž‘αž–αžΈαžαž αž™αŸ‚αž“αžŒαŸαžš αž‘αŸ…αžαž» αž‘αž·αž…αž“αž·αž€.

αžαžΆαžšαžΆαž„αž•αŸ’αžŠαŸαž€αž…αžΌαž›αžšαž½αž˜αž“αŸ…αž€αŸ’αž“αž»αž„ R: tidyverse, dplyr

Π’ dplyr αž˜αžΆαž“αž€αŸ’αžšαž»αž˜αž‚αŸ’αžšαž½αžŸαžΆαžšαž‘αžΆαŸ†αž„αž˜αžΌαž›αž“αŸƒαž˜αž»αžαž„αžΆαžšαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αž•αŸ’αžŠαŸαž€:

  • inner_join()
  • left_join()
  • right_join()
  • full_join()
  • semi_join()
  • nest_join()
  • anti_join()

αž”αŸ’αžšαžΎαž‡αžΆαž‘αžΌαž‘αŸ…αž”αŸ†αž•αž»αžαž“αŸ…αž€αŸ’αž“αž»αž„αž€αžΆαžšαž’αž“αž»αžœαžαŸ’αžαžšαž”αžŸαŸ‹αžαŸ’αž‰αž»αŸ†αž‚αžΊ left_join().

αžŠαžΌαž…αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αž–αžΈαžšαžŠαŸ†αž”αžΌαž„ αž˜αž»αžαž„αžΆαžšαžŠαŸ‚αž›αž”αžΆαž“αžšαžΆαž™αžαžΆαž„αž›αžΎαž™αž€αžαžΆαžšαžΆαž„αž–αžΈαžšαžŠαžΎαž˜αŸ’αž”αžΈαž…αžΌαž›αžšαž½αž˜ αž αžΎαž™αž‡αžΆαž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αž‘αžΈαž”αžΈ by αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαžαŸ‚αž”αž‰αŸ’αž‡αžΆαž€αŸ‹αž‡αž½αžšαžˆαžšαžŠαžΎαž˜αŸ’αž”αžΈαž…αžΌαž›αžšαž½αž˜αŸ”

αžαžΆαžšαžΆαž„αž•αŸ’αžŠαŸαž€αž…αžΌαž›αžšαž½αž˜αž“αŸ…αž€αŸ’αž“αž»αž„ R: dplyr

# объСдиняСм Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
left_join(titanic, gender,
          by = c("Sex" = "id"))

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αž•αŸ’αžŠαŸαž€αž“αŸƒαžαžΆαžšαžΆαž„αž€αŸ’αž“αž»αž„ R: data.table

Π’ data.table αž’αŸ’αž“αž€αžαŸ’αžšαžΌαžœαž…αžΌαž›αžšαž½αž˜αžαžΆαžšαžΆαž„αžŠαŸ„αž™αž‚αŸ’αžšαžΆαž”αŸ‹αž…αž»αž…αžŠαŸ„αž™αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš merge().

αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αžŠαžΎαž˜αŸ’αž”αžΈαž”αž‰αŸ’αž…αžΌαž›αž‚αŸ’αž“αžΆ () αž˜αž»αžαž„αžΆαžšαž“αŸ…αž€αŸ’αž“αž»αž„ data.table

  • x, y β€” αžαžΆαžšαžΆαž„αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž…αžΌαž›αžšαž½αž˜
  • by β€” αž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αž‡αžΆαž‚αž“αŸ’αž›αžΉαŸ‡αžŠαžΎαž˜αŸ’αž”αžΈαž…αžΌαž›αžšαž½αž˜αž”αŸ’αžšαžŸαž·αž“αž”αžΎαžœαžΆαž˜αžΆαž“αžˆαŸ’αž˜αŸ„αŸ‡αžŠαžΌαž…αž‚αŸ’αž“αžΆαž“αŸ…αž€αŸ’αž“αž»αž„αžαžΆαžšαžΆαž„αž‘αžΆαŸ†αž„αž–αžΈαžš
  • by.x, by.y β€” αžˆαŸ’αž˜αŸ„αŸ‡β€‹αž‡αž½αžšβ€‹αžˆαžšβ€‹αžŠαŸ‚αž›β€‹αžαŸ’αžšαžΌαžœβ€‹αž”αž‰αŸ’αž…αžΌαž›β€‹αž‚αŸ’αž“αžΆ αž”αŸ’αžšαžŸαž·αž“β€‹αž”αžΎβ€‹αž–αž½αž€β€‹αžœαžΆβ€‹αž˜αžΆαž“β€‹αžˆαŸ’αž˜αŸ„αŸ‡β€‹αžαž»αžŸβ€‹αž‚αŸ’αž“αžΆβ€‹αž€αŸ’αž“αž»αž„β€‹αžαžΆαžšαžΆαž„
  • all, all.x, all.y β€” αž”αŸ’αžšαž—αŸαž‘ Join αž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž“αžΉαž„αžαŸ’αžšαž‘αž”αŸ‹αž‡αž½αžšαž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž–αžΈαžαžΆαžšαžΆαž„αž‘αžΆαŸ†αž„αž–αžΈαžš all.x αžαŸ’αžšαžΌαžœαž‚αŸ’αž“αžΆαž‘αŸ…αž“αžΉαž„αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžš LEFT JOIN (αž“αžΉαž„αž‘αž»αž€αž‡αž½αžšαž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž“αŸƒαžαžΆαžšαžΆαž„αž‘αžΈαž˜αž½αž™) all.y β€” αžαŸ’αžšαžΌαžœαž‚αŸ’αž“αžΆαž‘αŸ…αž“αžΉαž„ αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžš RIGHT JOIN (αž“αžΉαž„αž‘αž»αž€αž‡αž½αžšαž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž“αŸƒαžαžΆαžšαžΆαž„αž‘αžΈαž–αžΈαžš)αŸ”

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αž•αŸ’αžŠαŸαž€αž“αŸƒαžαžΆαžšαžΆαž„αž€αŸ’αž“αž»αž„ R: data.table

# объСдиняСм Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)

αžαžΆαžšαžΆαž„αž•αŸ’αžŠαŸαž€αž…αžΌαž›αžšαž½αž˜αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

αž€αŸαžŠαžΌαž…αž‡αžΆαž“αŸ…αž€αŸ’αž“αž»αž„ data.tableαž“αŸ… pandas αž˜αž»αžαž„αžΆαžšαžαŸ’αžšαžΌαžœαž”αžΆαž“αž”αŸ’αžšαžΎαžŠαžΎαž˜αŸ’αž”αžΈαž—αŸ’αž‡αžΆαž”αŸ‹αžαžΆαžšαžΆαž„ merge().

αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹αž“αŸƒαž˜αž»αžαž„αžΆαžšαž”αž‰αŸ’αž…αžΌαž›αž‚αŸ’αž“αžΆ () αž“αŸ…αž€αŸ’αž“αž»αž„αž•αŸαž“αžŠαžΆ

  • αžšαž”αŸ€αž” - αž”αŸ’αžšαž—αŸαž‘αž€αžΆαžšαžαž—αŸ’αž‡αžΆαž”αŸ‹αŸ– αž†αŸ’αžœαŸαž„ αžŸαŸ’αžŠαžΆαŸ† αžαžΆαž„αž€αŸ’αžšαŸ… αžαžΆαž„αž€αŸ’αž“αž»αž„
  • αž›αžΎ β€” αž‡αž½αžšβ€‹αžˆαžšβ€‹αžŠαŸ‚αž›β€‹αž‡αžΆβ€‹αž€αžΌαž“αžŸαŸ„β€‹αž”αŸ’αžšαžŸαž·αž“β€‹αž”αžΎβ€‹αžœαžΆβ€‹αž˜αžΆαž“β€‹αžˆαŸ’αž˜αŸ„αŸ‡β€‹αžŠαžΌαž…αž‚αŸ’αž“αžΆβ€‹αž€αŸ’αž“αž»αž„β€‹αžαžΆαžšαžΆαž„β€‹αž‘αžΆαŸ†αž„αž–αžΈαžš
  • left_on, right_on β€” αžˆαŸ’αž˜αŸ„αŸ‡β€‹αž‡αž½αžšβ€‹αžˆαžšβ€‹αž‚αž“αŸ’αž›αžΉαŸ‡ αž”αŸ’αžšαžŸαž·αž“αž”αžΎβ€‹αž–αž½αž€αž‚αŸβ€‹αž˜αžΆαž“β€‹αžˆαŸ’αž˜αŸ„αŸ‡β€‹αžαž»αžŸβ€‹αž‚αŸ’αž“αžΆβ€‹αž€αŸ’αž“αž»αž„β€‹αžαžΆαžšαžΆαž„

αžαžΆαžšαžΆαž„αž•αŸ’αžŠαŸαž€αž…αžΌαž›αžšαž½αž˜αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

# объСдиняСм ΠΏΠΎ ΠΊΠ»ΡŽΡ‡Ρƒ
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")

αž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž…αž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“ αž“αž·αž„αž‡αž½αžšαžˆαžšαž‚αžŽαž“αžΆ

αž˜αž»αžαž„αžΆαžš Window αž˜αžΆαž“αž’αžαŸ’αžαž“αŸαž™αžŸαŸ’αžšαžŠαŸ€αž„αž‚αŸ’αž“αžΆαž‘αŸ…αž“αžΉαž„αž˜αž»αžαž„αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ† αž αžΎαž™αž€αŸαžαŸ’αžšαžΌαžœαž”αžΆαž“αž‚αŸαž”αŸ’αžšαžΎαž‡αžΆαž‰αžΉαž€αž‰αžΆαž”αŸ‹αž€αŸ’αž“αž»αž„αž€αžΆαžšαžœαž·αž—αžΆαž‚αž‘αž·αž“αŸ’αž“αž“αŸαž™αž•αž„αžŠαŸ‚αžšαŸ” αž”αŸ‰αž»αž“αŸ’αžαŸ‚αž˜αž·αž“αžŠαžΌαž…αž˜αž»αžαž„αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†αž‘αŸ αž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž…αž˜αž·αž“αž•αŸ’αž›αžΆαžŸαŸ‹αž”αŸ’αžαžΌαžšαž…αŸ†αž“αž½αž“αž‡αž½αžšαžŠαŸαž€αž“αŸƒαžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™αžŠαŸ‚αž›αž…αŸαž‰αž“αŸ„αŸ‡αž‘αŸαŸ”

αžαžΎαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™ - R ឬ Python? αž‘αžΆαŸ†αž„αž–αžΈαžš! αž€αžΆαžšαž’αŸ’αžœαžΎαž…αŸ†αžŽαžΆαž€αžŸαŸ’αžšαž»αž€αž–αžΈαžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆαž‘αŸ… tidyverse αž“αž·αž„ data.table αž“αž·αž„αžαŸ’αžšαž‘αž”αŸ‹αž˜αž€αžœαž·αž‰

αž‡αžΆαžŸαŸ†αžαžΆαž“αŸ‹ αžŠαŸ„αž™αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž… αž™αžΎαž„αž”αŸ†αž”αŸ‚αž€αžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™αž…αžΌαž›αž‡αžΆαž•αŸ’αž“αŸ‚αž€αŸ—αžαžΆαž˜αž›αž€αŸ’αžαžŽαŸˆαžœαž·αž“αž·αž…αŸ’αž†αŸαž™αž˜αž½αž™αž…αŸ†αž“αž½αž“ αž–αŸ„αž›αž‚αžΊαž§αŸ” αžŠαŸ„αž™αžαž˜αŸ’αž›αŸƒαž“αŸƒαžœαžΆαž›αž˜αž½αž™ αž¬αžœαžΆαž›αž‡αžΆαž…αŸ’αžšαžΎαž“αŸ” αž αžΎαž™αž™αžΎαž„αž’αŸ’αžœαžΎαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž“αž–αŸ’αžœαž“αŸ’αž’αž“αŸ…αž›αžΎαž”αž„αŸ’αž’αž½αž…αž“αžΈαž˜αž½αž™αŸ—αŸ” αž›αž‘αŸ’αž’αž•αž›αž“αŸƒαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž‘αžΆαŸ†αž„αž“αŸαŸ‡αž“αžΉαž„αžαŸ’αžšαž›αž”αŸ‹αž˜αž€αžœαž·αž‰αž€αŸ’αž“αž»αž„αž”αž“αŸ’αž‘αžΆαžαŸ‹αž“αžΈαž˜αž½αž™αŸ— i.e. αžŠαŸ„αž™αž˜αž·αž“αž•αŸ’αž›αžΆαžŸαŸ‹αž”αŸ’αžαžΌαžšαž…αŸ†αž“αž½αž“αž‡αž½αžšαžŠαŸαž€αžŸαžšαž»αž”αž€αŸ’αž“αž»αž„αžαžΆαžšαžΆαž„αŸ”

αž‡αžΆαž§αž‘αžΆαž αžšαžŽαŸ αž…αžΌαžšαž™αžΎαž„αž™αž€αžαžΆαžšαžΆαž„ αž‘αž·αž…αž“αž·αž€. αž™αžΎαž„αž’αžΆαž…αž‚αžŽαž“αžΆαž”αžΆαž“αžαžΆαžαžΎαžαž˜αŸ’αž›αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαž“αžΈαž˜αž½αž™αŸ—αž˜αžΆαž“αž”αŸ‰αž»αž“αŸ’αž˜αžΆαž“αž—αžΆαž‚αžšαž™αž“αŸ…αž€αŸ’αž“αž»αž„αžαŸ’αž“αžΆαž€αŸ‹αž€αžΆαž”αŸŠαžΈαž“αžšαž”αžŸαŸ‹αžœαžΆαŸ”

αžŠαžΎαž˜αŸ’αž”αžΈαž’αŸ’αžœαžΎαžŠαžΌαž…αŸ’αž“αŸαŸ‡ αž™αžΎαž„αžαŸ’αžšαžΌαžœαž‘αž‘αž½αž›αž”αžΆαž“αž€αŸ’αž“αž»αž„αž˜αž½αž™αž‡αž½αžšαž“αžΈαž˜αž½αž™αŸ—αž“αžΌαžœαžαž˜αŸ’αž›αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαžŸαžšαž»αž”αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αžαŸ’αž“αžΆαž€αŸ‹αž€αžΆαž”αŸŠαžΈαž“αž”αž…αŸ’αž…αž»αž”αŸ’αž”αž“αŸ’αž“ αžŠαŸ‚αž›αžŸαŸ†αž”αž»αžαŸ’αžšαž€αŸ’αž“αž»αž„αž‡αž½αžšαž“αŸαŸ‡αž‡αžΆαž€αž˜αŸ’αž˜αžŸαž·αž‘αŸ’αž’αž· αž”αž“αŸ’αž‘αžΆαž”αŸ‹αž˜αž€αž”αŸ‚αž„αž…αŸ‚αž€αžαŸ’αž›αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαž“αžΈαž˜αž½αž™αŸ—αžŠαŸ„αž™αžαž˜αŸ’αž›αŸƒαžŸαžšαž»αž”αž“αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαž‘αžΆαŸ†αž„αž’αžŸαŸ‹αž“αŸƒαžαŸ’αž“αžΆαž€αŸ‹αž€αžΆαž”αŸŠαžΈαž“αžŠαžΌαž…αž‚αŸ’αž“αžΆ .

αž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž…αž“αŸ…αž€αŸ’αž“αž»αž„ R: tidyverse, dplyr

αžŠαžΎαž˜αŸ’αž”αžΈβ€‹αž”αž“αŸ’αžαŸ‚αž˜β€‹αž‡αž½αžšβ€‹αžˆαžšβ€‹αžαŸ’αž˜αžΈ αžŠαŸ„αž™β€‹αž˜αž·αž“β€‹αž”αŸ’αžšαžΎβ€‹αž€αžΆαžšβ€‹αžŠαžΆαž€αŸ‹β€‹αž‡αžΆβ€‹αž€αŸ’αžšαž»αž˜β€‹αž‡αž½αžšβ€‹αžŠαŸαž€ αž…αžΌαž› dplyr αž”αž˜αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš mutate().

αž’αŸ’αž“αž€αž’αžΆαž…αžŠαŸ„αŸ‡αžŸαŸ’αžšαžΆαž™αž”αž‰αŸ’αž αžΆαžŠαŸ‚αž›αž”αžΆαž“αž–αž·αž–αžŽαŸŒαž“αžΆαžαžΆαž„αž›αžΎαžŠαŸ„αž™αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‘αž·αž“αŸ’αž“αž“αŸαž™αž‡αžΆαž€αŸ’αžšαž»αž˜αžαžΆαž˜αžœαžΆαž› Pclass αž αžΎαž™β€‹αž”αžΌαž€β€‹αž”αž‰αŸ’αž…αžΌαž›β€‹αžœαžΆαž›β€‹αž€αŸ’αž“αž»αž„β€‹αž‡αž½αžšβ€‹αžˆαžšβ€‹αžαŸ’αž˜αžΈαŸ” αžαŸ’αž›αŸƒαžˆαŸ’αž“αž½αž›αŸ”. αž”αž“αŸ’αž‘αžΆαž”αŸ‹β€‹αž˜αž€ αž‰αŸ‚αž€β€‹αžαžΆαžšαžΆαž„β€‹αž‡αžΆβ€‹αž€αŸ’αžšαž»αž˜ αž αžΎαž™β€‹αž”αŸ‚αž„αž…αŸ‚αž€β€‹αžαž˜αŸ’αž›αŸƒβ€‹αžœαžΆαž› αžαŸ’αž›αŸƒαžˆαŸ’αž“αž½αž›αŸ” αž‘αŸ…αž“αžΉαž„αž’αŸ’αžœαžΈαžŠαŸ‚αž›αž”αžΆαž“αž€αžΎαžαž‘αžΎαž„αž“αŸ…αž€αŸ’αž“αž»αž„αž‡αŸ†αž αžΆαž“αž˜αž»αž“αŸ”

αž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž…αž“αŸ…αž€αŸ’αž“αž»αž„ R: dplyr

group_by(titanic, Pclass) %>%
  mutate(Pclass_cost = sum(Fare)) %>%
  ungroup() %>%
  mutate(ticket_fare_rate = Fare / Pclass_cost)

αž˜αž»αžαž„αžΆαžš Window αž€αŸ’αž“αž»αž„ R: data.table

αž€αŸ’αž”αž½αž“αžŠαŸ„αŸ‡αžŸαŸ’αžšαžΆαž™αžŠαŸ†αžŽαŸ„αŸ‡αžŸαŸ’αžšαžΆαž™αž“αŸ…αžαŸ‚αžŠαžŠαŸ‚αž›αžŠαžΌαž…αž“αŸ…αž€αŸ’αž“αž»αž„ dplyrαž™αžΎαž„αžαŸ’αžšαžΌαžœαž”αŸ†αž”αŸ‚αž€αžαžΆαžšαžΆαž„αž‘αŸ…αž‡αžΆ windows αžαžΆαž˜αžœαžΆαž› Pclass. αž”αž‰αŸ’αž…αžΌαž›αž€αŸ’αž“αž»αž„αž‡αž½αžšαžˆαžšαžαŸ’αž˜αžΈαž“αžΌαžœαž…αŸ†αž“αž½αž“αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž€αŸ’αžšαž»αž˜αžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž‚αŸ’αž“αžΆαž“αžΉαž„αž‡αž½αžšαž“αžΈαž˜αž½αž™αŸ— αž αžΎαž™αž”αž“αŸ’αžαŸ‚αž˜αž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αž™αžΎαž„αž‚αžŽαž“αžΆαž…αŸ†αžŽαŸ‚αž€αž“αŸƒαžαŸ’αž›αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαž“αžΈαž˜αž½αž™αŸ—αž“αŸ…αž€αŸ’αž“αž»αž„αž€αŸ’αžšαž»αž˜αžšαž”αžŸαŸ‹αžœαžΆαŸ”

αžŠαžΎαž˜αŸ’αž”αžΈαž”αž“αŸ’αžαŸ‚αž˜αž‡αž½αžšαžˆαžšαžαŸ’αž˜αžΈαž‘αŸ… data.table αž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžšαž˜αžΆαž“αžœαžαŸ’αžαž˜αžΆαž“ :=. αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αž“αŸαŸ‡αž‡αžΆαž§αž‘αžΆαž αžšαžŽαŸαž“αŸƒαž€αžΆαžšαžŠαŸ„αŸ‡αžŸαŸ’αžšαžΆαž™αž”αž‰αŸ’αž αžΆαžŠαŸ„αž™αž”αŸ’αžšαžΎαž€αž‰αŸ’αž…αž”αŸ‹ data.table

αž˜αž»αžαž„αžΆαžš Window αž€αŸ’αž“αž»αž„ R: data.table

titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost), 
        by = Pclass]

αž˜αž»αžαž„αžΆαžš Window αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

αžœαž·αž’αžΈαž˜αž½αž™αžŠαžΎαž˜αŸ’αž”αžΈαž”αž“αŸ’αžαŸ‚αž˜αž‡αž½αžšαžˆαžšαžαŸ’αž˜αžΈαž‘αŸ… pandas - αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš assign(). αžŠαžΎαž˜αŸ’αž”αžΈαžŸαž„αŸ’αžαŸαž”αžαž˜αŸ’αž›αŸƒαžŸαŸ†αž”αž»αžαŸ’αžšαžαžΆαž˜αžαŸ’αž“αžΆαž€αŸ‹αž€αžΆαž”αŸŠαžΈαž“ αžŠαŸ„αž™αž˜αž·αž“αž”αžΆαž…αŸ‹αžŠαžΆαž€αŸ‹αž‡αž½αžš αž™αžΎαž„αž“αžΉαž„αž”αŸ’αžšαžΎαž˜αž»αžαž„αžΆαžš transform().

αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αž“αŸαŸ‡αž‡αžΆαž§αž‘αžΆαž αžšαžŽαŸαž“αŸƒαžŠαŸ†αžŽαŸ„αŸ‡αžŸαŸ’αžšαžΆαž™αžŠαŸ‚αž›αž™αžΎαž„αž”αž“αŸ’αžαŸ‚αž˜αž‘αŸ…αž€αŸ’αž“αž»αž„αžαžΆαžšαžΆαž„ αž‘αž·αž…αž“αž·αž€ αžŠαžΌαž…αž‚αŸ’αž“αžΆ 2 αž‡αž½αžšαŸ”

αž˜αž»αžαž„αžΆαžš Window αž“αŸ…αž€αŸ’αž“αž»αž„ Python: pandas

titanic.assign(Pclass_cost      =  titanic.groupby('Pclass').Fare.transform(sum),
               ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])

αž˜αž»αžαž„αžΆαžš αž“αž·αž„αžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αž αžαžΆαžšαžΆαž„αž†αŸ’αž›αžΎαž™αž†αŸ’αž›αž„

αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αž“αŸαŸ‡αž‚αžΊαž‡αžΆαžαžΆαžšαžΆαž„αž“αŸƒαž€αžΆαžšαž†αŸ’αž›αžΎαž™αž†αŸ’αž›αž„αžšαžœαžΆαž„αžœαž·αž’αžΈαžŸαžΆαžŸαŸ’αžšαŸ’αžαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αž“αž»αžœαžαŸ’αžαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžΆαžšαž•αŸ’αžŸαŸαž„αŸ—αž‡αžΆαž˜αž½αž™αž“αžΉαž„αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„αž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ‚αž›αž™αžΎαž„αž”αžΆαž“αž–αž·αž…αžΆαžšαžŽαžΆαŸ”

αž”αžšαž·αž™αžΆαž™
tidyverse
αžαžΆαžšαžΆαž„αž‘αž·αž“αŸ’αž“αž“αŸαž™
αžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆ

αž€αŸ†αž–αž»αž„αž•αŸ’αž‘αž»αž€αž‘αž·αž“αŸ’αž“αž“αŸαž™
vroom()/ readr::read_csv() / readr::read_tsv()
fread()
read_csv()

αž€αžΆαžšαž”αž„αŸ’αž€αžΎαžαžŸαŸŠαž»αž˜αž‘αž·αž“αŸ’αž“αž“αŸαž™
tibble()
data.table()
dict() + from_dict()

αž€αžΆαžšαž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž½αžšαžˆαžš
select()
αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ jαž‘αžΈαžαžΆαŸ†αž„αž‘αžΈαž–αžΈαžšαž“αŸ…αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸ
αž™αžΎαž„αž†αŸ’αž›αž„αž€αžΆαžαŸ‹αž”αž‰αŸ’αž‡αžΈαž“αŸƒαž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αžαŸ’αžšαžΌαžœαž€αžΆαžšαž“αŸ…αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸ / drop() / filter() / select_dtypes()

αžαŸ’αžšαž„αž‡αž½αžš
filter()
αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ iαž‘αžΈαžαžΆαŸ†αž„αžŠαŸ†αž”αžΌαž„αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸ
αž™αžΎαž„αžšαžΆαž™αž”αž‰αŸ’αž‡αžΈαž›αž€αŸ’αžαžαžŽαŸ’αžŒαžαŸ’αžšαž„αž€αŸ’αž“αž»αž„αžαž„αŸ’αž€αŸ€αž”αž€αžΆαžšαŸ‰αŸ / filter()

αž€αžΆαžšαžŠαžΆαž€αŸ‹αž‡αžΆαž€αŸ’αžšαž»αž˜ αž“αž·αž„αž€αžΆαžšαž”αŸ’αžšαž˜αžΌαž›αž•αŸ’αžαž»αŸ†
group_by() + summarise()
αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ j + by
groupby() + agg()

αž€αžΆαžšαžšαž½αž”αžšαž½αž˜αž“αŸƒαžαžΆαžšαžΆαž„αž”αž‰αŸ’αžˆαžš (UNION)
bind_rows()
rbind()
concat()

αž€αžΆαžšαž—αŸ’αž‡αžΆαž”αŸ‹αžαžΆαžšαžΆαž„αž•αŸ’αžŠαŸαž€ (αž…αžΌαž›αžšαž½αž˜)
left_join() / *_join()
merge()
merge()

αž˜αž»αžαž„αžΆαžšαž”αž„αŸ’αž’αž½αž…αž˜αžΌαž›αžŠαŸ’αž‹αžΆαž“ αž“αž·αž„αž”αž“αŸ’αžαŸ‚αž˜αž‡αž½αžšαžˆαžšαžŠαŸ‚αž›αž”αžΆαž“αž‚αžŽαž“αžΆ
group_by() + mutate()
αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ j αžŠαŸ„αž™αž”αŸ’αžšαžΎαž”αŸ’αžšαžαž·αž”αžαŸ’αžαž·αž€αžš := + αž’αžΆαž‚αž»αž™αž˜αŸ‰αž„αŸ‹ by
transform() + assign()

αžŸαŸαž…αž€αŸ’αžαžΈαžŸαž“αŸ’αž“αž·αžŠαŸ’αž‹αžΆαž“

αž”αŸ’αžšαž αŸ‚αž›αž‡αžΆαž“αŸ…αž€αŸ’αž“αž»αž„αž’αžαŸ’αžαž”αž‘αžŠαŸ‚αž›αžαŸ’αž‰αž»αŸ†αž”αžΆαž“αž–αž·αž–αžŽαŸŒαž“αžΆαž˜αž·αž“αž˜αŸ‚αž“αž‡αžΆαž€αžΆαžšαž’αž“αž»αžœαžαŸ’αžαžŠαŸαž›αŸ’αž’αž”αŸ’αžšαžŸαžΎαžšαž”αŸ†αž•αž»αžαž“αŸƒαžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™ αžŠαžΌαž…αŸ’αž“αŸαŸ‡αžαŸ’αž‰αž»αŸ†αž“αžΉαž„αžšαžΈαž€αžšαžΆαž™αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž€αŸ‚αž€αŸ†αž αž»αžŸαžšαž”αžŸαŸ‹αžαŸ’αž‰αž»αŸ†αž“αŸ…αž€αŸ’αž“αž»αž„αž˜αžαž·αž™αŸ„αž”αž›αŸ‹ αž¬αž‚αŸ’αžšαžΆαž“αŸ‹αžαŸ‚αž”αž“αŸ’αžαŸ‚αž˜αž–αŸαžαŸŒαž˜αžΆαž“αžŠαŸ‚αž›αž”αžΆαž“αž•αŸ’αžαž›αŸ‹αž±αŸ’αž™αž€αŸ’αž“αž»αž„αž’αžαŸ’αžαž”αž‘αž‡αžΆαž˜αž½αž™αž“αžΉαž„αž”αž…αŸ’αž…αŸαž€αž‘αŸαžŸαž•αŸ’αžŸαŸαž„αž‘αŸ€αžαžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž’αŸ’αžœαžΎαž€αžΆαžšαž‡αžΆαž˜αž½αž™αž‘αž·αž“αŸ’αž“αž“αŸαž™αž“αŸ…αž€αŸ’αž“αž»αž„ R / Python αŸ”

αžŠαžΌαž…αžŠαŸ‚αž›αžαŸ’αž‰αž»αŸ†αž”αžΆαž“αžŸαžšαžŸαŸαžšαžαžΆαž„αž›αžΎ αž‚αŸ„αž›αž”αŸ†αžŽαž„αž“αŸƒαž’αžαŸ’αžαž”αž‘αž‚αžΊαž˜αž·αž“αž˜αŸ‚αž“αžŠαžΎαž˜αŸ’αž”αžΈαžŠαžΆαž€αŸ‹αž‚αŸ†αž“αž·αžαžšαž”αžŸαŸ‹αž˜αž“αž»αžŸαŸ’αžŸαž˜αŸ’αž“αžΆαž€αŸ‹αžαžΆαž—αžΆαžŸαžΆαž˜αž½αž™αžŽαžΆαž›αŸ’αž’αž‡αžΆαž„αž“αŸ„αŸ‡αž‘αŸ αž”αŸ‰αž»αž“αŸ’αžαŸ‚αžŠαžΎαž˜αŸ’αž”αžΈαžŸαž˜αŸ’αžšαž½αž›αžŠαž›αŸ‹αž±αž€αžΆαžŸαž€αŸ’αž“αž»αž„αž€αžΆαžšαžšαŸ€αž“αž—αžΆαžŸαžΆαž‘αžΆαŸ†αž„αž–αžΈαžš αž¬αž”αžΎαž…αžΆαŸ†αž”αžΆαž…αŸ‹ αž•αŸ’αž›αžΆαžŸαŸ‹αž”αŸ’αžαžΌαžšαžšαžœαžΆαž„αž–αž½αž€αžœαžΆαŸ”

αž”αŸ’αžšαžŸαž·αž“αž”αžΎαž’αŸ’αž“αž€αž…αžΌαž›αž…αž·αžαŸ’αžαž’αžαŸ’αžαž”αž‘ αžαŸ’αž‰αž»αŸ†αž“αžΉαž„αžšαžΈαž€αžšαžΆαž™αžŠαŸ‚αž›αž˜αžΆαž“αž’αŸ’αž“αž€αž‡αžΆαžœαžαŸ’αž˜αžΈαžšαž”αžŸαŸ‹αžαŸ’αž‰αž»αŸ† YouTube ΠΈ αž‘αžΌαžšαž›αŸαž αž†αžΆαž“αŸ‚αž›αŸ”

αž€αžΆαžšαžŸαŸ’αž‘αž„αŸ‹αž˜αžαž·

αžαžΎαž€αž‰αŸ’αž…αž”αŸ‹αžαžΆαž„αž€αŸ’αžšαŸ„αž˜αž˜αž½αž™αžŽαžΆαžŠαŸ‚αž›αž’αŸ’αž“αž€αž”αŸ’αžšαžΎαž€αŸ’αž“αž»αž„αž€αžΆαžšαž„αžΆαžšαžšαž”αžŸαŸ‹αž’αŸ’αž“αž€?

αž“αŸ…αž€αŸ’αž“αž»αž„αž˜αžαž·αž™αŸ„αž”αž›αŸ‹ αž’αŸ’αž“αž€αž’αžΆαž…αžŸαžšαžŸαŸαžšαž αŸαžαž»αž•αž›αžŸαž˜αŸ’αžšαžΆαž”αŸ‹αž‡αž˜αŸ’αžšαžΎαžŸαžšαž”αžŸαŸ‹αž’αŸ’αž“αž€αŸ”

αž˜αžΆαž“αžαŸ‚αž’αŸ’αž“αž€αž”αŸ’αžšαžΎαž”αŸ’αžšαžΆαžŸαŸ‹αžŠαŸ‚αž›αž”αžΆαž“αž…αž»αŸ‡αžˆαŸ’αž˜αŸ„αŸ‡αž”αŸ‰αž»αžŽαŸ’αžŽαŸ„αŸ‡αžŠαŸ‚αž›αž’αžΆαž…αž…αžΌαž›αžšαž½αž˜αž€αŸ’αž“αž»αž„αž€αžΆαžšαžŸαŸ’αž‘αž„αŸ‹αž˜αžαž·αž“αŸαŸ‡αŸ” αž…αžΌαž›αžŸαžΌαž˜αŸ”

αžαžΎαž€αž‰αŸ’αž…αž”αŸ‹αžŠαŸ†αžŽαžΎαžšαž€αžΆαžšαž‘αž·αž“αŸ’αž“αž“αŸαž™αžŽαžΆαžŠαŸ‚αž›αž’αŸ’αž“αž€αž”αŸ’αžšαžΎ (αž’αŸ’αž“αž€αž’αžΆαž…αž‡αŸ’αžšαžΎαžŸαžšαžΎαžŸαž‡αž˜αŸ’αžšαžΎαžŸαž‡αžΆαž…αŸ’αžšαžΎαž“)

  • 45,2%αž—αžΆαž–αžŸαŸ’αž’αžΆαžαžŸαŸ’αž’αŸ† ៑៩

  • 33,3%data.table14

  • 54,8%αžαŸ’αž›αžΆαžƒαŸ’αž˜αž»αŸ†αž•αŸαž“αžŠαžΆ ្៣

αž’αŸ’αž“αž€αž”αŸ’αžšαžΎαž”αŸ’αžšαžΆαžŸαŸ‹ 42 αž“αžΆαž€αŸ‹αž”αžΆαž“αž”αŸ„αŸ‡αž†αŸ’αž“αŸ„αžαŸ” αž’αŸ’αž“αž€αž”αŸ’αžšαžΎαž”αŸ’αžšαžΆαžŸαŸ‹ ៧៨ αž“αžΆαž€αŸ‹αžαŸ’αžšαžΌαžœαž”αžΆαž“αž αžΆαž˜αžƒαžΆαžαŸ‹αŸ”

αž”αŸ’αžšαž—αž–: www.habr.com

αž”αž“αŸ’αžαŸ‚αž˜αž˜αžαž·αž™αŸ„αž”αž›αŸ‹