Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

ΠŸΡ€Π΅Ρ‚Ρ€Π°ΠΆΡƒΡ˜ΡƒΡ›ΠΈ Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½ Π½Π° Π˜Π½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Ρƒ, Π½Π°Ρ›ΠΈ Ρ›Π΅Ρ‚Π΅ ΠΌΠΈΠ»ΠΈΠΎΠ½Π΅ Ρ‡Π»Π°Π½Π°ΠΊΠ° ΠΈ ΠΊΠΈΠ»ΠΎΠΌΠ΅Ρ‚Ρ€Π΅ расправа Π½Π° Ρ‚Π΅ΠΌΡƒ који јС Π±ΠΎΡ™ΠΈ, Π±Ρ€ΠΆΠΈ ΠΈ погоднији Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ°. Али, наТалост, сви ΠΎΠ²ΠΈ Ρ‡Π»Π°Π½Ρ†ΠΈ ΠΈ спорови нису посСбно корисни.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Π‘Π²Ρ€Ρ…Π° ΠΎΠ²ΠΎΠ³ Ρ‡Π»Π°Π½ΠΊΠ° јС ΡƒΠΏΠΎΡ€Π΅Ρ’ΠΈΠ²Π°ΡšΠ΅ основних Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ° ΠΎΠ±Ρ€Π°Π΄Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΈΡ˜ΠΈΠΌ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΠΌΠ° ΠΎΠ±Π° јСзика. И ΠΏΠΎΠΌΠΎΠ·ΠΈΡ‚Π΅ Ρ‡ΠΈΡ‚Π°ΠΎΡ†ΠΈΠΌΠ° Π΄Π° Π±Ρ€Π·ΠΎ ΡΠ°Π²Π»Π°Π΄Π°Ρ˜Ρƒ Π½Π΅ΡˆΡ‚ΠΎ ΡˆΡ‚ΠΎ још Π½Π΅ Π·Π½Π°Ρ˜Ρƒ. Π—Π° ΠΎΠ½Π΅ који ΠΏΠΈΡˆΡƒ Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ, ΡΠ°Π·Π½Π°Ρ˜Ρ‚Π΅ ΠΊΠ°ΠΊΠΎ Π΄Π° ΡƒΡ€Π°Π΄Π΅ исту ствар Ρƒ Π -Ρƒ ΠΈ ΠΎΠ±Ρ€Π½ΡƒΡ‚ΠΎ.

Π£ Ρ‡Π»Π°Π½ΠΊΡƒ Ρ›Π΅ΠΌΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°Ρ‚ΠΈ синтаксу Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΈΡ˜ΠΈΡ… ΠΏΠ°ΠΊΠ΅Ρ‚Π° Ρƒ Π . Ово су ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ ΡƒΠΊΡ™ΡƒΡ‡Π΅Π½ΠΈ Ρƒ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ tidyverseΠ° Ρ‚Π°ΠΊΠΎΡ’Π΅ ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚ data.table. И ΡƒΠΏΠΎΡ€Π΅Π΄ΠΈΡ‚Π΅ ΡšΠΈΡ…ΠΎΠ²Ρƒ синтаксу са pandas, Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΈΡ˜ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚ Π·Π° Π°Π½Π°Π»ΠΈΠ·Ρƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ.

ΠŸΡ€ΠΎΡ›ΠΈ Ρ›Π΅ΠΌΠΎ ΠΊΠΎΡ€Π°ΠΊ ΠΏΠΎ ΠΊΠΎΡ€Π°ΠΊ ΠΊΡ€ΠΎΠ· Ρ†Π΅ΠΎ ΠΏΡƒΡ‚ Π°Π½Π°Π»ΠΈΠ·Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΎΠ΄ ΡƒΡ‡ΠΈΡ‚Π°Π²Π°ΡšΠ° Π΄ΠΎ ΠΈΠ·Π²ΠΎΡ’Π΅ΡšΠ° Π°Π½Π°Π»ΠΈΡ‚ΠΈΡ‡ΠΊΠΈΡ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° користСћи ΠŸΠΈΡ‚Ρ…ΠΎΠ½ ΠΈ Π .

Π‘Π°Π΄Ρ€ΠΆΠΈΠ½Π°

Овај Ρ‡Π»Π°Π½Π°ΠΊ сС ΠΌΠΎΠΆΠ΅ користити ΠΊΠ°ΠΎ Π²Π°Ρ€Π°Π»ΠΈΡ†Π° Π°ΠΊΠΎ стС Π·Π°Π±ΠΎΡ€Π°Π²ΠΈΠ»ΠΈ Π΄Π° ΠΈΠ·Π²Ρ€ΡˆΠΈΡ‚Π΅ Π½Π΅ΠΊΡƒ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Ρƒ ΠΎΠ±Ρ€Π°Π΄Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ јСдном ΠΎΠ΄ ΠΏΠ°ΠΊΠ΅Ρ‚Π° који сС Ρ€Π°Π·ΠΌΠ°Ρ‚Ρ€Π°Ρ˜Ρƒ.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

  1. Π“Π»Π°Π²Π½Π΅ синтаксичкС Ρ€Π°Π·Π»ΠΈΠΊΠ΅ ΠΈΠ·ΠΌΠ΅Ρ’Ρƒ Π  ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Π°
    КБНУМКБ. ΠŸΡ€ΠΈΡΡ‚ΡƒΠΏ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°ΠΌΠ° ΠΏΠ°ΠΊΠ΅Ρ‚Π°
    КБНУМКБ. Π”ΠΎΠ΄Π΅Ρ™ΠΈΠ²Π°ΡšΠ΅
    КБНУМКБ. Π˜Π½Π΄Π΅ΠΊΡΠΈΡ€Π°ΡšΠ΅
    КБНУМКБ. ΠœΠ΅Ρ‚ΠΎΠ΄Π΅ ΠΈ ООП
    КБНУМКБ. ЦСвоводи
    КБНУМКБ. Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°
  2. НСколико Ρ€Π΅Ρ‡ΠΈ ΠΎ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΠΌΠ° којС Ρ›Π΅ΠΌΠΎ користити
    КБНУМКБ. тидивСрсС
    КБНУМКБ. ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°
    КБНУМКБ. пандС
  3. Π˜Π½ΡΡ‚Π°Π»ΠΈΡ€Π°ΡšΠ΅ ΠΏΠ°ΠΊΠ΅Ρ‚Π°
  4. Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°
  5. ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°
  6. ΠžΠ΄Π°Π±ΠΈΡ€ ΠΊΠΎΠ»ΠΎΠ½Π° којС су Π²Π°ΠΌ ΠΏΠΎΡ‚Ρ€Π΅Π±Π½Π΅
  7. Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π°
  8. Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π°
  9. Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»Π½Π° ΡƒΠ½ΠΈΡ˜Π° Ρ‚Π°Π±Π΅Π»Π° (УНИОН)
  10. Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π° (ЈОИН)
  11. ОсновнС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° ΠΈ ΠΈΠ·Ρ€Π°Ρ‡ΡƒΠ½Π°Ρ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½Π΅
  12. Π’Π°Π±Π΅Π»Π° ΠΊΠΎΡ€Π΅ΡΠΏΠΎΠ½Π΄Π΅Π½Ρ†ΠΈΡ˜Π΅ ΠΈΠ·ΠΌΠ΅Ρ’Ρƒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° ΠΎΠ±Ρ€Π°Π΄Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π  ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ
  13. Π—Π°ΠΊΡ™ΡƒΡ‡Π°ΠΊ
  14. ΠšΡ€Π°Ρ‚ΠΊΠ° Π°Π½ΠΊΠ΅Ρ‚Π° ΠΎ Ρ‚ΠΎΠΌΠ΅ који ΠΏΠ°ΠΊΠ΅Ρ‚ користитС

Ако стС заинтСрСсовани Π·Π° Π°Π½Π°Π»ΠΈΠ·Ρƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°, ΠΌΠΎΠΆΠ΄Π° Ρ›Π΅Ρ‚Π΅ ΠΏΡ€ΠΎΠ½Π°Ρ›ΠΈ мој Ρ‚Π΅Π»Π΅Π³Ρ€Π°ΠΌ ΠΈ Π˜ΠΎΡƒΠ’ΡƒΠ±Π΅ ΠΊΠ°Π½Π°Π»Π°. Π’Π΅Ρ›ΠΈΠ½Π° ΡΠ°Π΄Ρ€ΠΆΠ°Ρ˜Π° јС посвСћСна Π  Ρ˜Π΅Π·ΠΈΠΊΡƒ.

Π“Π»Π°Π²Π½Π΅ синтаксичкС Ρ€Π°Π·Π»ΠΈΠΊΠ΅ ΠΈΠ·ΠΌΠ΅Ρ’Ρƒ Π  ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Π°

Π”Π° Π±ΠΈΡ… Π²Π°ΠΌ олакшао ΠΏΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Π° Π½Π° Π , ΠΈΠ»ΠΈ ΠΎΠ±Ρ€Π½ΡƒΡ‚ΠΎ, Π΄Π°Ρ›Ρƒ Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ Π³Π»Π°Π²Π½ΠΈΡ… Ρ‚Π°Ρ‡Π°ΠΊΠ° Π½Π° којС Ρ‚Ρ€Π΅Π±Π° Π΄Π° ΠΎΠ±Ρ€Π°Ρ‚ΠΈΡ‚Π΅ ΠΏΠ°ΠΆΡšΡƒ.

ΠŸΡ€ΠΈΡΡ‚ΡƒΠΏ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°ΠΌΠ° ΠΏΠ°ΠΊΠ΅Ρ‚Π°

Када сС ΠΏΠ°ΠΊΠ΅Ρ‚ ΡƒΡ‡ΠΈΡ‚Π° Ρƒ Π , Π½Π΅ ΠΌΠΎΡ€Π°Ρ‚Π΅ Π΄Π° Π½Π°Π²Π΅Π΄Π΅Ρ‚Π΅ ΠΈΠΌΠ΅ ΠΏΠ°ΠΊΠ΅Ρ‚Π° Π΄Π° бистС приступили њСговим Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°ΠΌΠ°. Π£ Π²Π΅Ρ›ΠΈΠ½ΠΈ ΡΠ»ΡƒΡ‡Π°Ρ˜Π΅Π²Π° ΠΎΠ²ΠΎ нијС ΡƒΠΎΠ±ΠΈΡ‡Π°Ρ˜Π΅Π½ΠΎ Ρƒ Π , Π°Π»ΠΈ јС ΠΏΡ€ΠΈΡ…Π²Π°Ρ‚Ρ™ΠΈΠ²ΠΎ. НС ΠΌΠΎΡ€Π°Ρ‚Π΅ ΡƒΠΎΠΏΡˆΡ‚Π΅ Π΄Π° ΡƒΠ²ΠΎΠ·ΠΈΡ‚Π΅ ΠΏΠ°ΠΊΠ΅Ρ‚ Π°ΠΊΠΎ Π²Π°ΠΌ јС ΠΏΠΎΡ‚Ρ€Π΅Π±Π½Π° Π½Π΅ΠΊΠ° ΠΎΠ΄ ΡšΠ΅Π³ΠΎΠ²ΠΈΡ… Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° Ρƒ вашСм ΠΊΠΎΠ΄Ρƒ, Π²Π΅Ρ› Π³Π° Ρ˜Π΅Π΄Π½ΠΎΡΡ‚Π°Π²Π½ΠΎ ΠΏΠΎΠ·ΠΎΠ²ΠΈΡ‚Π΅ Ρ‚Π°ΠΊΠΎ ΡˆΡ‚ΠΎ Ρ›Π΅Ρ‚Π΅ навСсти ΠΈΠΌΠ΅ ΠΏΠ°ΠΊΠ΅Ρ‚Π° ΠΈ ΠΈΠΌΠ΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅. Π Π°Π·Π΄Π΅Π»Π½ΠΈΠΊ ΠΈΠ·ΠΌΠ΅Ρ’Ρƒ ΠΈΠΌΠ΅Π½Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° Ρƒ Π  јС двострука Ρ‚Π°Ρ‡ΠΊΠ°. package_name::function_name().

Π£ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ сС, Π½Π°ΠΏΡ€ΠΎΡ‚ΠΈΠ², сматра класичним позивањС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° Сксплицитним Π½Π°Π²ΠΎΡ’Π΅ΡšΠ΅ΠΌ њСговог ΠΈΠΌΠ΅Π½Π°. Када сС ΠΏΠ°ΠΊΠ΅Ρ‚ ΠΏΡ€Π΅ΡƒΠ·ΠΌΠ΅, ΠΎΠ±ΠΈΡ‡Π½ΠΎ ΠΌΡƒ сС дајС скраћСно ΠΈΠΌΠ΅, Π½ΠΏΡ€. pandas ΠΎΠ±ΠΈΡ‡Π½ΠΎ сС користи псСудоним pd. Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚Π° сС приступа ΠΏΡ€Π΅ΠΊΠΎ Ρ‚Π°Ρ‡ΠΊΠ΅ package_name.function_name().

Π”ΠΎΠ΄Π΅Ρ™ΠΈΠ²Π°ΡšΠ΅

Π£ Π , ΡƒΠΎΠ±ΠΈΡ‡Π°Ρ˜Π΅Π½ΠΎ јС користити стрСлицу Π·Π° Π΄ΠΎΠ΄Π΅Ρ™ΠΈΠ²Π°ΡšΠ΅ врСдности ΠΎΠ±Ρ˜Π΅ΠΊΡ‚Ρƒ. obj_name <- value, ΠΈΠ°ΠΊΠΎ јС Π΄ΠΎΠ·Π²ΠΎΡ™Π΅Π½ јСдан Π·Π½Π°ΠΊ Ρ˜Π΅Π΄Π½Π°ΠΊΠΎΡΡ‚ΠΈ, јСдан Π·Π½Π°ΠΊ Ρ˜Π΅Π΄Π½Π°ΠΊΠΎΡΡ‚ΠΈ Ρƒ Π  сС користи првСнствСно Π·Π° ΠΏΡ€ΠΎΡΠ»Π΅Ρ’ΠΈΠ²Π°ΡšΠ΅ врСдности Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΈΠΌΠ° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅.

Π£ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ, Π΄ΠΎΠ΄Π΅Ρ™ΠΈΠ²Π°ΡšΠ΅ сС Π²Ρ€ΡˆΠΈ искључиво са јСдним Π·Π½Π°ΠΊΠΎΠΌ Ρ˜Π΅Π΄Π½Π°ΠΊΠΎΡΡ‚ΠΈ obj_name = value.

Π˜Π½Π΄Π΅ΠΊΡΠΈΡ€Π°ΡšΠ΅

ОвдС Ρ‚Π°ΠΊΠΎΡ’Π΅ ΠΏΠΎΡΡ‚ΠΎΡ˜Π΅ ΠΏΡ€ΠΈΠ»ΠΈΡ‡Π½ΠΎ Π·Π½Π°Ρ‡Π°Ρ˜Π½Π΅ Ρ€Π°Π·Π»ΠΈΠΊΠ΅. Π£ Π , ΠΈΠ½Π΄Π΅ΠΊΡΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎΡ‡ΠΈΡšΠ΅ ΠΎΠ΄ јСдан ΠΈ ΡƒΠΊΡ™ΡƒΡ‡ΡƒΡ˜Π΅ свС Π½Π°Π²Π΅Π΄Π΅Π½Π΅ Π΅Π»Π΅ΠΌΠ΅Π½Ρ‚Π΅ Ρƒ Ρ€Π΅Π·ΡƒΠ»Ρ‚ΡƒΡ˜ΡƒΡ›Π΅ΠΌ опсСгу,

Π£ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ ΠΈΠ½Π΄Π΅ΠΊΡΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎΡ‡ΠΈΡšΠ΅ ΠΎΠ΄ Π½ΡƒΠ»Π΅ ΠΈ ΠΈΠ·Π°Π±Ρ€Π°Π½ΠΈ опсСг Π½Π΅ ΡƒΠΊΡ™ΡƒΡ‡ΡƒΡ˜Π΅ послСдњи Π΅Π»Π΅ΠΌΠ΅Π½Ρ‚ Π½Π°Π²Π΅Π΄Π΅Π½ Ρƒ индСксу. Π”Π°ΠΊΠ»Π΅ дизајн x[i:j] Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ Π½Π΅Ρ›Π΅ ΡƒΠΊΡ™ΡƒΡ‡ΠΈΠ²Π°Ρ‚ΠΈ ј Π΅Π»Π΅ΠΌΠ΅Π½Ρ‚.

ΠŸΠΎΡΡ‚ΠΎΡ˜Π΅ ΠΈ Ρ€Π°Π·Π»ΠΈΠΊΠ΅ Ρƒ Π½Π΅Π³Π°Ρ‚ΠΈΠ²Π½ΠΎΠΌ ΠΈΠ½Π΄Π΅ΠΊΡΠΈΡ€Π°ΡšΡƒ, Ρƒ Π  Π½ΠΎΡ‚Π°Ρ†ΠΈΡ˜ΠΈ x[-1] Ρ›Π΅ Π²Ρ€Π°Ρ‚ΠΈΡ‚ΠΈ свС Π΅Π»Π΅ΠΌΠ΅Π½Ρ‚Π΅ Π²Π΅ΠΊΡ‚ΠΎΡ€Π° осим послСдњСг. Π£ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ, слична Π½ΠΎΡ‚Π°Ρ†ΠΈΡ˜Π° Ρ›Π΅ Π²Ρ€Π°Ρ‚ΠΈΡ‚ΠΈ само послСдњи Π΅Π»Π΅ΠΌΠ΅Π½Ρ‚.

ΠœΠ΅Ρ‚ΠΎΠ΄Π΅ ΠΈ ООП

Π  ΠΈΠΌΠΏΠ»Π΅ΠΌΠ΅Π½Ρ‚ΠΈΡ€Π° ООП Π½Π° свој Π½Π°Ρ‡ΠΈΠ½, ΠΎ Ρ‚ΠΎΠΌΠ΅ сам писао Ρƒ Ρ‡Π»Π°Π½ΠΊΡƒ β€žΠžΠžΠŸ Π½Π° Ρ˜Π΅Π·ΠΈΠΊΡƒ Π  (1. Π΄Π΅ΠΎ): Π‘3 ΠΊΠ»Π°ΡΠ΅β€œ. Π£ΠΎΠΏΡˆΡ‚Π΅Π½ΠΎ Π³ΠΎΠ²ΠΎΡ€Π΅Ρ›ΠΈ, Π  јС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»Π½ΠΈ јСзик ΠΈ свС Ρƒ ΡšΠ΅ΠΌΡƒ јС ΠΈΠ·Π³Ρ€Π°Ρ’Π΅Π½ΠΎ Π½Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°ΠΌΠ°. Π‘Ρ‚ΠΎΠ³Π°, Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π·Π° корисникС ΠΏΡ€ΠΎΠ³Ρ€Π°ΠΌΠ° Π•ΠΊΡ†Π΅Π» ΠΈΠ΄ΠΈΡ‚Π΅ Π½Π° tydiverse Π±ΠΈΡ›Π΅ лакшС Π½Π΅Π³ΠΎ pandas. Иако јС ΠΎΠ²ΠΎ ΠΌΠΎΠΆΠ΄Π° мојС ΡΡƒΠ±Ρ˜Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΌΠΈΡˆΡ™Π΅ΡšΠ΅.

Π£ΠΊΡ€Π°Ρ‚ΠΊΠΎ, ΠΎΠ±Ρ˜Π΅ΠΊΡ‚ΠΈ Ρƒ Π  Π½Π΅ΠΌΠ°Ρ˜Ρƒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π΅ (Π°ΠΊΠΎ Π³ΠΎΠ²ΠΎΡ€ΠΈΠΌΠΎ ΠΎ Π‘3 класама, Π°Π»ΠΈ ΠΏΠΎΡΡ‚ΠΎΡ˜Π΅ ΠΈ Π΄Ρ€ΡƒΠ³Π΅ ООП ΠΈΠΌΠΏΠ»Π΅ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡ˜Π΅ којС су ΠΌΠ½ΠΎΠ³ΠΎ Ρ€Π΅Ρ’Π΅). ΠŸΠΎΡΡ‚ΠΎΡ˜Π΅ само Π³Π΅Π½Π΅Ρ€Π°Π»ΠΈΠ·ΠΎΠ²Π°Π½Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ којС ΠΈΡ… Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚ΠΎ ΠΎΠ±Ρ€Π°Ρ’ΡƒΡ˜Ρƒ Ρƒ зависности ΠΎΠ΄ класС ΠΎΠ±Ρ˜Π΅ΠΊΡ‚Π°.

Π¦Π΅Π²ΠΎΠ²ΠΎΠ΄ΠΈ

МоТда јС ΠΎΠ²ΠΎ ΠΈΠΌΠ΅ Π·Π° pandas НСћС Π±ΠΈΡ‚ΠΈ сасвим Ρ‚Π°Ρ‡Π½ΠΎ, Π°Π»ΠΈ ΠΏΠΎΠΊΡƒΡˆΠ°Ρ›Ρƒ Π΄Π° објасним Π·Π½Π°Ρ‡Π΅ΡšΠ΅.

Π”Π° Π½Π΅ бистС сачували ΠΌΠ΅Ρ’ΡƒΠΏΡ€ΠΎΡ€Π°Ρ‡ΡƒΠ½Π΅ ΠΈ Π½Π΅ ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΠ»ΠΈ Π½Π΅ΠΏΠΎΡ‚Ρ€Π΅Π±Π½Π΅ ΠΎΠ±Ρ˜Π΅ΠΊΡ‚Π΅ Ρƒ Ρ€Π°Π΄Π½ΠΎΠΌ ΠΎΠΊΡ€ΡƒΠΆΠ΅ΡšΡƒ, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ користити Π½Π΅ΠΊΡƒ врсту Ρ†Π΅Π²ΠΎΠ²ΠΎΠ΄Π°. ОнС. ΠΏΡ€Π΅Π½Π΅Ρ‚ΠΈ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ ΠΏΡ€ΠΎΡ€Π°Ρ‡ΡƒΠ½Π° са јСднС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ Π½Π° Π΄Ρ€ΡƒΠ³Ρƒ ΠΈ Π½Π΅ Ρ‡ΡƒΠ²Π°Ρ‚ΠΈ ΠΌΠ΅Ρ’ΡƒΡ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚Π΅.

Π£Π·ΠΌΠΈΠΌΠΎ слСдСћи ΠΏΡ€ΠΈΠΌΠ΅Ρ€ ΠΊΠΎΠ΄Π°, Π³Π΄Π΅ посрСднС ΠΏΡ€ΠΎΡ€Π°Ρ‡ΡƒΠ½Π΅ Ρ‡ΡƒΠ²Π°ΠΌΠΎ Ρƒ одвојСним ΠΎΠ±Ρ˜Π΅ΠΊΡ‚ΠΈΠΌΠ°:

temp_object <- func1()
temp_object2 <- func2(temp_object )
obj <- func3(temp_object2 )

ИзвСли смо 3 ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π΅ узастопно, Π° Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ свакС јС сачуван Ρƒ посСбном ΠΎΠ±Ρ˜Π΅ΠΊΡ‚Ρƒ. Али Ρƒ ствари, ΠΎΠ²ΠΈ ΠΌΠ΅Ρ’ΡƒΠΎΠ±Ρ˜Π΅ΠΊΡ‚ΠΈ Π½Π°ΠΌ нису ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΈ.

Или још Π³ΠΎΡ€Π΅, Π°Π»ΠΈ ΠΏΠΎΠ·Π½Π°Ρ‚ΠΈΡ˜Π΅ корисницима Π•ΠΊΡ†Π΅Π»-Π°.

obj  <- func3(func2(func1()))

Π£ ΠΎΠ²ΠΎΠΌ ΡΠ»ΡƒΡ‡Π°Ρ˜Ρƒ нисмо сачували ΠΌΠ΅Ρ’ΡƒΡ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚Π΅ ΠΏΡ€ΠΎΡ€Π°Ρ‡ΡƒΠ½Π°, Π°Π»ΠΈ јС Ρ‡ΠΈΡ‚Π°ΡšΠ΅ ΠΊΠΎΠ΄Π° са ΡƒΠ³Π½Π΅ΠΆΡ’Π΅Π½ΠΈΠΌ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°ΠΌΠ° ΠΈΠ·ΡƒΠ·Π΅Ρ‚Π½ΠΎ Π½Π΅Π·Π³ΠΎΠ΄Π½ΠΎ.

ΠŸΠΎΠ³Π»Π΅Π΄Π°Ρ›Π΅ΠΌΠΎ Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ приступа ΠΎΠ±Ρ€Π°Π΄ΠΈ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π -Ρƒ, Π° ΠΎΠ½ΠΈ ΠΎΠ±Π°Π²Ρ™Π°Ρ˜Ρƒ сличнС ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π΅ Π½Π° Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚Π΅ Π½Π°Ρ‡ΠΈΠ½Π΅.

Π¦Π΅Π²ΠΎΠ²ΠΎΠ΄ΠΈ Ρƒ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅Ρ†ΠΈ tidyverse ΠΈΠΌΠΏΠ»Π΅ΠΌΠ΅Π½Ρ‚ΠΈΡ€Π° ΠΎΠΏΠ΅Ρ€Π°Ρ‚Π΅Ρ€ %>%.

obj <- func1() %>% 
            func2() %>%
            func3()

Π’Π°ΠΊΠΎ ΡƒΠ·ΠΈΠΌΠ°ΠΌΠΎ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ Ρ€Π°Π΄Π° func1() ΠΈ прослСдитС Π³Π° ΠΊΠ°ΠΎ ΠΏΡ€Π²ΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ func2(), ΠΎΠ½Π΄Π° Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ ΠΎΠ²ΠΎΠ³ ΠΏΡ€ΠΎΡ€Π°Ρ‡ΡƒΠ½Π° прСносимо ΠΊΠ°ΠΎ ΠΏΡ€Π²ΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ func3(). И Π½Π° ΠΊΡ€Π°Ρ˜Ρƒ свС ΠΈΠ·Π²Ρ€ΡˆΠ΅Π½Π΅ ΠΏΡ€ΠΎΡ€Π°Ρ‡ΡƒΠ½Π΅ ΡƒΠΏΠΈΡΡƒΡ˜Π΅ΠΌΠΎ Ρƒ ΠΎΠ±Ρ˜Π΅ΠΊΠ°Ρ‚ obj <-.

Π‘Π²Π΅ Π³ΠΎΡ€Π΅ Π½Π°Π²Π΅Π΄Π΅Π½ΠΎ јС Π±ΠΎΡ™Π΅ ΠΎΠ΄ Ρ€Π΅Ρ‡ΠΈ илустровано ΠΎΠ²ΠΈΠΌ ΠΌΠ΅ΠΌΠΎΠΌ:
Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Π’ data.table Π»Π°Π½Ρ†ΠΈ сС користС Π½Π° сличан Π½Π°Ρ‡ΠΈΠ½.

newDT <- DT[where, select|update|do, by][where, select|update|do, by][where, select|update|do, by]

Π£ свакој ΠΎΠ΄ угластих Π·Π°Π³Ρ€Π°Π΄Π° ΠΌΠΎΠΆΠ΅Ρ‚Π΅ користити Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ ΠΏΡ€Π΅Ρ‚Ρ…ΠΎΠ΄Π½Π΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π΅.

Π’ pandas Ρ‚Π°ΠΊΠ²Π΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π΅ су одвојСнС Ρ‚Π°Ρ‡ΠΊΠΎΠΌ.

obj = df.fun1().fun2().fun3()

ОнС. ΡƒΠ·ΠΈΠΌΠ°ΠΌΠΎ свој сто df ΠΈ користити њСн ΠΌΠ΅Ρ‚ΠΎΠ΄ fun1(), Π·Π°Ρ‚ΠΈΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρƒ ΠΏΡ€ΠΈΠΌΠ΅ΡšΡƒΡ˜Π΅ΠΌΠΎ Π½Π° добијСни Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ fun2(), послС fun3(). Π”ΠΎΠ±ΠΈΡ˜Π΅Π½ΠΈ Ρ€Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ сС Ρ‡ΡƒΠ²Π° Ρƒ ΠΎΠ±Ρ˜Π΅ΠΊΡ‚Ρƒ ΠžΠ‘Πˆ .

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π  ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ су сличнС, Π°Π»ΠΈ ΠΈΠΌΠ°Ρ˜Ρƒ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚Π° ΠΈΠΌΠ΅Π½Π°.

Опис
ИмС Ρƒ Π 
ИмС Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½/пандас

Π‘Ρ‚Ρ€ΡƒΠΊΡ‚ΡƒΡ€Π° Ρ‚Π°Π±Π΅Π»Π΅
Π΄Π°Ρ‚Π°.Ρ„Ρ€Π°ΠΌΠ΅, Π΄Π°Ρ‚Π°.Ρ‚Π°Π±Π»Π΅, Ρ‚ΠΈΠ±Π±Π»Π΅
ΠžΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°

ЈСднодимСнзионална листа врСдности
Π’Π΅Ρ†Ρ‚ΠΎΡ€
Π‘Π΅Ρ€ΠΈΡ˜Π° Ρƒ ΠΏΠ°Π½Π΄Π°ΠΌΠ° ΠΈΠ»ΠΈ листа Ρƒ чистом ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ

Π’ΠΈΡˆΠ΅ΡΠ»ΠΎΡ˜Π½Π° Π½Π΅Ρ‚Π°Π±Π΅Π»Π°Ρ€Π½Π° структура
Листа
Ρ€Π΅Ρ‡Π½ΠΈΠΊ (Π΄ΠΈΠΊΡ‚)

Π£ наставку Ρ›Π΅ΠΌΠΎ ΠΏΠΎΠ³Π»Π΅Π΄Π°Ρ‚ΠΈ Π½Π΅ΠΊΠ΅ Π΄Ρ€ΡƒΠ³Π΅ карактСристикС ΠΈ Ρ€Π°Π·Π»ΠΈΠΊΠ΅ Ρƒ синтакси.

НСколико Ρ€Π΅Ρ‡ΠΈ ΠΎ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΠΌΠ° којС Ρ›Π΅ΠΌΠΎ користити

ΠŸΡ€Π²ΠΎ Ρ›Ρƒ Π²Π°ΠΌ Ρ€Π΅Ρ›ΠΈ Π½Π΅ΡˆΡ‚ΠΎ ΠΎ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΠΌΠ° са којима Ρ›Π΅Ρ‚Π΅ сС ΡƒΠΏΠΎΠ·Π½Π°Ρ‚ΠΈ Ρ‚ΠΎΠΊΠΎΠΌ ΠΎΠ²ΠΎΠ³ Ρ‡Π»Π°Π½ΠΊΠ°.

тидивСрсС

Π—Π²Π°Π½ΠΈΡ‡Π½ΠΈ ΡΠ°Ρ˜Ρ‚: тидивСрсС.ΠΎΡ€Π³
Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄
Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° tidyverse написао Π₯Π΅Π΄Π»ΠΈ Π’ΠΈΠΊΠ°ΠΌ, виши Π½Π°ΡƒΡ‡Π½ΠΈ Π½Π°ΡƒΡ‡Π½ΠΈΠΊ Ρƒ Π Π‘Ρ‚ΡƒΠ΄ΠΈΡƒ. tidyverse ΡΠ°ΡΡ‚ΠΎΡ˜ΠΈ сС ΠΎΠ΄ импрСсивног скупа ΠΏΠ°ΠΊΠ΅Ρ‚Π° који ΠΏΠΎΡ˜Π΅Π΄Π½ΠΎΡΡ‚Π°Π²Ρ™ΡƒΡ˜Ρƒ ΠΎΠ±Ρ€Π°Π΄Ρƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°, ΠΎΠ΄ ΠΊΠΎΡ˜ΠΈΡ… јС 5 ΡƒΠΊΡ™ΡƒΡ‡Π΅Π½ΠΎ Ρƒ ΠΏΡ€Π²ΠΈΡ… 10 ΠΏΡ€Π΅ΡƒΠ·ΠΈΠΌΠ°ΡšΠ° ΠΈΠ· ЦРАН ΡΠΏΡ€Π΅ΠΌΠΈΡˆΡ‚Π°.

ΠˆΠ΅Π·Π³Ρ€ΠΎ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ΅ Ρ‡ΠΈΠ½Π΅ слСдСћи ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ: ggplot2, dplyr, tidyr, readr, purrr, tibble, stringr, forcats. Π‘Π²Π°ΠΊΠΈ ΠΎΠ΄ ΠΎΠ²ΠΈΡ… ΠΏΠ°ΠΊΠ΅Ρ‚Π° јС усмСрСн Π½Π° Ρ€Π΅ΡˆΠ°Π²Π°ΡšΠ΅ ΠΎΠ΄Ρ€Π΅Ρ’Π΅Π½ΠΎΠ³ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°. На ΠΏΡ€ΠΈΠΌΠ΅Ρ€ dplyr ΠΊΡ€Π΅ΠΈΡ€Π°Π½ Π·Π° ΠΌΠ°Π½ΠΈΠΏΡƒΠ»Π°Ρ†ΠΈΡ˜Ρƒ ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ°, tidyr Π΄Π° Π΄ΠΎΠ²Π΅Π΄Π΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅ Ρƒ ΡƒΡ€Π΅Π΄Π°Π½ ΠΎΠ±Π»ΠΈΠΊ, stringr ΠΏΠΎΡ˜Π΅Π΄Π½ΠΎΡΡ‚Π°Π²Ρ™ΡƒΡ˜Π΅ Ρ€Π°Π΄ са стринговима, ΠΈ ggplot2 јС јСдан ΠΎΠ΄ Π½Π°Ρ˜ΠΏΠΎΠΏΡƒΠ»Π°Ρ€Π½ΠΈΡ˜ΠΈΡ… Π°Π»Π°Ρ‚Π° Π·Π° Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Ρƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°.

ΠŸΡ€Π΅Π΄Π½ΠΎΡΡ‚ tidyverse јС Ρ˜Π΅Π΄Π½ΠΎΡΡ‚Π°Π²Π½ΠΎΡΡ‚ ΠΈ Π»Π°ΠΊΠΎ Ρ‡ΠΈΡ‚Ρ™ΠΈΠ²Π° синтакса, која јС Π½Π° ΠΌΠ½ΠΎΠ³ΠΎ Π½Π°Ρ‡ΠΈΠ½Π° слична Π‘ΠšΠ› Ρ˜Π΅Π·ΠΈΠΊΡƒ ΡƒΠΏΠΈΡ‚Π°.

ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄Π—Π²Π°Π½ΠΈΡ‡Π½ΠΈ ΡΠ°Ρ˜Ρ‚: Ρ€-Π΄Π°Ρ‚Π°Ρ‚Π°Π±Π»Π΅.Ρ†ΠΎΠΌ

Од Π°ΡƒΡ‚ΠΎΡ€Π° data.table јС ΠœΠ°Ρ‚Ρ‚ Π”ΠΎΠ»Π΅ ΠΈΠ· Π₯2О.Π°ΠΈ.

ΠŸΡ€Π²ΠΎ издањС Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ΅ ΠΎΠ΄Ρ€ΠΆΠ°Π½ΠΎ јС 2006. Π³ΠΎΠ΄ΠΈΠ½Π΅.

Бинтакса ΠΏΠ°ΠΊΠ΅Ρ‚Π° нијС Ρ‚Π°ΠΊΠΎ Π·Π³ΠΎΠ΄Π½Π° ΠΊΠ°ΠΎ Ρƒ tidyverse ΠΈ вишС подсСћа Π½Π° класичнС ΠΎΠΊΠ²ΠΈΡ€Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π , Π°Π»ΠΈ јС истоврСмСно Π·Π½Π°Ρ‡Π°Ρ˜Π½ΠΎ ΠΏΡ€ΠΎΡˆΠΈΡ€Π΅Π½ Ρƒ функционалности.

Π‘Π²Π΅ ΠΌΠ°Π½ΠΈΠΏΡƒΠ»Π°Ρ†ΠΈΡ˜Π΅ са Ρ‚Π°Π±Π΅Π»ΠΎΠΌ Ρƒ ΠΎΠ²ΠΎΠΌ ΠΏΠ°ΠΊΠ΅Ρ‚Ρƒ су описанС Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ°, Π° Π°ΠΊΠΎ ΠΏΡ€Π΅Π²Π΅Π΄Π΅Ρ‚Π΅ синтаксу data.table Ρƒ Π‘ΠšΠ›-Ρƒ Π΄ΠΎΠ±ΠΈΡ˜Π°Ρ‚Π΅ Π½Π΅ΡˆΡ‚ΠΎ ΠΎΠ²Π°ΠΊΠΎ: data.table[ WHERE, SELECT, GROUP BY ]

Π‘Π½Π°Π³Π° ΠΎΠ²ΠΎΠ³ ΠΏΠ°ΠΊΠ΅Ρ‚Π° јС Π±Ρ€Π·ΠΈΠ½Π° ΠΎΠ±Ρ€Π°Π΄Π΅ Π²Π΅Π»ΠΈΠΊΠΈΡ… ΠΊΠΎΠ»ΠΈΡ‡ΠΈΠ½Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°.

ΠΏΠ°Π½Π΄Π΅

Π—Π²Π°Π½ΠΈΡ‡Π½ΠΈ ΡΠ°Ρ˜Ρ‚: пандас.ΠΏΠΈΠ΄Π°Ρ‚Π°.ΠΎΡ€Π³ Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Назив Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ΅ ΠΏΠΎΡ‚ΠΈΡ‡Π΅ ΠΎΠ΄ Π΅ΠΊΠΎΠ½ΠΎΠΌΠ΅Ρ‚Ρ€ΠΈΡ˜ΡΠΊΠΎΠ³ Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π° β€žΠΏΠ°Π½Π΅Π» ΠΏΠΎΠ΄Π°Ρ†ΠΈβ€œ, који сС користи Π·Π° описивањС Π²ΠΈΡˆΠ΅Π΄ΠΈΠΌΠ΅Π½Π·ΠΈΠΎΠ½Π°Π»Π½ΠΈΡ… структурираних скупова ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡ˜Π°.

Од Π°ΡƒΡ‚ΠΎΡ€Π° pandas јС АмСриканац ВСс МСкини.

Када јС Ρ€Π΅Ρ‡ ΠΎ Π°Π½Π°Π»ΠΈΠ·ΠΈ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ, јСднако pandas НС. Π’Π΅ΠΎΠΌΠ° ΠΌΡƒΠ»Ρ‚ΠΈΡ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»Π°Π½ ΠΏΠ°ΠΊΠ΅Ρ‚ високог Π½ΠΈΠ²ΠΎΠ° који Π²Π°ΠΌ ΠΎΠΌΠΎΠ³ΡƒΡ›Π°Π²Π° Π΄Π° ΠΈΠ·Π²Ρ€ΡˆΠΈΡ‚Π΅ Π±ΠΈΠ»ΠΎ ΠΊΠ°ΠΊΠ²Ρƒ ΠΌΠ°Π½ΠΈΠΏΡƒΠ»Π°Ρ†ΠΈΡ˜Ρƒ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ°, ΠΎΠ΄ ΡƒΡ‡ΠΈΡ‚Π°Π²Π°ΡšΠ° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΈΠ· Π±ΠΈΠ»ΠΎ ΠΊΠΎΠ³ ΠΈΠ·Π²ΠΎΡ€Π° Π΄ΠΎ Π²ΠΈΠ·ΡƒΠ΅Π»ΠΈΠ·Π°Ρ†ΠΈΡ˜Π΅.

Π˜Π½ΡΡ‚Π°Π»ΠΈΡ€Π°ΡšΠ΅ Π΄ΠΎΠ΄Π°Ρ‚Π½ΠΈΡ… ΠΏΠ°ΠΊΠ΅Ρ‚Π°

ΠŸΠ°ΠΊΠ΅Ρ‚ΠΈ ΠΎ којима сС Π³ΠΎΠ²ΠΎΡ€ΠΈ Ρƒ ΠΎΠ²ΠΎΠΌ Ρ‡Π»Π°Π½ΠΊΡƒ нису ΡƒΠΊΡ™ΡƒΡ‡Π΅Π½ΠΈ Ρƒ основнС Π  ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½ Π΄ΠΈΡΡ‚Ρ€ΠΈΠ±ΡƒΡ†ΠΈΡ˜Π΅. Иако ΠΏΠΎΡΡ‚ΠΎΡ˜ΠΈ ΠΌΠ°Π»ΠΎ ΡƒΠΏΠΎΠ·ΠΎΡ€Π΅ΡšΠ΅, Π°ΠΊΠΎ стС инсталирали Π΄ΠΈΡΡ‚Ρ€ΠΈΠ±ΡƒΡ†ΠΈΡ˜Ρƒ Анацонда, ΠΈΠ½ΡΡ‚Π°Π»ΠΈΡ€Π°Ρ˜Ρ‚Π΅ Π΄ΠΎΠ΄Π°Ρ‚Π½ΠΎ pandas нијС ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ.

Π˜Π½ΡΡ‚Π°Π»ΠΈΡ€Π°ΡšΠ΅ ΠΏΠ°ΠΊΠ΅Ρ‚Π° Ρƒ Π 

Ако стС Π±Π°Ρ€ јСдном ΠΎΡ‚Π²ΠΎΡ€ΠΈΠ»ΠΈ Ρ€Π°Π·Π²ΠΎΡ˜Π½ΠΎ ΠΎΠΊΡ€ΡƒΠΆΠ΅ΡšΠ΅ Π Π‘Ρ‚ΡƒΠ΄ΠΈΠΎ, Π²Π΅Ρ€ΠΎΠ²Π°Ρ‚Π½ΠΎ Π²Π΅Ρ› Π·Π½Π°Ρ‚Π΅ ΠΊΠ°ΠΊΠΎ Π΄Π° инсталиратС ΠΏΠΎΡ‚Ρ€Π΅Π±Π°Π½ ΠΏΠ°ΠΊΠ΅Ρ‚ Ρƒ Π . Π”Π° бистС инсталирали ΠΏΠ°ΠΊΠ΅Ρ‚Π΅, користитС стандардну ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ install.packages() ΠΏΠΎΠΊΡ€Π΅Ρ‚Π°ΡšΠ΅ΠΌ Π΄ΠΈΡ€Π΅ΠΊΡ‚Π½ΠΎ Ρƒ самом Π .

# установка ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ²
install.packages("vroom")
install.packages("readr")
install.packages("dplyr")
install.packages("data.table")

Након ΠΈΠ½ΡΡ‚Π°Π»Π°Ρ†ΠΈΡ˜Π΅ ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ јС ΠΏΠΎΠ²Π΅Π·Π°Ρ‚ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚Π΅, Π·Π° ΡˆΡ‚Π° сС Ρƒ Π²Π΅Ρ›ΠΈΠ½ΠΈ ΡΠ»ΡƒΡ‡Π°Ρ˜Π΅Π²Π° користи ΠΊΠΎΠΌΠ°Π½Π΄Π° library().

# ΠΏΠΎΠ΄ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅ ΠΈΠ»ΠΈ ΠΈΠΌΠΏΠΎΡ€Ρ‚ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠ² Π² Ρ€Π°Π±ΠΎΡ‡Π΅Π΅ ΠΎΠΊΡ€ΡƒΠΆΠ΅Π½ΠΈΠ΅
library(vroom)
library(readr)
library(dplyr)
library(data.table)

Π˜Π½ΡΡ‚Π°Π»ΠΈΡ€Π°ΡšΠ΅ ΠΏΠ°ΠΊΠ΅Ρ‚Π° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ

Π”Π°ΠΊΠ»Π΅, Π°ΠΊΠΎ ΠΈΠΌΠ°Ρ‚Π΅ инсталиран чисти ΠŸΠΈΡ‚Ρ…ΠΎΠ½ pandas ΠΌΠΎΡ€Π°Ρ‚Π΅ Π΄Π° Π³Π° инсталиратС Ρ€ΡƒΡ‡Π½ΠΎ. ΠžΡ‚Π²ΠΎΡ€ΠΈΡ‚Π΅ ΠΊΠΎΠΌΠ°Π½Π΄Π½Ρƒ Π»ΠΈΠ½ΠΈΡ˜Ρƒ ΠΈΠ»ΠΈ Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Π», Ρƒ зависности ΠΎΠ΄ вашСг ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΈΠ²Π½ΠΎΠ³ систСма ΠΈ унСситС слСдСћу ΠΊΠΎΠΌΠ°Π½Π΄Ρƒ.

pip install pandas

Π—Π°Ρ‚ΠΈΠΌ сС Π²Ρ€Π°Ρ›Π°ΠΌΠΎ Π½Π° ΠŸΠΈΡ‚Ρ…ΠΎΠ½ ΠΈ ΠΊΠΎΠΌΠ°Π½Π΄ΠΎΠΌ ΡƒΠ²ΠΎΠ·ΠΈΠΌΠΎ инсталирани ΠΏΠ°ΠΊΠ΅Ρ‚ import.

import pandas as pd

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°

Π”Π°Ρ‚Π° ΠΌΠΈΠ½ΠΈΠ½Π³ јС јСдан ΠΎΠ΄ Π½Π°Ρ˜Π²Π°ΠΆΠ½ΠΈΡ˜ΠΈΡ… ΠΊΠΎΡ€Π°ΠΊΠ° Ρƒ Π°Π½Π°Π»ΠΈΠ·ΠΈ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°. И ΠŸΠΈΡ‚Ρ…ΠΎΠ½ ΠΈ Π , Π°ΠΊΠΎ ΠΆΠ΅Π»ΠΈΡ‚Π΅, ΠΏΡ€ΡƒΠΆΠ°Ρ˜Ρƒ Π²Π°ΠΌ ΡˆΠΈΡ€ΠΎΠΊΠ΅ могућности Π·Π° добијањС ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΈΠ· Π±ΠΈΠ»ΠΎ ΠΊΠΎΠ³ ΠΈΠ·Π²ΠΎΡ€Π°: Π»ΠΎΠΊΠ°Π»Π½ΠΈΡ… Π΄Π°Ρ‚ΠΎΡ‚Π΅ΠΊΠ°, Π΄Π°Ρ‚ΠΎΡ‚Π΅ΠΊΠ° са Π˜Π½Ρ‚Π΅Ρ€Π½Π΅Ρ‚Π°, Π²Π΅Π± Π»ΠΎΠΊΠ°Ρ†ΠΈΡ˜Π°, свих врста Π±Π°Π·Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Π£ Ρ‡Π»Π°Π½ΠΊΡƒ Ρ›Π΅ΠΌΠΎ користити Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ скупова ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°:

  1. Π”Π²Π° ΠΏΡ€Π΅ΡƒΠ·ΠΈΠΌΠ°ΡšΠ° са Π“ΠΎΠΎΠ³Π»Π΅ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ΅.
  2. Π’ΠΈΡ‚Π°Π½ΠΈΡ† ΠŸΠ°ΡΡΠ΅Π½Π³Π΅Ρ€ ДатасСт.

Π‘Π²ΠΈ ΠΏΠΎΠ΄Π°Ρ†ΠΈ су Π½Π° ΠΌΠΎΠΌ Π“ΠΈΡ‚Π₯ΡƒΠ± Ρƒ ΠΎΠ±Π»ΠΈΠΊΡƒ цсв ΠΈ тсв Π΄Π°Ρ‚ΠΎΡ‚Π΅ΠΊΠ°. ОдаклС Ρ›Π΅ΠΌΠΎ ΠΈΡ… Ρ‚Ρ€Π°ΠΆΠΈΡ‚ΠΈ?

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : тидивСрсС, Π²Ρ€ΠΎΠΎΠΌ, Ρ€Π΅Π°Π΄Ρ€

Π—Π° ΡƒΡ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΡƒ tidyverse ΠŸΠΎΡΡ‚ΠΎΡ˜Π΅ Π΄Π²Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π°: vroom, readr. vroom ΠΌΠΎΠ΄Π΅Ρ€Π½ΠΈΡ˜ΠΈ, Π°Π»ΠΈ Ρƒ будућности ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈ ΠΌΠΎΠ³Ρƒ Π±ΠΈΡ‚ΠΈ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΎΠ²Π°Π½ΠΈ.

Π¦ΠΈΡ‚Π°Ρ‚ ΠΈΠ· Π·Π²Π°Π½ΠΈΡ‡Π½Π° Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡ˜Π° vroom.

Π²Ρ€ΠΎΠΎΠΌ вс Ρ€Π΅Π°Π΄Π΅Ρ€
Π¨Ρ‚Π° Π·Π½Π°Ρ‡ΠΈ ΠΎΡΠ»ΠΎΠ±Π°Ρ’Π°ΡšΠ΅ ΠΎΠ΄ vroom Π·Π½Π°Ρ‡ΠΈ Π·Π° readr? Π—Π° сада ΠΏΠ»Π°Π½ΠΈΡ€Π°ΠΌΠΎ Π΄Π° Π΄ΠΎΠ·Π²ΠΎΠ»ΠΈΠΌΠΎ Π΄Π° сС ΠΎΠ²Π° Π΄Π²Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° Ρ€Π°Π·Π²ΠΈΡ˜Π°Ρ˜Ρƒ одвојСно, Π°Π»ΠΈ Π²Π΅Ρ€ΠΎΠ²Π°Ρ‚Π½ΠΎ Ρ›Π΅ΠΌΠΎ Ρƒ будућности ΡƒΡ˜Π΅Π΄ΠΈΠ½ΠΈΡ‚ΠΈ ΠΏΠ°ΠΊΠ΅Ρ‚Π΅. ЈСдна ΠΌΠ°Π½Π° Π²Ρ€ΠΎΠΎΠΌΠΎΠ²ΠΎΠ³ лСњог Ρ‡ΠΈΡ‚Π°ΡšΠ° јС Π΄Π° сС ΠΎΠ΄Ρ€Π΅Ρ’Π΅Π½ΠΈ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° Π½Π΅ ΠΌΠΎΠ³Ρƒ ΠΏΡ€ΠΈΡ˜Π°Π²ΠΈΡ‚ΠΈ ΡƒΠ½Π°ΠΏΡ€Π΅Π΄, ΠΏΠ° јС ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ размислити ΠΎ Ρ‚ΠΎΠΌΠ΅ ΠΊΠ°ΠΊΠΎ ΠΈΡ… Π½Π°Ρ˜Π±ΠΎΡ™Π΅ ΡƒΡ˜Π΅Π΄ΠΈΠ½ΠΈΡ‚ΠΈ.

Π²Ρ€ΠΎΠΎΠΌ вс Ρ€Π΅Π°Π΄Ρ€
Π¨Ρ‚Π° Π·Π½Π°Ρ‡ΠΈ ΠΎΡΠ»ΠΎΠ±Π°Ρ’Π°ΡšΠ΅? vroom Π·Π° readr? Π’Ρ€Π΅Π½ΡƒΡ‚Π½ΠΎ ΠΏΠ»Π°Π½ΠΈΡ€Π°ΠΌΠΎ Π΄Π° Ρ€Π°Π·Π²ΠΈΡ˜Π°ΠΌΠΎ ΠΎΠ±Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° одвојСно, Π°Π»ΠΈ Ρ›Π΅ΠΌΠΎ ΠΈΡ… Π²Π΅Ρ€ΠΎΠ²Π°Ρ‚Π½ΠΎ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΎΠ²Π°Ρ‚ΠΈ Ρƒ будућности. ЈСдан ΠΎΠ΄ нСдостатака лСњог Ρ‡ΠΈΡ‚Π°ΡšΠ° vroom јС Π΄Π° сС Π½Π΅ΠΊΠΈ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠΈ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° Π½Π΅ ΠΌΠΎΠ³Ρƒ ΠΏΡ€ΠΈΡ˜Π°Π²ΠΈΡ‚ΠΈ ΡƒΠ½Π°ΠΏΡ€Π΅Π΄, ΠΏΠ° Ρ‚Ρ€Π΅Π±Π° размислити ΠΊΠ°ΠΊΠΎ ΠΈΡ… Π½Π°Ρ˜Π±ΠΎΡ™Π΅ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΎΠ²Π°Ρ‚ΠΈ.

Π£ ΠΎΠ²ΠΎΠΌ Ρ‡Π»Π°Π½ΠΊΡƒ Ρ›Π΅ΠΌΠΎ ΠΏΠΎΠ³Π»Π΅Π΄Π°Ρ‚ΠΈ ΠΎΠ±Π° ΠΏΠ°ΠΊΠ΅Ρ‚Π° Π·Π° ΡƒΡ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°:

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠΏΠ°ΠΊΠ΅Ρ‚ Π : Π²Ρ€ΠΎΠΎΠΌ

# install.packages("vroom")
library(vroom)

# Π§Ρ‚Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…
## vroom
ga_nov  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- vroom("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : Ρ€Π΅Π°Π΄Ρ€

# install.packages("readr")
library(readr)

# Π§Ρ‚Π΅Π½ΠΈΠ΅ Π΄Π°Π½Π½Ρ‹Ρ…
## readr
ga_nov  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- read_tsv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

Π£ ΠΏΠ°ΠΊΠ΅Ρ‚Ρƒ vroom, Π±Π΅Π· ΠΎΠ±Π·ΠΈΡ€Π° Π½Π° цсв / тсв Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°, ΡƒΡ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ сС Π²Ρ€ΡˆΠΈ ΠΏΠΎΠΌΠΎΡ›Ρƒ истоимСнС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ vroom(), Ρƒ ΠΏΠ°ΠΊΠ΅Ρ‚Ρƒ readr користимо Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ Π·Π° сваки Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ read_tsv() ΠΈ read_csv().

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : Π΄Π°Ρ‚Π°.Ρ‚Π°Π±Π»Π΅

Π’ data.table ΠΏΠΎΡΡ‚ΠΎΡ˜ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° Π·Π° ΡƒΡ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° fread().

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠΏΠ°ΠΊΠ΅Ρ‚ Π : Π΄Π°Ρ‚Π°.Ρ‚Π°Π±Π»Π΅

# install.packages("data.table")
library(data.table)

## data.table
ga_nov  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_nowember.csv")
ga_dec  <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/ga_december.csv")
titanic <- fread("https://raw.githubusercontent.com/selesnow/publications/master/data_example/r_python_data/titanic.csv")

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

Ако ΡƒΠΏΠΎΡ€Π΅Π΄ΠΈΠΌΠΎ са Π  ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΠΌΠ°, ΠΎΠ½Π΄Π° јС Ρƒ ΠΎΠ²ΠΎΠΌ ΡΠ»ΡƒΡ‡Π°Ρ˜Ρƒ синтакса најблиТа pandas Π²ΠΎΡ™Π° readr, Ρ˜Π΅Ρ€ pandas ΠΌΠΎΠΆΠ΅ Π·Π°Ρ…Ρ‚Π΅Π²Π°Ρ‚ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅ са Π±ΠΈΠ»ΠΎ ΠΊΠΎΠ³ мСста, Π° Ρƒ ΠΎΠ²ΠΎΠΌ ΠΏΠ°ΠΊΠ΅Ρ‚Ρƒ ΠΏΠΎΡΡ‚ΠΎΡ˜ΠΈ Ρ‡ΠΈΡ‚Π°Π²Π° ΠΏΠΎΡ€ΠΎΠ΄ΠΈΡ†Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° read_*().

  • read_csv()
  • read_excel()
  • read_sql()
  • read_json()
  • read_html()

И ΠΌΠ½ΠΎΠ³Π΅ Π΄Ρ€ΡƒΠ³Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ Π΄ΠΈΠ·Π°Ρ˜Π½ΠΈΡ€Π°Π½Π΅ Π·Π° Ρ‡ΠΈΡ‚Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΈΠ· Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚ΠΈΡ… Ρ„ΠΎΡ€ΠΌΠ°Ρ‚Π°. Али Π·Π° нашС ΠΏΠΎΡ‚Ρ€Π΅Π±Π΅ Ρ‚ΠΎ јС Π΄ΠΎΠ²ΠΎΡ™Π½ΠΎ read_table() ΠΈΠ»ΠΈ read_csv() користСћи Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ Π‘Π΅ΠΏ Π΄Π° ΠΎΠ΄Ρ€Π΅Π΄ΠΈΡ‚Π΅ сСпаратор ΠΊΠΎΠ»ΠΎΠ½Π°.

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

import pandas as pd

ga_nov  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_nowember.csv", sep = "t")
ga_dec  = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/ga_december.csv", sep = "t")
titanic = pd.read_csv("https://raw.githubusercontent.com/selesnow/publications/master/data_example/russian_text_in_r/titanic.csv")

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°

Π‘Ρ‚ΠΎ Π’ΠΈΡ‚Π°Π½ΠΈΡ†, који смо ΡƒΡ‡ΠΈΡ‚Π°Π»ΠΈ, ΠΏΠΎΡΡ‚ΠΎΡ˜ΠΈ ΠΏΠΎΡ™Π΅ БСкс, који Ρ‡ΡƒΠ²Π° ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΡ€ ΠΏΠΎΠ»Π° ΠΏΡƒΡ‚Π½ΠΈΠΊΠ°.

Али Π·Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΡ‡Π½ΠΈΡ˜Ρƒ ΠΏΡ€Π΅Π·Π΅Π½Ρ‚Π°Ρ†ΠΈΡ˜Ρƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΏΡ€Π΅ΠΌΠ° ΠΏΠΎΠ»Ρƒ ΠΏΡƒΡ‚Π½ΠΈΠΊΠ°, Ρ‚Ρ€Π΅Π±Π°Π»ΠΎ Π±ΠΈ Π΄Π° користитС ΠΈΠΌΠ΅, Π° Π½Π΅ ΡˆΠΈΡ„Ρ€Ρƒ ΠΏΠΎΠ»Π°.

Π”Π° бисмо Ρ‚ΠΎ ΡƒΡ€Π°Π΄ΠΈΠ»ΠΈ, Π½Π°ΠΏΡ€Π°Π²ΠΈΡ›Π΅ΠΌΠΎ ΠΌΠ°Π»ΠΈ Π΄ΠΈΡ€Π΅ΠΊΡ‚ΠΎΡ€ΠΈΡ˜ΡƒΠΌ, Ρ‚Π°Π±Π΅Π»Ρƒ Ρƒ којој Ρ›Π΅ Π±ΠΈΡ‚ΠΈ само 2 ΠΊΠΎΠ»ΠΎΠ½Π΅ (ΠΊΠΎΠ΄ ΠΈ Π½Π°Π·ΠΈΠ² ΠΏΠΎΠ»Π°) ΠΈ 2 Ρ€Π΅Π΄Π°, рСспСктивно.

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : тидивСрсС, Π΄ΠΏΠ»ΠΈΡ€

Π£ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ ΠΊΠΎΠ΄Π° испод, ΠΊΡ€Π΅ΠΈΡ€Π°ΠΌΠΎ ΠΆΠ΅Ρ™Π΅Π½ΠΈ ΠΎΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΏΠΎΠΌΠΎΡ›Ρƒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ tibble() .

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : Π΄ΠΏΠ»ΠΈΡ€

## dplyr
### создаём справочник
gender <- tibble(id = c(1, 2),
                 gender = c("female", "male"))

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : Π΄Π°Ρ‚Π°.Ρ‚Π°Π±Π»Π΅

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : Π΄Π°Ρ‚Π°.Ρ‚Π°Π±Π»Π΅

## data.table
### создаём справочник
gender <- data.table(id = c(1, 2),
                    gender = c("female", "male"))

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: пандас

Π’ pandas ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° сС одвија Ρƒ Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ Ρ„Π°Π·Π°, ΠΏΡ€Π²ΠΎ ΠΊΡ€Π΅ΠΈΡ€Π°ΠΌΠΎ Ρ€Π΅Ρ‡Π½ΠΈΠΊ, Π° Π·Π°Ρ‚ΠΈΠΌ ΠΊΠΎΠ½Π²Π΅Ρ€Ρ‚ΡƒΡ˜Π΅ΠΌΠΎ Ρ€Π΅Ρ‡Π½ΠΈΠΊ Ρƒ ΠΎΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°.

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: пандас

# создаём Π΄Π°Ρ‚Π° Ρ„Ρ€Π΅ΠΉΠΌ
gender_dict = {'id': [1, 2],
               'gender': ["female", "male"]}
# ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΡƒΠ΅ΠΌ ΡΠ»ΠΎΠ²Π°Ρ€ΡŒ Π² Π΄Π°Ρ‚Π°Ρ„Ρ€Π΅ΠΉΠΌ
gender = pd.DataFrame.from_dict(gender_dict)

Π˜Π·Π±ΠΎΡ€ ΠΊΠΎΠ»ΠΎΠ½Π΅

Π’Π°Π±Π΅Π»Π΅ са којима Ρ€Π°Π΄ΠΈΡ‚Π΅ ΠΌΠΎΠ³Ρƒ Π΄Π° садрТС дСсСтинС ΠΈΠ»ΠΈ Ρ‡Π°ΠΊ стотинС ΠΊΠΎΠ»ΠΎΠ½Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°. Али Π΄Π° бистС ΠΈΠ·Π²Ρ€ΡˆΠΈΠ»ΠΈ Π°Π½Π°Π»ΠΈΠ·Ρƒ, ΠΏΠΎ ΠΏΡ€Π°Π²ΠΈΠ»Ρƒ, нису Π²Π°ΠΌ ΠΏΠΎΡ‚Ρ€Π΅Π±Π½Π΅ свС ΠΊΠΎΠ»ΠΎΠ½Π΅ којС су доступнС Ρƒ ΠΈΠ·Π²ΠΎΡ€Π½ΠΎΡ˜ Ρ‚Π°Π±Π΅Π»ΠΈ.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Π‘Ρ‚ΠΎΠ³Π°, јСдна ΠΎΠ΄ ΠΏΡ€Π²ΠΈΡ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° ΠΊΠΎΡ˜Ρƒ Ρ›Π΅Ρ‚Π΅ ΠΈΠ·Π²Ρ€ΡˆΠΈΡ‚ΠΈ са ΠΈΠ·Π²ΠΎΡ€Π½ΠΎΠΌ Ρ‚Π°Π±Π΅Π»ΠΎΠΌ јС Π΄Π° јС очиститС ΠΎΠ΄ Π½Π΅ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΈΡ… ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡ˜Π° ΠΈ ослободитС ΠΌΠ΅ΠΌΠΎΡ€ΠΈΡ˜Ρƒ ΠΊΠΎΡ˜Ρƒ ΠΎΠ²Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡ˜Π΅ Π·Π°ΡƒΠ·ΠΈΠΌΠ°Ρ˜Ρƒ.

Π˜Π·Π±ΠΎΡ€ ΠΊΠΎΠ»ΠΎΠ½Π° Ρƒ Π : тидивСрсС, Π΄ΠΏΠ»ΠΈΡ€

синтакса dplyr јС Π²Π΅ΠΎΠΌΠ° сличан Π‘ΠšΠ› Ρ˜Π΅Π·ΠΈΠΊΡƒ ΡƒΠΏΠΈΡ‚Π°, Π°ΠΊΠΎ стС ΡƒΠΏΠΎΠ·Π½Π°Ρ‚ΠΈ са њим, Π±Ρ€Π·ΠΎ Ρ›Π΅Ρ‚Π΅ савладати овај ΠΏΠ°ΠΊΠ΅Ρ‚.

Π”Π° бистС ΠΈΠ·Π°Π±Ρ€Π°Π»ΠΈ ΠΊΠΎΠ»ΠΎΠ½Π΅, користитС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ select().

Испод су ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΈ ΠΊΠΎΠ΄Π° ΠΏΠΎΠΌΠΎΡ›Ρƒ ΠΊΠΎΡ˜ΠΈΡ… ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π΄Π° ΠΈΠ·Π°Π±Π΅Ρ€Π΅Ρ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½Π΅ Π½Π° слСдСћС Π½Π°Ρ‡ΠΈΠ½Π΅:

  • ΠΠ°Π²ΠΎΡ’Π΅ΡšΠ΅ ΠΈΠΌΠ΅Π½Π° ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΈΡ… ΠΊΠΎΠ»ΠΎΠ½Π°
  • ΠŸΠΎΠ³Π»Π΅Π΄Π°Ρ˜Ρ‚Π΅ Π½Π°Π·ΠΈΠ²Π΅ ΠΊΠΎΠ»ΠΎΠ½Π° користСћи Ρ€Π΅Π³ΡƒΠ»Π°Ρ€Π½Π΅ ΠΈΠ·Ρ€Π°Π·Π΅
  • По Ρ‚ΠΈΠΏΡƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΈΠ»ΠΈ Π±ΠΈΠ»ΠΎ ΠΊΠΎΠΌ Π΄Ρ€ΡƒΠ³ΠΎΠΌ ΡΠ²ΠΎΡ˜ΡΡ‚Π²Ρƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° садрТаних Ρƒ ΠΊΠΎΠ»ΠΎΠ½ΠΈ

Π˜Π·Π±ΠΎΡ€ ΠΊΠΎΠ»ΠΎΠ½Π° Ρƒ Π : Π΄ΠΏΠ»ΠΈΡ€

# Π’Ρ‹Π±ΠΎΡ€ Π½ΡƒΠΆΠ½Ρ‹Ρ… столбцов
## dplyr
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ названию столбцов
select(ga_nov, date, source, sessions)
### ΠΈΡΠΊΠ»ΡŽΡ‡ΡŒ ΠΏΠΎ названию столбцов
select(ga_nov, -medium, -bounces)
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ рСгулярному Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ, стобцы ΠΈΠΌΠ΅Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π·Π°ΠΊΠ°Π½Ρ‡ΠΈΠ²Π°ΡŽΡ‚ΡΡ Π½Π° s
select(ga_nov, matches("s$"))
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ, Π²Ρ‹Π±ΠΈΡ€Π°Π΅ΠΌ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ цСлочислСнныС столбцы
select_if(ga_nov, is.integer)

Π˜Π·Π±ΠΎΡ€ ΠΊΠΎΠ»ΠΎΠ½Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

Π˜ΡΡ‚Π΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π΅ Ρƒ data.table сС ΠΈΠ·Π²ΠΎΠ΄Π΅ ΠΌΠ°Π»ΠΎ Π΄Ρ€ΡƒΠ³Π°Ρ‡ΠΈΡ˜Π΅, Π½Π° ΠΏΠΎΡ‡Π΅Ρ‚ΠΊΡƒ Ρ‡Π»Π°Π½ΠΊΠ° сам Π΄Π°ΠΎ опис који су Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ΠΈ Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ° data.table.

DT[i,j,by]

Π“Π΄Π΅ јС:
ја - Π³Π΄Π΅, Ρ‚Ρ˜. Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎ Ρ€Π΅Π΄ΠΎΠ²ΠΈΠΌΠ°
ј - ΠΈΠ·Π°Π±Π΅Ρ€ΠΈΡ‚Π΅|Π°ΠΆΡƒΡ€ΠΈΡ€Π°Ρ˜|ΡƒΡ€Π°Π΄ΠΈ, Ρ‚Ρ˜. Π±ΠΈΡ€Π°ΡšΠ΅ ΠΊΠΎΠ»ΠΎΠ½Π° ΠΈ ΡšΠΈΡ…ΠΎΠ²ΠΎ ΠΏΡ€Π΅Ρ‚Π²Π°Ρ€Π°ΡšΠ΅
ΠΏΠΎ - Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°

Π˜Π·Π±ΠΎΡ€ ΠΊΠΎΠ»ΠΎΠ½Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

## data.table
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ названию столбцов
ga_nov[ , .(date, source, sessions) ]
### ΠΈΡΠΊΠ»ΡŽΡ‡ΡŒ ΠΏΠΎ названию столбцов
ga_nov[ , .SD, .SDcols = ! names(ga_nov) %like% "medium|bounces" ]
### Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ рСгулярному Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ
ga_nov[, .SD, .SDcols = patterns("s$")]

Π’Π°Ρ€ΠΈΠ°Π±Π»Π΅ .SD ΠΎΠΌΠΎΠ³ΡƒΡ›Π°Π²Π° Π²Π°ΠΌ приступ свим ΠΊΠΎΠ»ΠΎΠ½Π°ΠΌΠ°, ΠΈ .SDcols Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°Ρ˜Ρ‚Π΅ ΠΏΠΎΡ‚Ρ€Π΅Π±Π½Π΅ ΠΊΠΎΠ»ΠΎΠ½Π΅ користСћи Ρ€Π΅Π³ΡƒΠ»Π°Ρ€Π½Π΅ ΠΈΠ·Ρ€Π°Π·Π΅ ΠΈΠ»ΠΈ Π΄Ρ€ΡƒΠ³Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ Π΄Π° бистС Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°Π»ΠΈ Π½Π°Π·ΠΈΠ²Π΅ ΠΊΠΎΠ»ΠΎΠ½Π° којС су Π²Π°ΠΌ ΠΏΠΎΡ‚Ρ€Π΅Π±Π½Π΅.

ΠžΠ΄Π°Π±ΠΈΡ€ ΠΊΠΎΠ»ΠΎΠ½Π° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ, ΠΏΠ°Π½Π΄Π΅

Π”Π° бистС ΠΈΠ·Π°Π±Ρ€Π°Π»ΠΈ ΠΊΠΎΠ»ΠΎΠ½Π΅ ΠΏΠΎ ΠΈΠΌΠ΅Π½Ρƒ Ρƒ pandas Π΄ΠΎΠ²ΠΎΡ™Π½ΠΎ јС навСсти списак ΡšΠΈΡ…ΠΎΠ²ΠΈΡ… ΠΈΠΌΠ΅Π½Π°. А Π΄Π° бистС ΠΈΠ·Π°Π±Ρ€Π°Π»ΠΈ ΠΈΠ»ΠΈ искључили ΠΊΠΎΠ»ΠΎΠ½Π΅ ΠΏΠΎ ΠΈΠΌΠ΅Π½Ρƒ ΠΏΠΎΠΌΠΎΡ›Ρƒ Ρ€Π΅Π³ΡƒΠ»Π°Ρ€Π½ΠΈΡ… ΠΈΠ·Ρ€Π°Π·Π°, ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ јС Π΄Π° користитС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ drop() ΠΈ filter(), ΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ акис=1, Ρ‡ΠΈΠΌΠ΅ ΡƒΠΊΠ°Π·ΡƒΡ˜Π΅Ρ‚Π΅ Π΄Π° јС ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ ΠΎΠ±Ρ€Π°Π΄ΠΈΡ‚ΠΈ ΠΊΠΎΠ»ΠΎΠ½Π΅, Π° Π½Π΅ Ρ€Π΅Π΄ΠΎΠ²Π΅.

Π”Π° бистС ΠΈΠ·Π°Π±Ρ€Π°Π»ΠΈ ΠΏΠΎΡ™Π΅ ΠΏΡ€Π΅ΠΌΠ° Ρ‚ΠΈΠΏΡƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°, користитС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ select_dtypes(), ΠΈ Ρƒ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π΅ ΠΎΠ±ΡƒΡ…Π²Π°Ρ‚ΠΈΡ‚ΠΈ ΠΈΠ»ΠΈ искључити прослСдитС листу Ρ‚ΠΈΠΏΠΎΠ²Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° који ΠΎΠ΄Π³ΠΎΠ²Π°Ρ€Π°Ρ˜Ρƒ ΠΏΠΎΡ™ΠΈΠΌΠ° која Ρ‚Ρ€Π΅Π±Π° Π΄Π° ΠΈΠ·Π°Π±Π΅Ρ€Π΅Ρ‚Π΅.

Π˜Π·Π±ΠΎΡ€ ΠΊΠΎΠ»ΠΎΠ½Π° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: пандас

# Π’Ρ‹Π±ΠΎΡ€ ΠΏΠΎΠ»Π΅ΠΉ ΠΏΠΎ названию
ga_nov[['date', 'source', 'sessions']]
# Π˜ΡΠΊΠ»ΡŽΡ‡ΠΈΡ‚ΡŒ ΠΏΠΎ названию
ga_nov.drop(['medium', 'bounces'], axis=1)
# Π’Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎ рСгулярному Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΡŽ
ga_nov.filter(regex="s$", axis=1)
# Π’Ρ‹Π±Ρ€Π°Ρ‚ΡŒ числовыС поля
ga_nov.select_dtypes(include=['number'])
# Π’Ρ‹Π±Ρ€Π°Ρ‚ΡŒ тСкстовыС поля
ga_nov.select_dtypes(include=['object'])

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π°

На ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΠΈΠ·Π²ΠΎΡ€Π½Π° Ρ‚Π°Π±Π΅Π»Π° ΠΌΠΎΠΆΠ΅ Π΄Π° садрТи ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅ Π·Π° Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ Π³ΠΎΠ΄ΠΈΠ½Π°, Π°Π»ΠΈ Ρ‚Ρ€Π΅Π±Π° Π΄Π° Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€Π°Ρ‚Π΅ само ΠΏΡ€ΠΎΡˆΠ»ΠΈ мСсСц. ΠžΠΏΠ΅Ρ‚, Π΄ΠΎΠ΄Π°Ρ‚Π½Π΅ линијС Ρ›Π΅ успорити процСс ΠΎΠ±Ρ€Π°Π΄Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΈ Π·Π°Ρ‡Π΅ΠΏΠΈΡ‚ΠΈ ΠΌΠ΅ΠΌΠΎΡ€ΠΈΡ˜Ρƒ Ρ€Π°Ρ‡ΡƒΠ½Π°Ρ€Π°.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° Ρƒ Π : тидивСрсС, Π΄ΠΏΠ»ΠΈΡ€

Π’ dplyr Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° сС користи Π·Π° Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° filter(). Π£Π·ΠΈΠΌΠ° ΠΎΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΊΠ°ΠΎ ΠΏΡ€Π²ΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚, Π° Π·Π°Ρ‚ΠΈΠΌ Π½Π°Π²ΠΎΠ΄ΠΈΡ‚Π΅ условС Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ°.

Када ΠΏΠΈΡˆΠ΅Ρ‚Π΅ Π»ΠΎΠ³ΠΈΡ‡ΠΊΠ΅ ΠΈΠ·Ρ€Π°Π·Π΅ Π·Π° Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ‚Π°Π±Π΅Π»Π΅, Ρƒ ΠΎΠ²ΠΎΠΌ ΡΠ»ΡƒΡ‡Π°Ρ˜Ρƒ Π½Π°Π²Π΅Π΄ΠΈΡ‚Π΅ ΠΈΠΌΠ΅Π½Π° ΠΊΠΎΠ»ΠΎΠ½Π° Π±Π΅Π· Π½Π°Π²ΠΎΠ΄Π½ΠΈΠΊΠ° ΠΈ Π±Π΅Π· Π΄Π΅ΠΊΠ»Π°Ρ€ΠΈΡΠ°ΡšΠ° ΠΈΠΌΠ΅Π½Π° Ρ‚Π°Π±Π΅Π»Π΅.

Када користитС вишС Π»ΠΎΠ³ΠΈΡ‡ΠΊΠΈΡ… ΠΈΠ·Ρ€Π°Π·Π° Π·Π° Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅, користитС слСдСћС ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€Π΅:

  • & ΠΈΠ»ΠΈ Π·Π°Ρ€Π΅Π· - Π»ΠΎΠ³ΠΈΡ‡ΠΊΠΎ И
  • | - Π»ΠΎΠ³ΠΈΡ‡ΠΊΠΎ Π˜Π›Π˜

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° Ρƒ Π : Π΄ΠΏΠ»ΠΈΡ€

# Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк
## dplyr
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
filter(ga_nov, source == "google")
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈ
filter(ga_nov, source == "google" & sessions >= 10)
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈΠ»ΠΈ
filter(ga_nov, source == "google" | sessions >= 10)

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

Као ΡˆΡ‚ΠΎ сам Π²Π΅Ρ› написао Π³ΠΎΡ€Π΅, Ρƒ data.table синтакса ΠΊΠΎΠ½Π²Π΅Ρ€Π·ΠΈΡ˜Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° јС Π·Π°Ρ‚Π²ΠΎΡ€Π΅Π½Π° Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ°.

DT[i,j,by]

Π“Π΄Π΅ јС:
ја - Π³Π΄Π΅, Ρ‚Ρ˜. Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎ Ρ€Π΅Π΄ΠΎΠ²ΠΈΠΌΠ°
ј - ΠΈΠ·Π°Π±Π΅Ρ€ΠΈΡ‚Π΅|Π°ΠΆΡƒΡ€ΠΈΡ€Π°Ρ˜|ΡƒΡ€Π°Π΄ΠΈ, Ρ‚Ρ˜. Π±ΠΈΡ€Π°ΡšΠ΅ ΠΊΠΎΠ»ΠΎΠ½Π° ΠΈ ΡšΠΈΡ…ΠΎΠ²ΠΎ ΠΏΡ€Π΅Ρ‚Π²Π°Ρ€Π°ΡšΠ΅
ΠΏΠΎ - Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°

АргумСнт сС користи Π·Π° Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° i, који ΠΈΠΌΠ° ΠΏΡ€Π²Ρƒ ΠΏΠΎΠ·ΠΈΡ†ΠΈΡ˜Ρƒ Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ°.

Π‘Ρ‚ΡƒΠΏΡ†ΠΈΠΌΠ° сС приступа Ρƒ Π»ΠΎΠ³ΠΈΡ‡ΠΊΠΈΠΌ ΠΈΠ·Ρ€Π°Π·ΠΈΠΌΠ° Π±Π΅Π· Π½Π°Π²ΠΎΠ΄Π½ΠΈΠΊΠ° ΠΈ Π±Π΅Π· Π½Π°Π²ΠΎΡ’Π΅ΡšΠ° ΠΈΠΌΠ΅Π½Π° Ρ‚Π°Π±Π΅Π»Π΅.

Π›ΠΎΠ³ΠΈΡ‡ΠΊΠΈ ΠΈΠ·Ρ€Π°Π·ΠΈ су мСђусобно ΠΏΠΎΠ²Π΅Π·Π°Π½ΠΈ Π½Π° исти Π½Π°Ρ‡ΠΈΠ½ ΠΊΠ°ΠΎ Ρƒ dplyr ΠΏΡ€Π΅ΠΊΠΎ & ΠΈ | ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€Π°.

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

## data.table
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
ga_nov[source == "google"]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈ
ga_nov[source == "google" & sessions >= 10]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈΠ»ΠΈ
ga_nov[source == "google" | sessions >= 10]

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ стрингова Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: пандас

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°Ρ˜Ρ‚Π΅ ΠΏΠΎ Ρ€Π΅Π΄ΠΎΠ²ΠΈΠΌΠ° Ρƒ pandas слично Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΡƒ Ρƒ data.table, Π° Ρ€Π°Π΄ΠΈ сС Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ°.

Π£ ΠΎΠ²ΠΎΠΌ ΡΠ»ΡƒΡ‡Π°Ρ˜Ρƒ, приступ ΠΊΠΎΠ»ΠΎΠ½Π°ΠΌΠ° сС Π²Ρ€ΡˆΠΈ ΠΎΠ±Π°Π²Π΅Π·Π½ΠΎ Π½Π°Π²ΠΎΡ’Π΅ΡšΠ΅ΠΌ Π½Π°Π·ΠΈΠ²Π° ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°; Ρ‚Π°Π΄Π° сС Π½Π°Π·ΠΈΠ² ΠΊΠΎΠ»ΠΎΠ½Π΅ ΠΌΠΎΠΆΠ΅ навСсти ΠΈ ΠΏΠΎΠ΄ Π½Π°Π²ΠΎΠ΄Π½ΠΈΡ†ΠΈΠΌΠ° Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ° (ΠΏΡ€ΠΈΠΌΠ΅Ρ€ df['col_name']), ΠΈΠ»ΠΈ Π±Π΅Π· Π½Π°Π²ΠΎΠ΄Π½ΠΈΠΊΠ° послС Ρ‚Π°Ρ‡ΠΊΠ΅ (ΠΏΡ€ΠΈΠΌΠ΅Ρ€ df.col_name).

Ако Ρ‚Ρ€Π΅Π±Π° Π΄Π° Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°Ρ‚Π΅ ΠΎΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΏΡ€Π΅ΠΌΠ° Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ услова, сваки услов ΠΌΠΎΡ€Π° Π±ΠΈΡ‚ΠΈ стављСн Ρƒ Π·Π°Π³Ρ€Π°Π΄Π΅. Π›ΠΎΠ³ΠΈΡ‡ΠΊΠΈ услови су мСђусобно ΠΏΠΎΠ²Π΅Π·Π°Π½ΠΈ ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€ΠΈΠΌΠ° & ΠΈ |.

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ стрингова Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: пандас

# Π€ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
ga_nov[ ga_nov['source'] == "google" ]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈ
ga_nov[(ga_nov['source'] == "google") & (ga_nov['sessions'] >= 10)]
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ ΠΏΠΎ Π΄Π²ΡƒΠΌ условиям соСдинённым логичСским ΠΈΠ»ΠΈ
ga_nov[(ga_nov['source'] == "google") | (ga_nov['sessions'] >= 10)]

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°

ЈСдна ΠΎΠ΄ Π½Π°Ρ˜Ρ‡Π΅ΡˆΡ›Π΅ ΠΊΠΎΡ€ΠΈΡˆΡ›Π΅Π½ΠΈΡ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° Ρƒ Π°Π½Π°Π»ΠΈΠ·ΠΈ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° јС Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π°.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Бинтакса Π·Π° ΠΈΠ·Π²ΠΎΡ’Π΅ΡšΠ΅ ΠΎΠ²ΠΈΡ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° јС Ρ€Π°Π·Π±Π°Ρ†Π°Π½Π° ΠΏΠΎ свим ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΠΌΠ° којС ΠΏΡ€Π΅Π³Π»Π΅Π΄Π°ΠΌΠΎ.

Π£ ΠΎΠ²ΠΎΠΌ ΡΠ»ΡƒΡ‡Π°Ρ˜Ρƒ, ΡƒΠ·Π΅Ρ›Π΅ΠΌΠΎ ΠΎΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΊΠ°ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Π’ΠΈΡ‚Π°Π½ΠΈΡ†, ΠΈ ΠΈΠ·Ρ€Π°Ρ‡ΡƒΠ½Π°Ρ‚ΠΈ Π±Ρ€ΠΎΡ˜ ΠΈ просСчну Ρ†Π΅Π½Ρƒ ΠΊΠ°Ρ€Π°Ρ‚Π° Ρƒ зависности ΠΎΠ΄ класС ΠΊΠ°Π±ΠΈΠ½Π΅.

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : тидивСрсС, Π΄ΠΏΠ»ΠΈΡ€

Π’ dplyr Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° сС користи Π·Π° Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ group_by(), ΠΈ Π·Π° Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Ρƒ summarise(). Π—Π°ΠΏΡ€Π°Π²ΠΎ, dplyr ΠΏΠΎΡΡ‚ΠΎΡ˜ΠΈ Ρ‡ΠΈΡ‚Π°Π²Π° ΠΏΠΎΡ€ΠΎΠ΄ΠΈΡ†Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° summarise_*(), Π°Π»ΠΈ сврха ΠΎΠ²ΠΎΠ³ Ρ‡Π»Π°Π½ΠΊΠ° јС Π΄Π° ΡƒΠΏΠΎΡ€Π΅Π΄ΠΈ основну синтаксу, Ρ‚Π°ΠΊΠΎ Π΄Π° Π½Π΅Ρ›Π΅ΠΌΠΎ ΡƒΠ»Π°Π·ΠΈΡ‚ΠΈ Ρƒ Ρ‚Π°ΠΊΠ²Ρƒ ΡŸΡƒΠ½Π³Π»Ρƒ.

ОсновнС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅:

  • sum() β€” ΡΡƒΠΌΠΈΡ€Π°ΡšΠ΅
  • min() / max() – ΠΌΠΈΠ½ΠΈΠΌΠ°Π»Π½Π° ΠΈ максимална врСдност
  • mean() - просСк
  • median() β€” мСдијана
  • length() - ΠΊΠΎΠ»ΠΈΡ‡ΠΈΠ½Π°

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π° Ρƒ Π : Π΄ΠΏΠ»ΠΈΡ€

## dplyr
### Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΠΎΠ²ΠΊΠ° ΠΈ агрСгация строк
group_by(titanic, Pclass) %>%
  summarise(passangers = length(PassengerId),
            avg_price  = mean(Fare))

Π£ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜ΠΈ group_by() прослСдили смо Ρ‚Π°Π±Π΅Π»Ρƒ ΠΊΠ°ΠΎ ΠΏΡ€Π²ΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ Π’ΠΈΡ‚Π°Π½ΠΈΡ†, Π° Π·Π°Ρ‚ΠΈΠΌ ΠΎΠ·Π½Π°Ρ‡ΠΈΠΎ ΠΏΠΎΡ™Π΅ ΠŸΡ†Π»Π°ΡΡ, ΠΏΠΎ којима Ρ›Π΅ΠΌΠΎ груписати Π½Π°ΡˆΡƒ Ρ‚Π°Π±Π΅Π»Ρƒ. Π Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ ΠΎΠ²Π΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π΅ ΠΏΠΎΠΌΠΎΡ›Ρƒ ΠΎΠΏΠ΅Ρ€Π°Ρ‚ΠΎΡ€Π° %>% прослСђСн ΠΊΠ°ΠΎ ΠΏΡ€Π²ΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜ΠΈ summarise(), ΠΈ Π΄ΠΎΠ΄Π°ΠΎ још 2 ΠΏΠΎΡ™Π°: ΠΏΡƒΡ‚Π½ΠΈΡ†ΠΈΠΌΠ° ΠΈ Π°Π²Π³_ΠΏΡ€ΠΈΡ†Π΅. Π£ ΠΏΡ€Π²ΠΎΠΌ, користСћи Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ length() ΠΈΠ·Ρ€Π°Ρ‡ΡƒΠ½Π°ΠΎ Π±Ρ€ΠΎΡ˜ ΠΊΠ°Ρ€Π°Ρ‚Π°, Π° Ρƒ Π΄Ρ€ΡƒΠ³ΠΎΠΌ користСћи Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ mean() Π΄ΠΎΠ±ΠΈΠΎ просСчну Ρ†Π΅Π½Ρƒ ΠΊΠ°Ρ€Ρ‚Π΅.

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³ΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

Π’ data.table Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ сС користи Π·Π° Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Ρƒ j који ΠΈΠΌΠ° Π΄Ρ€ΡƒΠ³Ρƒ ΠΏΠΎΠ·ΠΈΡ†ΠΈΡ˜Ρƒ Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ°, Π° Π·Π° Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ by ΠΈΠ»ΠΈ keyby, који ΠΈΠΌΠ°Ρ˜Ρƒ Ρ‚Ρ€Π΅Ρ›Ρƒ ΠΏΠΎΠ·ΠΈΡ†ΠΈΡ˜Ρƒ.

Листа Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅ Ρƒ ΠΎΠ²ΠΎΠΌ ΡΠ»ΡƒΡ‡Π°Ρ˜Ρƒ јС ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ‡Π½Π° оној описаној Ρƒ dplyr, Ρ˜Π΅Ρ€ Ρ‚ΠΎ су Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΈΠ· основнС Π  синтаксС.

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

## data.table
### Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ строк ΠΏΠΎ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΡƒΡΠ»ΠΎΠ²ΠΈΡŽ
titanic[, .(passangers = length(PassengerId),
            avg_price  = mean(Fare)),
        by = Pclass]

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ Ρƒ pandas слично dplyr, Π°Π»ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π° нијС слична dplyr нијС Π½Π° data.table.

Π—Π° Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ користитС ΠΌΠ΅Ρ‚ΠΎΠ΄ groupby(), Ρƒ који Ρ‚Ρ€Π΅Π±Π° Π΄Π° прослСдитС листу ΠΊΠΎΠ»ΠΎΠ½Π° ΠΏΠΎ којима Ρ›Π΅ ΠΎΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Π±ΠΈΡ‚ΠΈ груписан.

Π—Π° Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Ρƒ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ користити ΠΌΠ΅Ρ‚ΠΎΠ΄ agg()који ΠΏΡ€ΠΈΡ…Π²Π°Ρ‚Π° Ρ€Π΅Ρ‡Π½ΠΈΠΊ. ΠšΡ™ΡƒΡ‡Π΅Π²ΠΈ Ρ€Π΅Ρ‡Π½ΠΈΠΊΠ° су ΠΊΠΎΠ»ΠΎΠ½Π΅ Π½Π° којС Ρ›Π΅Ρ‚Π΅ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅, Π° врСдности су Π½Π°Π·ΠΈΠ²ΠΈ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅.

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅:

  • sum() β€” ΡΡƒΠΌΠΈΡ€Π°ΡšΠ΅
  • min() / max() – ΠΌΠΈΠ½ΠΈΠΌΠ°Π»Π½Π° ΠΈ максимална врСдност
  • mean() - просСк
  • median() β€” мСдијана
  • count() - ΠΊΠΎΠ»ΠΈΡ‡ΠΈΠ½Π°

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° reset_index() Ρƒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ испод сС користи Π·Π° Ρ€Π΅ΡΠ΅Ρ‚ΠΎΠ²Π°ΡšΠ΅ ΡƒΠ³Π½Π΅ΠΆΡ’Π΅Π½ΠΈΡ… индСкса који pandas ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π½ΠΎ Π½Π°ΠΊΠΎΠ½ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°.

симбол ΠΎΠΌΠΎΠ³ΡƒΡ›Π°Π²Π° Π²Π°ΠΌ Π΄Π° ΠΏΡ€Π΅Ρ’Π΅Ρ‚Π΅ Π½Π° слСдСћи Ρ€Π΅Π΄.

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

# Π³Ρ€ΡƒΠΏΠΏΠΈΡ€ΠΎΠ²ΠΊΠ° ΠΈ агрСгация Π΄Π°Π½Π½Ρ‹Ρ…
titanic.groupby(["Pclass"]).
    agg({'PassengerId': 'count', 'Fare': 'mean'}).
        reset_index()

Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»Π½ΠΈ спој Ρ‚Π°Π±Π΅Π»Π°

ΠžΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° Ρƒ којој ΡΠΏΠ°Ρ˜Π°Ρ‚Π΅ Π΄Π²Π΅ ΠΈΠ»ΠΈ вишС Ρ‚Π°Π±Π΅Π»Π° истС структурС. ΠŸΠΎΠ΄Π°Ρ†ΠΈ којС смо ΡƒΡ‡ΠΈΡ‚Π°Π»ΠΈ садрТС Ρ‚Π°Π±Π΅Π»Π΅ Π³Π°_Π½ΠΎΠ² ΠΈ Π³Π°_Π΄Π΅Ρ†. ОвС Ρ‚Π°Π±Π΅Π»Π΅ су ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ‡Π½Π΅ ΠΏΠΎ структури, Ρ‚Ρ˜. ΠΈΠΌΠ°Ρ˜Ρƒ истС ΠΊΠΎΠ»ΠΎΠ½Π΅ ΠΈ Ρ‚ΠΈΠΏΠΎΠ²Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Ρƒ ΠΎΠ²ΠΈΠΌ ΠΊΠΎΠ»ΠΎΠ½Π°ΠΌΠ°.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Ово јС ΠΎΡ‚ΠΏΡ€Π΅ΠΌΠ°ΡšΠ΅ ΠΈΠ· Π“ΠΎΠΎΠ³Π»Π΅ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ΅ Π·Π° мСсСц Π½ΠΎΠ²Π΅ΠΌΠ±Π°Ρ€ ΠΈ Π΄Π΅Ρ†Π΅ΠΌΠ±Π°Ρ€, Ρƒ ΠΎΠ²ΠΎΠΌ ΠΎΠ΄Π΅Ρ™ΠΊΡƒ Ρ›Π΅ΠΌΠΎ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΎΠ²Π°Ρ‚ΠΈ ΠΎΠ²Π΅ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅ Ρƒ Ρ˜Π΅Π΄Π½Ρƒ Ρ‚Π°Π±Π΅Π»Ρƒ.

Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π° Ρƒ Π : тидивСрсС, Π΄ΠΏΠ»ΠΈΡ€

Π’ dplyr ΠŸΠΎΠΌΠΎΡ›Ρƒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΎΠ²Π°Ρ‚ΠΈ 2 Ρ‚Π°Π±Π΅Π»Π΅ Ρƒ Ρ˜Π΅Π΄Π½Ρƒ bind_rows(), прСносСћи Ρ‚Π°Π±Π΅Π»Π΅ ΠΊΠ°ΠΎ својС Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π΅.

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° Ρƒ Π : Π΄ΠΏΠ»ΠΈΡ€

# Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠ΅ объСдинСниС Ρ‚Π°Π±Π»ΠΈΡ†
## dplyr
bind_rows(ga_nov, ga_dec)

Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

Π’Π°ΠΊΠΎΡ’Π΅ нијС Π½ΠΈΡˆΡ‚Π° ΠΊΠΎΠΌΠΏΠ»ΠΈΠΊΠΎΠ²Π°Π½ΠΎ, Ρ…Π°Ρ˜Π΄Π΅ Π΄Π° користимо rbind().

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

## data.table
rbind(ga_nov, ga_dec)

Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

Π’ pandas Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° сС користи Π·Π° спајањС Ρ‚Π°Π±Π΅Π»Π° concat(), Ρƒ који Ρ‚Ρ€Π΅Π±Π° Π΄Π° прослСдитС листу ΠΎΠΊΠ²ΠΈΡ€Π° Π΄Π° бистС ΠΈΡ… ΠΊΠΎΠΌΠ±ΠΈΠ½ΠΎΠ²Π°Π»ΠΈ.

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ стрингова Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: пандас

# Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½ΠΎΠ΅ объСдинСниС Ρ‚Π°Π±Π»ΠΈΡ†
pd.concat([ga_nov, ga_dec])

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π°

ΠžΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° Ρƒ којој сС ΠΊΠΎΠ»ΠΎΠ½Π΅ ΠΈΠ· Π΄Ρ€ΡƒΠ³Π΅ Π΄ΠΎΠ΄Π°Ρ˜Ρƒ ΠΏΡ€Π²ΠΎΡ˜ Ρ‚Π°Π±Π΅Π»ΠΈ ΠΏΠΎΠΌΠΎΡ›Ρƒ ΠΊΡ™ΡƒΡ‡Π°. ЧСсто сС користи ΠΊΠ°Π΄Π° сС ΠΎΠ±ΠΎΠ³Π°Ρ›ΡƒΡ˜Π΅ Ρ‚Π°Π±Π΅Π»Π° Ρ‡ΠΈΡšΠ΅Π½ΠΈΡ†Π° (Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ‚Π°Π±Π΅Π»Π° са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° ΠΎ ΠΏΡ€ΠΎΠ΄Π°Ρ˜ΠΈ) Π½Π΅ΠΊΠΈΠΌ Ρ€Π΅Ρ„Π΅Ρ€Π΅Π½Ρ‚Π½ΠΈΠΌ ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° (Π½Π° ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Ρ†Π΅Π½Π° ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄Π°).

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

ΠŸΠΎΡΡ‚ΠΎΡ˜ΠΈ Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ врста спојСва:

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Π£ ΠΏΡ€Π΅Ρ‚Ρ…ΠΎΠ΄Π½ΠΎ ΡƒΡ‡ΠΈΡ‚Π°Π½ΠΎΡ˜ Ρ‚Π°Π±Π΅Π»ΠΈ Π’ΠΈΡ‚Π°Π½ΠΈΡ† ΠΈΠΌΠ°ΠΌΠΎ ΠΊΠΎΠ»ΠΎΠ½Ρƒ БСкс, ΡˆΡ‚ΠΎ ΠΎΠ΄Π³ΠΎΠ²Π°Ρ€Π° ΠΊΠΎΠ΄Ρƒ ΠΏΠΎΠ»Π° ΠΏΡƒΡ‚Π½ΠΈΠΊΠ°:

1 - ТСнско
2 - ΠΌΡƒΡˆΠΊΠΎ

Π’Π°ΠΊΠΎΡ’Π΅, Π½Π°ΠΏΡ€Π°Π²ΠΈΠ»ΠΈ смо Ρ‚Π°Π±Π΅Π»Ρƒ - Ρ€Π΅Ρ„Π΅Ρ€Π΅Π½Ρ‚Π½Ρƒ ΠΊΡšΠΈΠ³Ρƒ ΠΏΠΎΠ». Π—Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΡ‡Π½ΠΈΡ˜ΠΈ ΠΏΡ€ΠΈΠΊΠ°Π· ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΎ ΠΏΠΎΠ»Ρƒ ΠΏΡƒΡ‚Π½ΠΈΠΊΠ°, ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ јС Π΄ΠΎΠ΄Π°Ρ‚ΠΈ Π½Π°Π·ΠΈΠ² ΠΏΠΎΠ»Π° ΠΈΠ· ΠΈΠΌΠ΅Π½ΠΈΠΊΠ° ΠΏΠΎΠ» Π΄ΠΎ стола Π’ΠΈΡ‚Π°Π½ΠΈΡ†.

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π΅ Ρƒ Π : тидивСрсС, Π΄ΠΏΠ»ΠΈΡ€

Π’ dplyr ΠŸΠΎΡΡ‚ΠΎΡ˜ΠΈ Ρ‡ΠΈΡ‚Π°Π²Π° ΠΏΠΎΡ€ΠΎΠ΄ΠΈΡ†Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° Π·Π° Ρ…ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС:

  • inner_join()
  • left_join()
  • right_join()
  • full_join()
  • semi_join()
  • nest_join()
  • anti_join()

ΠΠ°Ρ˜Ρ‡Π΅ΡˆΡ›Π΅ ΠΊΠΎΡ€ΠΈΡˆΡ›Π΅Π½ΠΈ Ρƒ мојој пракси јС left_join().

Као ΠΏΡ€Π²Π° Π΄Π²Π° Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π°, Π³ΠΎΡ€Π΅ Π½Π°Π²Π΅Π΄Π΅Π½Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΡƒΠ·ΠΈΠΌΠ°Ρ˜Ρƒ Π΄Π²Π΅ Ρ‚Π°Π±Π΅Π»Π΅ Π·Π° спајањС ΠΈ ΠΊΠ°ΠΎ Ρ‚Ρ€Π΅Ρ›ΠΈ Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ by ΠΌΠΎΡ€Π°Ρ‚Π΅ навСсти ΠΊΠΎΠ»ΠΎΠ½Π΅ Π·Π° ΠΏΡ€ΠΈΠ΄Ρ€ΡƒΠΆΠΈΠ²Π°ΡšΠ΅.

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π΅ Ρƒ Π : Π΄ΠΏΠ»ΠΈΡ€

# объСдиняСм Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
left_join(titanic, gender,
          by = c("Sex" = "id"))

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

Π’ data.table ΠœΠΎΡ€Π°Ρ‚Π΅ ΡΠΏΠΎΡ˜ΠΈΡ‚ΠΈ Ρ‚Π°Π±Π΅Π»Π΅ ΠΏΠΎΠΌΠΎΡ›Ρƒ ΠΊΡ™ΡƒΡ‡Π° ΠΏΠΎΠΌΠΎΡ›Ρƒ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ merge().

АргумСнти Π·Π° Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ ΠΌΠ΅Ρ€Π³Π΅() Ρƒ Π΄Π°Ρ‚Π°.Ρ‚Π°Π±Π»Π΅

  • ΠΊ, ΠΈ β€” Π’Π°Π±Π΅Π»Π΅ Π·Π° спајањС
  • Π±ΠΈ β€” Колона која јС ΠΊΡ™ΡƒΡ‡ Π·Π° спајањС Π°ΠΊΠΎ ΠΈΠΌΠ° исто ΠΈΠΌΠ΅ Ρƒ ΠΎΠ±Π΅ Ρ‚Π°Π±Π΅Π»Π΅
  • Π±ΠΈ.ΠΊ, Π±ΠΈ.ΠΈ β€” ИмСна ΠΊΠΎΠ»ΠΎΠ½Π° којС Ρ‚Ρ€Π΅Π±Π° ΡΠΏΠΎΡ˜ΠΈΡ‚ΠΈ, Π°ΠΊΠΎ ΠΈΠΌΠ°Ρ˜Ρƒ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚Π° ΠΈΠΌΠ΅Π½Π° Ρƒ Ρ‚Π°Π±Π΅Π»Π°ΠΌΠ°
  • Π°Π»Π», Π°Π»Π».ΠΊ, Π°Π»Π».ΠΈ β€” Π’ΠΈΠΏ спајања, Π°Π»Π» Ρ›Π΅ Π²Ρ€Π°Ρ‚ΠΈΡ‚ΠΈ свС Ρ€Π΅Π΄ΠΎΠ²Π΅ ΠΈΠ· ΠΎΠ±Π΅ Ρ‚Π°Π±Π΅Π»Π΅, Π°Π»Π».ΠΊ ΠΎΠ΄Π³ΠΎΠ²Π°Ρ€Π° ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜ΠΈ Π›Π•Π€Π’ ЈОИН (оставићС свС Ρ€Π΅Π΄ΠΎΠ²Π΅ ΠΏΡ€Π²Π΅ Ρ‚Π°Π±Π΅Π»Π΅), Π°Π»Π».ΠΈ β€” ΠΎΠ΄Π³ΠΎΠ²Π°Ρ€Π° Π Π˜Π“Π₯Π’ ЈОИН ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° (напустићС свС Ρ€Π΅Π΄ΠΎΠ²Π΅ Π΄Ρ€ΡƒΠ³Π΅ Ρ‚Π°Π±Π΅Π»Π΅).

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

# объСдиняСм Ρ‚Π°Π±Π»ΠΈΡ†Ρ‹
merge(titanic, gender, by.x = "Sex", by.y = "id", all.x = T)

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π΅ Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

Као ΠΈ Ρƒ data.tableΠ£ pandas Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° сС користи Π·Π° спајањС Ρ‚Π°Π±Π΅Π»Π° merge().

АргумСнти Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΌΠ΅Ρ€Π³Π΅() Ρƒ ΠΏΠ°Π½Π΄Π°ΠΌΠ°

  • ΠΊΠ°ΠΊΠΎ β€” Π’ΠΈΠΏ Π²Π΅Π·Π΅: Π»Π΅Π²Π°, дСсна, ΡΠΏΠΎΡ™Π°ΡˆΡšΠ°, ΡƒΠ½ΡƒΡ‚Ρ€Π°ΡˆΡšΠ°
  • ΠΎΠ½ β€” Колона која јС ΠΊΡ™ΡƒΡ‡ Π°ΠΊΠΎ ΠΈΠΌΠ° исто ΠΈΠΌΠ΅ Ρƒ ΠΎΠ±Π΅ Ρ‚Π°Π±Π΅Π»Π΅
  • Π»Π΅Ρ„Ρ‚_ΠΎΠ½, Ρ€ΠΈΠ³Ρ…Ρ‚_ΠΎΠ½ β€” ИмСна ΠΊΡ™ΡƒΡ‡Π½ΠΈΡ… ΠΊΠΎΠ»ΠΎΠ½Π°, Π°ΠΊΠΎ ΠΈΠΌΠ°Ρ˜Ρƒ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚Π° ΠΈΠΌΠ΅Π½Π° Ρƒ Ρ‚Π°Π±Π΅Π»Π°ΠΌΠ°

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π΅ Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

# объСдиняСм ΠΏΠΎ ΠΊΠ»ΡŽΡ‡Ρƒ
titanic.merge(gender, how = "left", left_on = "Sex", right_on = "id")

ОсновнС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° ΠΈ ΠΈΠ·Ρ€Π°Ρ‡ΡƒΠ½Π°Ρ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½Π΅

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° су ΠΏΠΎ Π·Π½Π°Ρ‡Π΅ΡšΡƒ сличнС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π°ΠΌΠ° Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅, Π° Ρ‚Π°ΠΊΠΎΡ’Π΅ сС чСсто користС Ρƒ Π°Π½Π°Π»ΠΈΠ·ΠΈ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°. Али Π·Π° Ρ€Π°Π·Π»ΠΈΠΊΡƒ ΠΎΠ΄ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π΅, Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° Π½Π΅ ΠΌΠ΅ΡšΠ°Ρ˜Ρƒ Π±Ρ€ΠΎΡ˜ Ρ€Π΅Π΄ΠΎΠ²Π° ΠΎΠ΄Π»Π°Π·Π½ΠΎΠ³ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°.

Који јСзик ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° - Π  ΠΈΠ»ΠΈ ΠŸΠΈΡ‚Ρ…ΠΎΠ½? И јСдно ΠΈ Π΄Ρ€ΡƒΠ³ΠΎ! ΠŸΡ€Π΅Π»Π°Π·Π°ΠΊ са ΠΏΠ°Π½Π΄ΠΈ Π½Π° тидивСрсС ΠΈ ΠΏΠΎΠ΄Π°Ρ‚ΠΊΠ΅.Ρ‚Π°Π±Π΅Π»Π° ΠΈ Π½Π°Π·Π°Π΄

Π£ ΡΡƒΡˆΡ‚ΠΈΠ½ΠΈ, користСћи Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π°, Π΄Π΅Π»ΠΈΠΌΠΎ Π΄ΠΎΠ»Π°Π·Π½ΠΈ ΠΎΠΊΠ²ΠΈΡ€ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° Π½Π° Π΄Π΅Π»ΠΎΠ²Π΅ ΠΏΡ€Π΅ΠΌΠ° Π½Π΅ΠΊΠΎΠΌ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΡ˜ΡƒΠΌΡƒ, Ρ‚Ρ˜. ΠΏΠΎ врСдности ΠΏΠΎΡ™Π° ΠΈΠ»ΠΈ Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ ΠΏΠΎΡ™Π°. И Π²Ρ€ΡˆΠΈΠΌΠΎ Π°Ρ€ΠΈΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‡ΠΊΠ΅ ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π΅ Π½Π° сваком ΠΏΡ€ΠΎΠ·ΠΎΡ€Ρƒ. Π Π΅Π·ΡƒΠ»Ρ‚Π°Ρ‚ ΠΎΠ²ΠΈΡ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° Π±ΠΈΡ›Π΅ Π²Ρ€Π°Ρ›Π΅Π½ Ρƒ сваком Ρ€Π΅Π΄Ρƒ, Ρ‚Ρ˜. Π±Π΅Π· ΠΏΡ€ΠΎΠΌΠ΅Π½Π΅ ΡƒΠΊΡƒΠΏΠ½ΠΎΠ³ Π±Ρ€ΠΎΡ˜Π° Ρ€Π΅Π΄ΠΎΠ²Π° Ρƒ Ρ‚Π°Π±Π΅Π»ΠΈ.

На ΠΏΡ€ΠΈΠΌΠ΅Ρ€, ΡƒΠ·ΠΌΠΈΠΌΠΎ сто Π’ΠΈΡ‚Π°Π½ΠΈΡ†. МоТСмо ΠΈΠ·Ρ€Π°Ρ‡ΡƒΠ½Π°Ρ‚ΠΈ ΠΊΠΎΠ»ΠΈΠΊΠΈ јС ΠΏΡ€ΠΎΡ†Π΅Π½Π°Ρ‚ Ρ†Π΅Π½Π΅ свакС ΠΊΠ°Ρ€Ρ‚Π΅ Ρƒ ΠΎΠΊΠ²ΠΈΡ€Ρƒ класС ΠΊΠ°Π±ΠΈΠ½Π΅.

Π”Π° бисмо Ρ‚ΠΎ ΡƒΡ€Π°Π΄ΠΈΠ»ΠΈ, ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ јС Π΄Π° Ρƒ свакој линији добијСмо ΡƒΠΊΡƒΠΏΠ½Ρƒ Ρ†Π΅Π½Ρƒ ΠΊΠ°Ρ€Ρ‚Π΅ Π·Π° Ρ‚Ρ€Π΅Π½ΡƒΡ‚Π½Ρƒ класу ΠΊΠ°Π±ΠΈΠ½Π΅ којој ΠΏΡ€ΠΈΠΏΠ°Π΄Π° ΠΊΠ°Ρ€Ρ‚Π° Ρƒ овој линији, Π° Π·Π°Ρ‚ΠΈΠΌ ΠΏΠΎΠ΄Π΅Π»ΠΈΠΌΠΎ Ρ†Π΅Π½Ρƒ свакС ΠΊΠ°Ρ€Ρ‚Π΅ са ΡƒΠΊΡƒΠΏΠ½ΠΎΠΌ Ρ†Π΅Π½ΠΎΠΌ свих ΠΊΠ°Ρ€Π°Ρ‚Π° истС класС ΠΊΠ°Π±ΠΈΠ½Π΅ .

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° Ρƒ Π : тидивСрсС, Π΄ΠΏΠ»ΠΈΡ€

Π”Π° бистС Π΄ΠΎΠ΄Π°Π»ΠΈ Π½ΠΎΠ²Π΅ ΠΊΠΎΠ»ΠΎΠ½Π΅, Π±Π΅Π· ΠΊΠΎΡ€ΠΈΡˆΡ›Π΅ΡšΠ° Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ° Ρ€Π΅Π΄ΠΎΠ²Π°, Ρƒ dplyr слуТи Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜ΠΈ mutate().

Π“ΠΎΡ€Π΅ описани ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Ρ€Π΅ΡˆΠΈΡ‚ΠΈ Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ΠΌ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° ΠΏΠΎ ΠΏΠΎΡ™Ρƒ ΠŸΡ†Π»Π°ΡΡ ΠΈ ΡΠ°Π±ΠΈΡ€Π°ΡšΠ΅ ΠΏΠΎΡ™Π° Ρƒ Π½ΠΎΠ²Ρƒ ΠΊΠΎΠ»ΠΎΠ½Ρƒ Π€Π°Ρ€Π΅. Π—Π°Ρ‚ΠΈΠΌ Ρ€Π°Π·Π³Ρ€ΡƒΠΏΠΈΡˆΠΈΡ‚Π΅ Ρ‚Π°Π±Π΅Π»Ρƒ ΠΈ ΠΏΠΎΠ΄Π΅Π»ΠΈΡ‚Π΅ врСдности ΠΏΠΎΡ™Π° Π€Π°Ρ€Π΅ Π½Π° ΠΎΠ½ΠΎ ΡˆΡ‚ΠΎ сС Π΄ΠΎΠ³ΠΎΠ΄ΠΈΠ»ΠΎ Ρƒ ΠΏΡ€Π΅Ρ‚Ρ…ΠΎΠ΄Π½ΠΎΠΌ ΠΊΠΎΡ€Π°ΠΊΡƒ.

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° Ρƒ Π : Π΄ΠΏΠ»ΠΈΡ€

group_by(titanic, Pclass) %>%
  mutate(Pclass_cost = sum(Fare)) %>%
  ungroup() %>%
  mutate(ticket_fare_rate = Fare / Pclass_cost)

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

Алгоритам Ρ€Π΅ΡˆΠ΅ΡšΠ° ΠΎΡΡ‚Π°Ρ˜Π΅ исти ΠΊΠ°ΠΎ Ρƒ dplyr, Ρ‚Ρ€Π΅Π±Π° Π΄Π° ΠΏΠΎΠ΄Π΅Π»ΠΈΠΌΠΎ Ρ‚Π°Π±Π΅Π»Ρƒ Π½Π° ΠΏΡ€ΠΎΠ·ΠΎΡ€Π΅ ΠΏΠΎ ΠΏΠΎΡ™Ρƒ ΠŸΡ†Π»Π°ΡΡ. Π£ Π½ΠΎΠ²Ρƒ ΠΊΠΎΠ»ΠΎΠ½Ρƒ унСситС износ Π·Π° Π³Ρ€ΡƒΠΏΡƒ која ΠΎΠ΄Π³ΠΎΠ²Π°Ρ€Π° сваком Ρ€Π΅Π΄Ρƒ ΠΈ Π΄ΠΎΠ΄Π°Ρ˜Ρ‚Π΅ ΠΊΠΎΠ»ΠΎΠ½Ρƒ Ρƒ којој ΠΈΠ·Ρ€Π°Ρ‡ΡƒΠ½Π°Π²Π°ΠΌΠΎ ΡƒΠ΄Π΅ΠΎ Ρ†Π΅Π½Π΅ свакС ΠΊΠ°Ρ€Ρ‚Π΅ Ρƒ њСној Π³Ρ€ΡƒΠΏΠΈ.

Π”Π° бистС Π΄ΠΎΠ΄Π°Π»ΠΈ Π½ΠΎΠ²Π΅ ΠΊΠΎΠ»ΠΎΠ½Π΅ Ρƒ data.table присутан ΠΎΠΏΠ΅Ρ€Π°Ρ‚Π΅Ρ€ :=. Испод јС ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Ρ€Π΅ΡˆΠ°Π²Π°ΡšΠ° ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° ΠΏΠΎΠΌΠΎΡ›Ρƒ ΠΏΠ°ΠΊΠ΅Ρ‚Π° data.table

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° Ρƒ Π : ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°

titanic[,c("Pclass_cost","ticket_fare_rate") := .(sum(Fare), Fare / Pclass_cost), 
        by = Pclass]

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

ЈСдан ΠΎΠ΄ Π½Π°Ρ‡ΠΈΠ½Π° Π΄Π° Π΄ΠΎΠ΄Π°Ρ‚Π΅ Π½ΠΎΠ²Ρƒ ΠΊΠΎΠ»ΠΎΠ½Ρƒ Ρƒ pandas - користитС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ assign(). Π”Π° бисмо сумирали Ρ†Π΅Π½Ρƒ ΠΊΠ°Ρ€Π°Ρ‚Π° ΠΏΠΎ класама ΠΊΠ°Π±ΠΈΠ½Π΅, Π±Π΅Π· Π³Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ° Ρ€Π΅Π΄ΠΎΠ²Π°, користићСмо Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Ρƒ transform().

Испод јС ΠΏΡ€ΠΈΠΌΠ΅Ρ€ Ρ€Π΅ΡˆΠ΅ΡšΠ° Ρƒ ΠΊΠΎΠΌΠ΅ додајСмо Ρƒ Ρ‚Π°Π±Π΅Π»Ρƒ Π’ΠΈΡ‚Π°Π½ΠΈΡ† истС 2 ΠΊΠΎΠ»ΠΎΠ½Π΅.

Π€ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° Ρƒ ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ: ΠΏΠ°Π½Π΄Π΅

titanic.assign(Pclass_cost      =  titanic.groupby('Pclass').Fare.transform(sum),
               ticket_fare_rate = lambda x: x['Fare'] / x['Pclass_cost'])

Π’Π°Π±Π΅Π»Π° ΠΊΠΎΡ€Π΅ΡΠΏΠΎΠ½Π΄Π΅Π½Ρ†ΠΈΡ˜Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π° ΠΈ ΠΌΠ΅Ρ‚ΠΎΠ΄Π°

Испод јС Ρ‚Π°Π±Π΅Π»Π° ΠΊΠΎΡ€Π΅ΡΠΏΠΎΠ½Π΄Π΅Π½Ρ†ΠΈΡ˜Π΅ ΠΈΠ·ΠΌΠ΅Ρ’Ρƒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Π·Π° ΠΈΠ·Π²ΠΎΡ’Π΅ΡšΠ΅ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚ΠΈΡ… ΠΎΠΏΠ΅Ρ€Π°Ρ†ΠΈΡ˜Π° са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° Ρƒ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΈΠΌΠ° којС смо Ρ€Π°Π·ΠΌΠ°Ρ‚Ρ€Π°Π»ΠΈ.

Опис
тидивСрсС
ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°
ΠΏΠ°Π½Π΄Π΅

Π£Ρ‡ΠΈΡ‚Π°Π²Π°ΡšΠ΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°
vroom()/ readr::read_csv() / readr::read_tsv()
fread()
read_csv()

ΠšΡ€Π΅ΠΈΡ€Π°ΡšΠ΅ ΠΎΠΊΠ²ΠΈΡ€Π° ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°
tibble()
data.table()
dict() + from_dict()

Π˜Π·Π±ΠΎΡ€ ΠΊΠΎΠ»ΠΎΠ½Π΅
select()
Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ j, Π΄Ρ€ΡƒΠ³Π° ΠΏΠΎΠ·ΠΈΡ†ΠΈΡ˜Π° Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ°
листу ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΈΡ… ΠΊΠΎΠ»ΠΎΠ½Π° прСносимо Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ° / drop() / filter() / select_dtypes()

Π€ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ΅ Ρ€Π΅Π΄ΠΎΠ²Π°
filter()
Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ i, ΠΏΡ€Π²Π° ΠΏΠΎΠ·ΠΈΡ†ΠΈΡ˜Π° Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ°
УсловС Ρ„ΠΈΠ»Ρ‚Ρ€ΠΈΡ€Π°ΡšΠ° Π½Π°Π²ΠΎΠ΄ΠΈΠΌΠΎ Ρƒ угластим Π·Π°Π³Ρ€Π°Π΄Π°ΠΌΠ° / filter()

Π“Ρ€ΡƒΠΏΠΈΡΠ°ΡšΠ΅ ΠΈ Π°Π³Ρ€Π΅Π³Π°Ρ†ΠΈΡ˜Π°
group_by() + summarise()
Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚Π΅ j + by
groupby() + agg()

Π’Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»Π½Π° ΡƒΠ½ΠΈΡ˜Π° Ρ‚Π°Π±Π΅Π»Π° (УНИОН)
bind_rows()
rbind()
concat()

Π₯ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»Π½ΠΎ спајањС Ρ‚Π°Π±Π΅Π»Π° (ЈОИН)
left_join() / *_join()
merge()
merge()

ОсновнС Ρ„ΡƒΠ½ΠΊΡ†ΠΈΡ˜Π΅ ΠΏΡ€ΠΎΠ·ΠΎΡ€Π° ΠΈ додавањС ΠΈΠ·Ρ€Π°Ρ‡ΡƒΠ½Π°Ρ‚ΠΈΡ… ΠΊΠΎΠ»ΠΎΠ½Π°
group_by() + mutate()
Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ j користСћи ΠΎΠΏΠ΅Ρ€Π°Ρ‚Π΅Ρ€Π° := + Π°Ρ€Π³ΡƒΠΌΠ΅Π½Ρ‚ by
transform() + assign()

Π—Π°ΠΊΡ™ΡƒΡ‡Π°ΠΊ

МоТда сам Ρƒ Ρ‡Π»Π°Π½ΠΊΡƒ описао Π½Π΅ Π½Π°Ρ˜ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»Π½ΠΈΡ˜Π΅ ΠΈΠΌΠΏΠ»Π΅ΠΌΠ΅Π½Ρ‚Π°Ρ†ΠΈΡ˜Π΅ ΠΎΠ±Ρ€Π°Π΄Π΅ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ°, ΠΏΠ° Ρ›Π΅ ΠΌΠΈ Π±ΠΈΡ‚ΠΈ Π΄Ρ€Π°Π³ΠΎ Π°ΠΊΠΎ исправитС мојС Π³Ρ€Π΅ΡˆΠΊΠ΅ Ρƒ ΠΊΠΎΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΌΠ° ΠΈΠ»ΠΈ Ρ˜Π΅Π΄Π½ΠΎΡΡ‚Π°Π²Π½ΠΎ Π΄ΠΎΠΏΡƒΠ½ΠΈΡ‚Π΅ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡ˜Π΅ Π΄Π°Ρ‚Π΅ Ρƒ Ρ‡Π»Π°Π½ΠΊΡƒ Π΄Ρ€ΡƒΠ³ΠΈΠΌ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠ°ΠΌΠ° Π·Π° Ρ€Π°Π΄ са ΠΏΠΎΠ΄Π°Ρ†ΠΈΠΌΠ° Ρƒ Π  / ΠŸΠΈΡ‚Ρ…ΠΎΠ½-Ρƒ.

Као ΡˆΡ‚ΠΎ сам Π³ΠΎΡ€Π΅ написао, сврха Ρ‡Π»Π°Π½ΠΊΠ° нијС Π±ΠΈΠ»Π° Π΄Π° Π½Π°ΠΌΠ΅Ρ‚Π½Π΅ својС ΠΌΠΈΡˆΡ™Π΅ΡšΠ΅ ΠΎ Ρ‚ΠΎΠΌΠ΅ који јС јСзик Π±ΠΎΡ™ΠΈ, Π²Π΅Ρ› Π΄Π° ΠΏΠΎΡ˜Π΅Π΄Π½ΠΎΡΡ‚Π°Π²ΠΈ могућност ΡƒΡ‡Π΅ΡšΠ° ΠΎΠ±Π° јСзика, ΠΈΠ»ΠΈ, Π°ΠΊΠΎ јС ΠΏΠΎΡ‚Ρ€Π΅Π±Π½ΠΎ, ΠΌΠΈΠ³Ρ€ΠΈΡ€Π° ΠΈΠ·ΠΌΠ΅Ρ’Ρƒ ΡšΠΈΡ….

Ако Π²Π°ΠΌ сС Π΄ΠΎΠΏΠ°ΠΎ Ρ‡Π»Π°Π½Π°ΠΊ, Π±ΠΈΡ›Π΅ ΠΌΠΈ Π΄Ρ€Π°Π³ΠΎ Π΄Π° ΠΈΠΌΠ°ΠΌ Π½ΠΎΠ²Π΅ ΠΏΡ€Π΅Ρ‚ΠΏΠ»Π°Ρ‚Π½ΠΈΠΊΠ΅ Π½Π° мој Π˜ΠΎΡƒΠ’ΡƒΠ±Π΅ ΠΈ telegram ΠΊΠ°Π½Π°Π»Π°.

ΠžΠΏΡ€ΠΎΡ

КојС ΠΎΠ΄ слСдСћих ΠΏΠ°ΠΊΠ΅Ρ‚Π° користитС Ρƒ свом Ρ€Π°Π΄Ρƒ?

Π£ ΠΊΠΎΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΌΠ° ΠΌΠΎΠΆΠ΅Ρ‚Π΅ написати Ρ€Π°Π·Π»ΠΎΠ³ свог ΠΈΠ·Π±ΠΎΡ€Π°.

Π‘Π°ΠΌΠΎ рСгистровани корисници ΠΌΠΎΠ³Ρƒ учСствовати Ρƒ Π°Π½ΠΊΠ΅Ρ‚ΠΈ. ΠŸΡ€ΠΈΡ˜Π°Π²ΠΈΡ‚Π΅ сС, Π”ΠΎΠ±Ρ€ΠΎΠ΄ΠΎΡˆΠ°ΠΎ си.

Који ΠΏΠ°ΠΊΠ΅Ρ‚ Π·Π° ΠΎΠ±Ρ€Π°Π΄Ρƒ ΠΏΠΎΠ΄Π°Ρ‚Π°ΠΊΠ° користитС (ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΠ·Π°Π±Ρ€Π°Ρ‚ΠΈ Π½Π΅ΠΊΠΎΠ»ΠΈΠΊΠΎ ΠΎΠΏΡ†ΠΈΡ˜Π°)

  • 100%тидивСрсС19

  • 100%ΠΏΠΎΠ΄Π°Ρ†ΠΈ.Ρ‚Π°Π±Π΅Π»Π°14

  • 100%пандас23

42 корисника јС гласало. 9 корисника јС Π±ΠΈΠ»ΠΎ ΡƒΠ·Π΄Ρ€ΠΆΠ°Π½ΠΎ.

Π˜Π·Π²ΠΎΡ€: Π²Π²Π².Ρ…Π°Π±Ρ€.Ρ†ΠΎΠΌ

Π”ΠΎΠ΄Π°Ρ˜ ΠΊΠΎΠΌΠ΅Π½Ρ‚Π°Ρ€