αααααΆαααααΆαααΆααα±αααα ααΆα αααΈαα ααα»αααααΆα αααΎαα₯α‘αΌααααα αααΆααααααααΆαααααα½ααααα α―αααααααααααααα α αΎααααααααΆαααα’αΆα αα·αααΌααααΈαααα½αααααααΌαα αααΆαα±ααααΆαααααααααα
αα ααΎαααααΌαααααΆαααΆααα±αααα ααΆα αααΈαα αααα»αααΆααααααα α α·ααααααα αααααααααα½αα ααα½αααααααα»αααΆαα αΆααααααΎαααΆαααΈααα»ααααΆααααα»αα αααααααα½ααααα»αα ααααααααααααΆαααααααΊααΆααααααΈααα’αΌ βR Language for Excel Usersβα ααΆαα½αααΉααααααα·ααααΆααα αααα»αα ααααΆαααααααα§ααααααααα»αααΆαα αΌααα αααα»α R α αΎααααααααΆαααααααΆααααααΆαααααΆαααααααααΆααααααα»ααααααΆαααΎαααααΆααααααααΆααΆααΆαα»ααααΈα
ααααα·αααΎααΆαααΆαααΆααα’ααααΆαα½ααα·αααααααα αααα»ααααα»αα αα»ααααα’αααααααΎααΆααα ααααααΎαα αααα»α Excel ααααααα»αααααΎα±ααα’αααααααΆααααΆαα½αα§ααααααα·ααΆααα·αααααααααααααΎαααΆααα»α α αΎααααα»αααααααα½ααααα₯ααα·αααααααΆαααααα»αααΌαα§ααααααα·ααΆααα·ααααααα
ααΆαα·ααΆ
ααααα·αααΎα’αααα
αΆααα’αΆααααααααΎααΆααα·ααΆααα·αααααα α’ααααααα ααααΆα
αΆααα’αΆααααααααΎαααααααα»α
ααα ααααΈααα α’αααΈαααααα·ααααΆ ααΎαααααα·ααααΆααααααααΆααα’αααααΆ? αααααα·ααΈαααααα·ααααΆ
4.1.αααααααΈα‘α ααΆαααα‘αΎαααΆααΆ R αα·αααα·ααααΆαα’αα·αααααα RStudio
4.2.αααααααΈα’α αα ααΆαααααααααα·ααααααααΌαααααΆααααα»α R
4.3.αααααααΈα£α ααΆαα’αΆααα·ααααααααΈα―αααΆα TSV, CSV, Excel αα·α Google Sheets
4.4.αααααααΈα€α αααααα½αααα ααΆαααααΎαααΎα αα·αααααΌαααααααα½ααα ααααααααα»α R
4.5.αααααααΈα₯α ααΆααααααααα½αααααααΆαα αααα»αααΆααΆααααα»α R
4.6.αααααααΈα¦α ααΆαααΆααααΆαααα»α αα·αααΆααααααΌααααα»ααα·αααααααααα»α R
4.7.αααααααΈα§α ααΆαααααΆααααααΆααααα αα·ααααααααααΆααΆααααα»α R
4.8.αααααααΈα¨α αα»αααΆααααα’α½α αααα»α R
4.9.αααααααΈα©α ααΆαααααα·αααΆααΆα α¬α’αΆααΆα‘αΌαααααΆααΆααααα½ααααα»α R
4.10.αααααααΈ 10α ααΆααααα»αα―αααΆα JSON αααα»α R αα·ααααααααααααΈαα ααΆααΆααΆα
4.11.αααααααΈ α‘α‘α αααα ααααααΆααα αααααααααΎαα»αααΆα qplot()
4.12.αααααααΈ 12α ααΆαααααΎαααααΆααααααΆαααααααααααααααΆαααααααααΎαααα αα ggplot2 ααα ααααΈααααα·ααααΆα
ααα ααααΈααα
ααΆαααΆααα YouTube αααααΈα αΆαααααααα·ααααΆαα ααΎ YouTube ααααΆααααΆαα½ααααααΆαα ααααααααααα·ααααΆ
α’αααΈαααααα·ααααΆ
αααααα·ααααΆααααΌαααΆααααα
αα‘αΎααα»ααα·αααααΆαααααααα tidyverse
αα·ααααα
αααα½ααααα
αΌααα
αααα»αααΆα readr
, vroom
, dplyr
, tidyr
, ggplot2
. ααΆααΆααα·αααΆαα ααΆααααα
ααααα’αααααααααα
αααα»α R αααααααΎααααα·ααααα·ααΆαααααααααααΆ α§ααΆα ααα data.table
ααα»ααααααΆααααααααααα tidyverse
αα·α
αΆααααΆα ααΆααααα½αα’αΆα ααΌααααΈααα’αααααααΎααααΆααααααα·αααΆαααααα»ααααααΆα ααΌα
αααααααα»ααα·αααΆ ααΆααΆααΆααααααΎααααα»αααΆαα
αΆααααααΎααααααΆααΆ R ααΆαα½α tidyverse
.
αααααα·ααααΆααΉαααααΆαα’αααααΆααααααααα·ααααα·ααΆααα·ααΆααα·ααααααααΆααα’αα α αΆααααΈααΆααααα»ααα αΌααααααΆαααΎαααΎααααααααααααΆααααα ααα
α ααα»α’αααΈααΆαααΆ R αα·ααα·αααα Python? αααααΆααα R ααΊααΆααΆααΆαααααΆααα»αααΆα ααΆααΆααααααΆααααα½ααααααΆααα’αααααααΎααααΆαα Excel αααα»αααΆαααααΌααα ααΆ ααΈααααα αα·αα αΆαααΆα αααααααααααΈααΆαααααααααααα·ααΈαααααααα·αααααα»αα»ααΆαααα
αα αααααα αααααααΈααα’αΌα ααα½α 12 ααααΌαααΆαααααααα»α αααααΆαααααααααΈ 5 αα 20 ααΆααΈααΈαα½ααα
αααααααΉαααΎαααΆαααααΎααα αααααΆααααααα
αααα αααα»αααΉαααΎαααΆαα
αΌαααααααααααααΈαα
ααΎααα ααααααααααααα»αα
ααΎαααααα·ααααΆααααααααΆααα’αααααΆ?
αααα»αβαα·αβααΆβαααβα αααΆααβααΆααβααΈβα αααβααΎαβαααβααΆβαααΆαβααΆβαααα»αβααΉαβαααααΆβαααα’α·αβααααααβαααα
αααααα·ααααΆααΊαααα ααΎα’ααααααααααΎααααΆαα Microsoft Excel αααΆαααααααααα»αααΆαααΆααααααα½ααα αα·αα’αα»ααααααΆαααΆααααααα½αααααΆααα’ααααΆαα½αααΉααα·αααααααα ααΈαααα ααΆααΌαα ααααα·αααΎα’αααααΎααααααα·ααΈ Microsoft Excel αααΆαα αα ααΆαααααααααα»ααα½ααααααΆα α ααααααααα·ααααΆααΊαααααααααααΆααα’αααα
α’ααααα·αα αΆαααΆα αααΆαααααΆαααααααααααα·ααΈααΎααααΈαααα αααααααα·ααααΆααααα ααααα... αααααα·ααααΆααΊαααααααΎα’αααα αΆααααααΎαααααΌαα
ααα»αααααααα ααααΆα
αΆααααααΎαααΈαααααααΈ 4 ααΆααΉαααΆααααααΆαααα½αα±ααα
αΆααα’αΆαααααααααααΆααα’αααααααΎααααΆαα R ααααααααααααααα ... αα»αααΆαααααΆαααααααα
ααααΌα
ααΆ dplyr
ΠΈ tidyr
ααΉαααααΌαααΆααα·ααΆααααΆαααα’α·ααα½αα
ααα½αα
αααααα·ααΈαααααα·ααααΆ
αααααααΈα‘α ααΆαααα‘αΎαααΆααΆ R αα·αααα·ααααΆαα’αα·αααααα RStudio
ααΆαααα·α ααααααααα»αααααααΆαα ααααΈααΆ 23 2020
α―αααΆαααα:
ααΈααα’αΌ:
ααΆααα·αααααΆ:
αααααααααΆααααα»αα’αα‘α»αααααααααΎαααΉαααΆααα αα·αααα‘αΎααααααα·ααΈα
αΆαααΆα
α α αΎααα·αα·ααααααααααααα’αααΈαααααααΆα αα·αα
ααα»α
αααααΆααααααα·ααααΆαα’αα·αααααα RStudio α
αααααααΈα’α αα ααΆαααααααααα·ααααααααΌαααααΆααααα»α R
ααΆαααα·α ααααααααα»αααααααΆαα ααααΈααΆ 30 2020
α―αααΆαααα:
ααΈααα’αΌ:
ααΆααα·αααααΆ:
ααααααααααΉααα½αα’αααα±αααααααΈαα
ααΆαααααααααα·ααααααααΆαααααΆααα
αααα»αααΆααΆ R α ααΎαααΉααα·αα·αααααΎααααα’α·ααα
ααα·α
ααα ααα»αααΆαααα·α
αααα αα·ααααααΈα ααααααααΈαααααααααΎααα½αααΆ αα·αα
αΌαααααΎααΆαα»ααΈαα½αααααααα½αααα
αααααααΈα£α ααΆαα’αΆααα·ααααααααΈα―αααΆα TSV, CSV, Excel αα·α Google Sheets
ααΆαααα·α ααααααααα»αααααααΆαα ααααααΆ 6 2020
α―αααΆαααα:
ααΈααα’αΌ:
ααΆααα·αααααΆ:
ααΆαααααΎααΆαααΆαα½ααα·αααααα ααααα·ααα·αααΈα§ααααα α
αΆααααααΎαααΆαα½αααΉαααΆαααΆαααααααααΆα αααα
ααααααΌαααΆαααααΎααααΆααααα‘α»ααααααααα vroom
, readxl
, googlesheets4
αααααΆαααααα»ααα·αααααααα
αααα»αααα·ααααΆα R ααΈα―αααΆα csv, tsv, Excel αα·α Google αααααΉαα
αααααααΈα€α αααααα½αααα ααΆαααααΎαααΎα αα·αααααΌαααααααα½ααα ααααααααα»α R
ααΆαααα·α ααααααααα»αααααααΆαα ααααααΆ 13 2020
α―αααΆαααα:
ααΈααα’αΌ:
ααΆααα·αααααΆ:
ααααααααααΊα’αααΈαααα
αα dplyr
. αα
αααα»αααΆ ααΎαααΉαααααααααααΈαααααααα dataframes ααααΎαααΎααα½αααα
αΆαααΆα
α α αΎαααααΌαααααααα½αααΆα
ααΎαααααΉαααααααααααΌαα’αααΈαααααΆααααα αα·ααααααααααΆαα½αααααΎα±ααααΌα R ααααα’αααααΆααααα’αΆα α’αΆαααΆαα
αααααααΈα₯α ααΆααααααααα½αααααααΆαα αααα»αααΆααΆααααα»α R
ααΆαααα·α ααααααααα»αααααααΆαα ααααααΆ 20 2020
α―αααΆαααα:
ααΈααα’αΌ:
ααΆααα·αααααΆ:
αα
αααα»αααΈααα’αΌααα ααΎαααααααααΆααααααΆααΆαα½ααααααΆααα tidyverse
αα·ααααα
αα dplyr
.
ααΌααααα‘ααααΎααααα»ααααα½ααΆααααα»αααΆα mutate()
α αΎαααΎαααΉααααααΈααααααααΎαα½αααΆααΎααααΈαααααααα½ααααααααΆαααααΆααααΈαα
αααα»αααΆααΆαα
αααααααΈα¦α ααΆαααΆααααΆαααα»α αα·αααΆααααααΌααααα»ααα·αααααααααα»α R
ααΆαααα·α ααααααααα»αααααααΆαα ααααααΆ 27 2020
α―αααΆαααα:
ααΈααα’αΌ:
ααΆααα·αααααΆ:
ααααααααααααΌαααΆαα§αααα·ααααααααα·ααααα·ααΆαααααΆαααα½αααααΆααα·ααΆααα·αααααα ααΆαααΆααααΆαααα»α αα·αααΆααααααΌααααα»αα αααα»αα’αα‘α»αααααααααααΎαααΉαααααΎαααα
αα dplyr
αα·ααααααααα·ααα group_by()
ΠΈ summarise()
.
ααΎαααΉααα·αα·αααααΎααα»αααΆααααα½ααΆαααΆααααΌα summarise()
, i.e. summarise()
, summarise_if()
ΠΈ summarise_at()
.
αααααααΈα§α ααΆαααααΆααααααΆααααα αα·ααααααααααΆααΆααααα»α R
ααΆαααα·α ααααααααα»αααααααΆαα 4 ααα§αααΆ 2020
α―αααΆαααα:
ααΈααα’αΌ:
ααΆααα·αααααΆ:
ααααααααααΉααα½αα’αααα±αααααα’αααΈααααα·ααααα·ααΆαααααΆαααααΆααααΆααΆαααααα αα·ααααααα
αα ααΈααααααααΊααααΎααΉαααααα·ααααα·ααΆα UNION αα αααα»αααΆααΆαααα½α SQL α
Horizontal Join ααααΌαααΆαααααααΆααα αααΆαααααααΆααα’αααααααΎααααΆαα Excel αααααΆααα»αααΆα VLOOKUP α αΎααα αααα»α SQL ααααα·ααααα·ααΆαααααααααααΌαααΆαα’αα»ααααααα JOIN operatorα
αααα»αα’αα‘α»ααααααααα ααΎαααΉααααααααΆααααα αΆααΆααααααα αααα»αα’αα‘α»αααααααααΎαααΉαααααΎαααα
αα dplyr
, readxl
, tidyr
ΠΈ stringr
.
αα»αααΆαααααΆααααααααΎαααΉααα·α αΆαααΆα
bind_rows()
- ααΆαααααΆαααααααααααΆααΆαleft_join()
- ααΆααααααΆαααααααααααΆααΆαsemi_join()
- αα½αααΆααααΆααΆαα αΌααα½αanti_join()
- α αΌααα½αααΆααΆαααααΆα ααα»α
αααααααΈα¨α αα»αααΆααααα’α½α αααα»α R
ααΆαααα·α ααααααααα»αααααααΆαα 11 ααα§αααΆ 2020
α―αααΆαααα:
ααΆααα·αααααΆ:
αα»αααΆα Window ααΆαα’ααααααααααααααΉαααΆααααααΌααααα»α αα½αααααααα’αΆαααααααααααΆααΆααααα
αΌα αα·αα’αα»ααααααααα·ααααα·ααΆααααααααααΎαα½αααΆ ααα»αααααα»αααααΌαα
ααα½ααα½αααααααα»αααααααααααααα
αα
αααα»ααααααααα ααΎααααααα·ααααΆαααα
αα dplyr
, αα·ααα»αααΆα group_by()
, mutate()
ααααΌα
ααΆααααΈα cumsum()
, lag()
, lead()
ΠΈ arrange()
.
αααααααΈα©α ααΆαααααα·αααΆααΆα α¬α’αΆααΆα‘αΌαααααΆααΆααααα½ααααα»α R
ααΆαααα·α ααααααααα»αααααααΆαα 18 ααα§αααΆ 2020
α―αααΆαααα:
ααΆααα·αααααΆ:
α’αααααααΎααααΆαα Excel ααΆαα
αααΎαααααΎααΆααΆααααα½ααα·αααααα αααααΊααΆα§αααααααααΆααααα½ααα½ααααα’αααα’αΆα
ααααααα’αΆαααααα·αααααααα
αα
ααΆαααΆαααΆααααααα’αΆα
α’αΆαααΆααααα»αααααααααααα»ααααΆααα·ααΆααΈααα»αααααα
αα αααα»ααααααααα ααΎαααΉαααΎαααΈααααααααα·αααΆααΆαααΆα’αααα R α αΎαααααααααα½αααΆααΈααααααααααΌααΆααα ααα αα·αα αααΆααααα·αα
αααααααΆαα
αααΎαααααΌαααΆαα§αααα·αααααααα
αα tidyr
αα·ααα»αααΆα pivot_longer()
ΠΈ pivot_wider()
.
αααααααΈ 10α ααΆααααα»αα―αααΆα JSON αααα»α R αα·ααααααααααααΈαα ααΆααΆααΆα
ααΆαααα·α ααααααααα»αααααααΆαα 25 ααα§αααΆ 2020
α―αααΆαααα:
ααΆααα·αααααΆ:
JSON αα·α XML ααΊααΆααααααααααααα·αααααα»ααααααΆααααΆααααααΆαα»α αα·αααααΆααααααΌαααααααΆα αααααΆααααααΆαααααΆαααααΆαααααα½αααααααΆα
ααα»ααααααΆαα·ααΆααααα»αααΆααα·ααΆααα·ααααααααααααα αΆααααα»ααααααααααααα ααΌα αααααα»αααΉαααααΎααΆααα·ααΆα α αΆαααΆα αααααΌαααΆαααΆαα ααΆααααααααΆααΆα ααααααααΆα’αααΈαααααΎαααΉαααααα αααα»αααΈααα’αΌαααα
αααααααααΌαααΆαα§αααα·αααααααα
αα tidyr
αα½ααααα
αΌααα
αααα»αααααΌααααααααΆααα tidyverse
, αα·ααα»αααΆα unnest_longer()
, unnest_wider()
ΠΈ hoist()
.
αααααααΈ α‘α‘α αααα ααααααΆααα αααααααααΎαα»αααΆα qplot()
ααΆαααα·α ααααααααα»αααααααΆαα 1 2020 αααα·αα»ααΆ
α―αααΆαααα:
ααΆααα·αααααΆ:
αααα
αα ggplot2
ααΊααΆα§αααααααΎαααΎααα·ααααααααααααα·αααααα»ααα½α αα·αααααΉααααα
αααα»α R.
αα
αααα»ααααααααα ααΎαααΉααααααΈαααααααααΎαααααΆα ααααΆαααααααααααΎαα»αααΆα qplot()
α αΎαααΌααα·ααΆαα’αααα’αααΆαααααααΆαααΆααα’ααααααΆα
αααααααΈ 12α ααΆαααααΎαααααΆααααααΆαααααααααααααααΆαααααααααΎαααα αα ggplot2
ααΆαααα·α ααααααααα»αααααααΆαα 8 2020 αααα·αα»ααΆ
α―αααΆαααα:
ααΆααα·αααααΆ:
ααααααααα αΆαααΈααΆααααααααααααααα
αα ggplot2
αα·αααααααΆααααααααΆααααΆαααααΆα αααα
αααα»ααααααΆαααααααΆααααααααα
αααα»αααΆα
ααΎαααΉααα·ααΆαααααΈααΆαααααααΆααααααααΆααα αααα»ααααα αα α αΎααααααΈααααα’αα»αααααααααΆααααΎααααΈαααααΎαααααΆα ααα
ααα ααααΈααααα·ααααΆα
αααα»αααΆαααααΆααΆααααααΎααααααα·ααΈαααααα·ααααΆα±ααααΆαα αααΆααααΆααααΆααααα’αΆα ααααΎααΆα ααΎααααΈααααα ααααααααΆαα αΆαααΆα ααααα»ααααα’αααααΉαααααΌαααΆα ααΎααααΈα’αα»ααααααα αΆαααααΌααααα»αααΆααααα§ααααααα·ααΆααα·ααααααααααΆαα₯αααα·ααααΌα ααΆααΆααΆ R α
αααααα·ααααΆαα·ααααααΆααΆαααααΆααααααααααααΆααααΆααα·ααΆααα·αααααααααααααΎααΆααΆ R ααααα ααα»ααααααΆααΉααα½αα’αααα±αααααααΈαα αα αααααα αΆαααΆα αααΆααα’αααααααΆααααΏααααα
ααααααααααααααα·ααΈαααααα·ααααΆααααΌαααΆααα
ααΆα‘αΎααααααΆαααααααα 12 αααααΆα α αααααΆαααααααΆα ααα
ααααα
αααα αααα»αααΉαααΎαααΆαα
αΌαααααααααααααΈ ααΌα
αααααααα»αααΌαααααΆα
ααααα: www.habr.com