Excel ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•œ R ์–ธ์–ด(๋ฌด๋ฃŒ ๋™์˜์ƒ ๊ฐ•์ขŒ)

๊ฒฉ๋ฆฌ๋กœ ์ธํ•ด ๋งŽ์€ ์‚ฌ๋žŒ๋“ค์ด ์ด์ œ ๋Œ€๋ถ€๋ถ„์˜ ์‹œ๊ฐ„์„ ์ง‘์—์„œ ๋ณด๋‚ด๊ณ  ์žˆ์œผ๋ฉฐ, ์ด ์‹œ๊ฐ„์€ ์œ ์šฉํ•˜๊ฒŒ ๋ณด๋‚ผ ์ˆ˜ ์žˆ๊ณ , ์‹ฌ์ง€์–ด ์‚ฌ์šฉํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

๊ฒฉ๋ฆฌ๊ฐ€ ์‹œ์ž‘๋˜๋ฉด์„œ ๋ช‡ ๋‹ฌ ์ „์— ์‹œ์ž‘ํ•œ ์ผ๋ถ€ ํ”„๋กœ์ ํŠธ๋ฅผ ๋งˆ๋ฌด๋ฆฌํ•˜๊ธฐ๋กœ ๊ฒฐ์ •ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํ”„๋กœ์ ํŠธ ์ค‘ ํ•˜๋‚˜๋Š” "Excel ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•œ R ์–ธ์–ด"๋ผ๋Š” ๋น„๋””์˜ค ๊ฐ•์ขŒ์˜€์Šต๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์„ ํ†ตํ•ด ์ €๋Š” R์— ๋Œ€ํ•œ ์ง„์ž… ์žฅ๋ฒฝ์„ ๋‚ฎ์ถ”๊ณ  ์ด ์ฃผ์ œ์— ๋Œ€ํ•œ ๋Ÿฌ์‹œ์•„์–ด ๊ต์œก ์ž๋ฃŒ์˜ ๋ถ€์กฑ์„ ์•ฝ๊ฐ„ ๋ฉ”์šฐ๊ณ  ์‹ถ์—ˆ์Šต๋‹ˆ๋‹ค.

๊ท€ํ•˜๊ฐ€ ์ผํ•˜๋Š” ํšŒ์‚ฌ์˜ ๋ชจ๋“  ๋ฐ์ดํ„ฐ ์ž‘์—…์ด ์—ฌ์ „ํžˆ Excel์—์„œ ์ˆ˜ํ–‰๋œ๋‹ค๋ฉด, ๋ณด๋‹ค ํ˜„๋Œ€์ ์ด๊ณ  ๋™์‹œ์— ์™„์ „ํžˆ ๋ฌด๋ฃŒ์ธ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋„๊ตฌ์— ๋Œ€ํ•ด ์•Œ์•„๋ณด๋Š” ๊ฒƒ์ด ์ข‹์Šต๋‹ˆ๋‹ค.

Excel ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•œ R ์–ธ์–ด(๋ฌด๋ฃŒ ๋™์˜์ƒ ๊ฐ•์ขŒ)

๋‚ด์šฉ

๋ฐ์ดํ„ฐ ๋ถ„์„์— ๊ด€์‹ฌ์ด ์žˆ๋‹ค๋ฉด ์ œ ๊ธ€์—๋„ ๊ด€์‹ฌ์ด ์žˆ์œผ์‹ค ๊ฒ๋‹ˆ๋‹ค. ์ „๋ณด ะธ ์œ ํŠœ๋ธŒ ์ฑ„๋„. ๋Œ€๋ถ€๋ถ„์˜ ์ฝ˜ํ…์ธ ๋Š” R ์–ธ์–ด์— ์ „๋…ํ•ฉ๋‹ˆ๋‹ค.

  1. ์ฐธ์กฐ
  2. ์ฝ”์Šค ์†Œ๊ฐœ
  3. ์ด ๊ฐ•์ขŒ๋Š” ๋ˆ„๊ตฌ๋ฅผ ์œ„ํ•œ ๊ฐ•์ขŒ์ธ๊ฐ€์š”?
  4. ์ฝ”์Šค ํ”„๋กœ๊ทธ๋žจ
    4.1. ํ•™์Šต 1: R ์–ธ์–ด ๋ฐ RStudio ๊ฐœ๋ฐœ ํ™˜๊ฒฝ ์„ค์น˜
    4.2. ์†Œ๋‹จ์› 2: R์˜ ๊ธฐ๋ณธ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ
    4.3. ๊ฐ•์˜ 3: TSV, CSV, Excel ํŒŒ์ผ ๋ฐ Google Sheets์—์„œ ๋ฐ์ดํ„ฐ ์ฝ๊ธฐ
    4.4. ๋ ˆ์Šจ 4: R์—์„œ ํ–‰ ํ•„ํ„ฐ๋ง, ์—ด ์„ ํƒ ๋ฐ ์ด๋ฆ„ ๋ฐ”๊พธ๊ธฐ, ํŒŒ์ดํ”„๋ผ์ธ
    4.5. ์†Œ๋‹จ์› 5: R์˜ ํ…Œ์ด๋ธ”์— ๊ณ„์‚ฐ๋œ ์—ด ์ถ”๊ฐ€
    4.6. ์†Œ๋‹จ์› 6: R์—์„œ ๋ฐ์ดํ„ฐ ๊ทธ๋ฃนํ™” ๋ฐ ์ง‘๊ณ„
    4.7. ์†Œ๋‹จ์› 7: R์—์„œ ํ…Œ์ด๋ธ”์˜ ์ˆ˜์ง ๋ฐ ์ˆ˜ํ‰ ์กฐ์ธ
    4.8. ์†Œ๋‹จ์› 8: R์˜ ์ฐฝ ํ•จ์ˆ˜
    4.9. ๋ ˆ์Šจ 9: R์˜ ํ…Œ์ด๋ธ” ํšŒ์ „ ๋˜๋Š” ํ”ผ๋ฒ— ํ…Œ์ด๋ธ” ์œ ์‚ฌ
    4.10. ์†Œ๋‹จ์› 10: R์—์„œ JSON ํŒŒ์ผ ๋กœ๋“œ ๋ฐ ๋ชฉ๋ก์„ ํ…Œ์ด๋ธ”๋กœ ๋ณ€ํ™˜
    4.11. ์†Œ๋‹จ์› 11: qplot() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋น ๋ฅด๊ฒŒ ํ”Œ๋กœํŒ…
    4.12. ํ•™์Šต 12: ggplot2 ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ ˆ์ด์–ด๋ณ„๋กœ ํ”Œ๋กฏ ๊ทธ๋ฆฌ๊ธฐ
  5. ๊ฒฐ๋ก 

์ฐธ์กฐ

์ฝ”์Šค ์†Œ๊ฐœ

์ด ๊ณผ์ •์€ ๊ฑด์ถ•์„ ์ค‘์‹ฌ์œผ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค. tidyverse, ๊ทธ๋ฆฌ๊ณ  ์—ฌ๊ธฐ์— ํฌํ•จ๋œ ํŒจํ‚ค์ง€: readr, vroom, dplyr, tidyr, ggplot2. ๋ฌผ๋ก  R์—๋Š” ์œ ์‚ฌํ•œ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋‹ค๋ฅธ ์ข‹์€ ํŒจํ‚ค์ง€๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด data.table, ๊ทธ๋Ÿฌ๋‚˜ ๊ตฌ๋ฌธ์€ tidyverse ์ง๊ด€์ ์ด๊ณ , ํ›ˆ๋ จ๋ฐ›์ง€ ์•Š์€ ์‚ฌ์šฉ์ž๋„ ์ฝ๊ธฐ ์‰ฝ๊ธฐ ๋•Œ๋ฌธ์— R ์–ธ์–ด๋ฅผ ๋ฐฐ์šฐ๊ธฐ ์‹œ์ž‘ํ•˜๋Š” ๊ฒƒ์ด ๋” ์ข‹๋‹ค๊ณ  ์ƒ๊ฐํ•ฉ๋‹ˆ๋‹ค. tidyverse.

์ด ๊ณผ์ •์—์„œ๋Š” ๋กœ๋“œ๋ถ€ํ„ฐ ์ตœ์ข… ๊ฒฐ๊ณผ ์‹œ๊ฐํ™”๊นŒ์ง€ ๋ชจ๋“  ๋ฐ์ดํ„ฐ ๋ถ„์„ ์ž‘์—…์„ ์•ˆ๋‚ดํ•ฉ๋‹ˆ๋‹ค.

์™œ Python์ด ์•„๋‹ˆ๊ณ  R์ธ๊ฐ€์š”? R์€ ํ•จ์ˆ˜ํ˜• ์–ธ์–ด์ด๊ธฐ ๋•Œ๋ฌธ์— Excel ์‚ฌ์šฉ์ž๊ฐ€ R๋กœ ์ „ํ™˜ํ•˜๋Š” ๊ฒƒ์ด ๋” ์‰ฝ์Šต๋‹ˆ๋‹ค. ์ „ํ†ต์ ์ธ ๊ฐ์ฒด์ง€ํ–ฅ ํ”„๋กœ๊ทธ๋ž˜๋ฐ์„ ๊นŠ์ด ํŒŒ๊ณ ๋“ค ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค.

ํ˜„์žฌ 12๊ฐœ์˜ ๋น„๋””์˜ค ๊ฐ•์˜๊ฐ€ ๊ณ„ํš๋˜์–ด ์žˆ์œผ๋ฉฐ ๊ฐ๊ฐ 5~20๋ถ„์”ฉ ์ง„ํ–‰๋ฉ๋‹ˆ๋‹ค.

๊ฐ•์ขŒ๋Š” ์ˆœ์ฐจ์ ์œผ๋กœ ์˜คํ”ˆ๋ฉ๋‹ˆ๋‹ค. ๋งค์ฃผ ์›”์š”์ผ๋งˆ๋‹ค ๋‚ด ์›น์‚ฌ์ดํŠธ์—์„œ ์ƒˆ๋กœ์šด ๊ฐ•์˜๋ฅผ ์ ‘ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์œ ํŠœ๋ธŒ ์ฑ„๋„ ๋ณ„๋„์˜ ์žฌ์ƒ๋ชฉ๋ก์— ์žˆ์Šต๋‹ˆ๋‹ค.

์ด ๊ฐ•์ขŒ๋Š” ๋ˆ„๊ตฌ๋ฅผ ์œ„ํ•œ ๊ฐ•์ขŒ์ธ๊ฐ€์š”?

์ œ๋ชฉ์—์„œ ์ด๊ฒƒ์ด ๋ถ„๋ช…ํ•˜๋‹ค๊ณ  ์ƒ๊ฐํ•˜์ง€๋งŒ ๋” ์ž์„ธํžˆ ์„ค๋ช…ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

๋ณธ ๊ณผ์ •์€ Microsoft Excel์„ ์—…๋ฌด์— ์ ๊ทน์ ์œผ๋กœ ์‚ฌ์šฉํ•˜๊ณ  ๋ชจ๋“  ์—…๋ฌด๋ฅผ Excel์—์„œ ๋ฐ์ดํ„ฐ๋กœ ๊ตฌํ˜„ํ•˜๋Š” ์‚ฌ๋žŒ๋“ค์„ ๋Œ€์ƒ์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ์ผ์ฃผ์ผ์— ํ•œ ๋ฒˆ ์ด์ƒ Microsoft Excel ์‘์šฉ ํ”„๋กœ๊ทธ๋žจ์„ ์—ด๋ฉด ํ•ด๋‹น ๊ณผ์ •์ด ๊ท€ํ•˜์—๊ฒŒ ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค.

๊ณผ์ •์„ ์ด์ˆ˜ํ•˜๊ธฐ ์œ„ํ•ด ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๊ธฐ์ˆ ์ด ํ•„์š”ํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์™œ๋ƒํ•˜๋ฉด... ์ด ๊ฐ•์ขŒ๋Š” ์ดˆ๋ณด์ž๋ฅผ ๋Œ€์ƒ์œผ๋กœ ํ•ฉ๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ์•„๋งˆ๋„ 4๊ฐ•๋ถ€ํ„ฐ ํ™œ์„ฑ R ์‚ฌ์šฉ์ž๋ฅผ ์œ„ํ•œ ํฅ๋ฏธ๋กœ์šด ์ž๋ฃŒ๋„ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์™œ๋ƒํ•˜๋ฉด... ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํŒจํ‚ค์ง€์˜ ์ฃผ์š” ๊ธฐ๋Šฅ dplyr ะธ tidyr ์ข€ ๋” ์ž์„ธํžˆ ๋…ผ์˜๋  ๊ฒƒ์ด๋‹ค.

์ฝ”์Šค ํ”„๋กœ๊ทธ๋žจ

ํ•™์Šต 1: R ์–ธ์–ด ๋ฐ RStudio ๊ฐœ๋ฐœ ํ™˜๊ฒฝ ์„ค์น˜

์ถœํŒ ์ผ : ์›” 23 2020

๋งํฌ :

๋น„๋””์˜ค :

์„ค๋ช… :
ํ•„์š”ํ•œ ์†Œํ”„ํŠธ์›จ์–ด๋ฅผ ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜ํ•˜๊ณ  RStudio ๊ฐœ๋ฐœ ํ™˜๊ฒฝ์˜ ๊ธฐ๋Šฅ๊ณผ ์ธํ„ฐํŽ˜์ด์Šค๋ฅผ ๊ฐ„๋žตํ•˜๊ฒŒ ์‚ดํŽด๋ณด๋Š” ์ž…๋ฌธ ๊ฐ•์˜์ž…๋‹ˆ๋‹ค.

์†Œ๋‹จ์› 2: R์˜ ๊ธฐ๋ณธ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ

์ถœํŒ ์ผ : ์›” 30 2020

๋งํฌ :

๋น„๋””์˜ค :

์„ค๋ช… :
์ด ๊ฐ•์˜์—์„œ๋Š” R ์–ธ์–ด์—์„œ ์–ด๋–ค ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋Š”์ง€ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋˜๋ฉฐ ๋ฒกํ„ฐ, ๋‚ ์งœ ํ”„๋ ˆ์ž„ ๋ฐ ๋ชฉ๋ก์— ๋Œ€ํ•ด ์ž์„ธํžˆ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ๊ฐœ๋ณ„ ์š”์†Œ์— ์•ก์„ธ์Šคํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์•Œ์•„ ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๊ฐ•์˜ 3: TSV, CSV, Excel ํŒŒ์ผ ๋ฐ Google Sheets์—์„œ ๋ฐ์ดํ„ฐ ์ฝ๊ธฐ

์ถœํŒ ์ผ : 4์›” 6 2020

๋งํฌ :

๋น„๋””์˜ค :

์„ค๋ช… :
๋„๊ตฌ์— ๊ด€๊ณ„์—†์ด ๋ฐ์ดํ„ฐ ์ž‘์—…์€ ์ถ”์ถœ๋ถ€ํ„ฐ ์‹œ์ž‘๋ฉ๋‹ˆ๋‹ค. ํŒจํ‚ค์ง€๋Š” ์ˆ˜์—… ์ค‘์— ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค. vroom, readxl, googlesheets4 csv, tsv, Excel ํŒŒ์ผ ๋ฐ Google Sheets์—์„œ R ํ™˜๊ฒฝ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋กœ๋“œํ•ฉ๋‹ˆ๋‹ค.

๋ ˆ์Šจ 4: R์—์„œ ํ–‰ ํ•„ํ„ฐ๋ง, ์—ด ์„ ํƒ ๋ฐ ์ด๋ฆ„ ๋ฐ”๊พธ๊ธฐ, ํŒŒ์ดํ”„๋ผ์ธ

์ถœํŒ ์ผ : 4์›” 13 2020

๋งํฌ :

๋น„๋””์˜ค :

์„ค๋ช… :
์ด๋ฒˆ ๊ฐ•์˜๋Š” ํŒจํ‚ค์ง€์— ๊ด€ํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. dplyr. ์—ฌ๊ธฐ์„œ๋Š” ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์„ ํ•„ํ„ฐ๋งํ•˜๊ณ  ํ•„์š”ํ•œ ์—ด์„ ์„ ํƒํ•˜๊ณ  ์ด๋ฆ„์„ ๋ฐ”๊พธ๋Š” ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋ด…๋‹ˆ๋‹ค.

๋˜ํ•œ ํŒŒ์ดํ”„๋ผ์ธ์ด ๋ฌด์—‡์ธ์ง€, ํŒŒ์ดํ”„๋ผ์ธ์ด R ์ฝ”๋“œ๋ฅผ ๋” ์ฝ๊ธฐ ์‰ฝ๊ฒŒ ๋งŒ๋“œ๋Š” ๋ฐ ์–ด๋–ป๊ฒŒ ๋„์›€์ด ๋˜๋Š”์ง€ ์•Œ์•„๋ณผ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์†Œ๋‹จ์› 5: R์˜ ํ…Œ์ด๋ธ”์— ๊ณ„์‚ฐ๋œ ์—ด ์ถ”๊ฐ€

์ถœํŒ ์ผ : 4์›” 20 2020

๋งํฌ :

๋น„๋””์˜ค :

์„ค๋ช… :
์ด ๋น„๋””์˜ค์—์„œ ์šฐ๋ฆฌ๋Š” ๋„์„œ๊ด€์— ๋Œ€ํ•œ ์นœ๋ถ„์„ ์ด์–ด๊ฐ‘๋‹ˆ๋‹ค. tidyverse ๊ทธ๋ฆฌ๊ณ  ํŒจํ‚ค์ง€ dplyr.
ํ•จ์ˆ˜๊ตฐ์„ ์‚ดํŽด๋ณด์ž mutate(), ์ด๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ…Œ์ด๋ธ”์— ์ƒˆ๋กœ์šด ๊ณ„์‚ฐ๋œ ์—ด์„ ์ถ”๊ฐ€ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋ด…๋‹ˆ๋‹ค.

์†Œ๋‹จ์› 6: R์—์„œ ๋ฐ์ดํ„ฐ ๊ทธ๋ฃนํ™” ๋ฐ ์ง‘๊ณ„

์ถœํŒ ์ผ : 4์›” 27 2020

๋งํฌ :

๋น„๋””์˜ค :

์„ค๋ช… :
์ด ๊ฐ•์˜์—์„œ๋Š” ๋ฐ์ดํ„ฐ ๋ถ„์„, ๊ทธ๋ฃนํ™” ๋ฐ ์ง‘๊ณ„์˜ ์ฃผ์š” ์ž‘์—… ์ค‘ ํ•˜๋‚˜๋ฅผ ๋‹ค๋ฃน๋‹ˆ๋‹ค. ์ˆ˜์—… ์ค‘์— ์šฐ๋ฆฌ๋Š” ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค dplyr ๋ฐ ๊ธฐ๋Šฅ group_by() ะธ summarise().

์šฐ๋ฆฌ๋Š” ์ „์ฒด ๊ธฐ๋Šฅ๊ตฐ์„ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. summarise()์ฆ‰, summarise(), summarise_if() ะธ summarise_at().

์†Œ๋‹จ์› 7: R์—์„œ ํ…Œ์ด๋ธ”์˜ ์ˆ˜์ง ๋ฐ ์ˆ˜ํ‰ ์กฐ์ธ

์ถœํŒ ์ผ : ์›” 4 2020

๋งํฌ :

๋น„๋””์˜ค :

์„ค๋ช… :
์ด ๋‹จ์›์—์„œ๋Š” ํ…Œ์ด๋ธ”์˜ ์ˆ˜์ง ๋ฐ ์ˆ˜ํ‰ ๊ฒฐํ•ฉ ์ž‘์—…์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

์ˆ˜์ง Union์€ SQL ์ฟผ๋ฆฌ ์–ธ์–ด์˜ UNION ์—ฐ์‚ฐ๊ณผ ๋™์ผํ•ฉ๋‹ˆ๋‹ค.

์ˆ˜ํ‰ ์กฐ์ธ์€ VLOOKUP ํ•จ์ˆ˜ ๋•๋ถ„์— Excel ์‚ฌ์šฉ์ž์—๊ฒŒ ๋” ์ž˜ ์•Œ๋ ค์ ธ ์žˆ์œผ๋ฉฐ, SQL์—์„œ๋Š” ์ด๋Ÿฌํ•œ ์ž‘์—…์ด JOIN ์—ฐ์‚ฐ์ž์— ์˜ํ•ด ์ˆ˜ํ–‰๋ฉ๋‹ˆ๋‹ค.

์ˆ˜์—… ์ค‘์— ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ์‹ค์ œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•ฉ๋‹ˆ๋‹ค. dplyr, readxl, tidyr ะธ stringr.

์šฐ๋ฆฌ๊ฐ€ ๊ณ ๋ คํ•  ์ฃผ์š” ๊ธฐ๋Šฅ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  • bind_rows() - ํ…Œ์ด๋ธ”์˜ ์ˆ˜์ง ์กฐ์ธ
  • left_join() โ€” ํ…Œ์ด๋ธ”์˜ ์ˆ˜ํ‰ ์กฐ์ธ
  • semi_join() - ํ…Œ์ด๋ธ” ์กฐ์ธ ํฌํ•จ
  • anti_join() - ๋‹จ๋… ํ…Œ์ด๋ธ” ์กฐ์ธ

์†Œ๋‹จ์› 8: R์˜ ์ฐฝ ํ•จ์ˆ˜

์ถœํŒ ์ผ : ์›” 11 2020

๋งํฌ :

์„ค๋ช… :
์ฐฝ ํ•จ์ˆ˜๋Š” ์ง‘๊ณ„ ํ•จ์ˆ˜์™€ ์˜๋ฏธ๊ฐ€ ์œ ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ๊ฐ’ ๋ฐฐ์—ด์„ ์ž…๋ ฅ์œผ๋กœ ๊ฐ€์ ธ์™€ ์‚ฐ์ˆ  ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜์ง€๋งŒ ์ถœ๋ ฅ ๊ฒฐ๊ณผ์˜ ํ–‰ ์ˆ˜๋ฅผ ๋ณ€๊ฒฝํ•˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

์ด ํŠœํ† ๋ฆฌ์–ผ์—์„œ๋Š” ํŒจํ‚ค์ง€์— ๋Œ€ํ•ด ๊ณ„์† ์—ฐ๊ตฌํ•ฉ๋‹ˆ๋‹ค. dplyr๋ฐ ๊ธฐ๋Šฅ group_by(), mutate(), ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ƒˆ๋กœ์šด cumsum(), lag(), lead() ะธ arrange().

๋ ˆ์Šจ 9: R์˜ ํ…Œ์ด๋ธ” ํšŒ์ „ ๋˜๋Š” ํ”ผ๋ฒ— ํ…Œ์ด๋ธ” ์œ ์‚ฌ

์ถœํŒ ์ผ : ์›” 18 2020

๋งํฌ :

์„ค๋ช… :
๋Œ€๋ถ€๋ถ„์˜ Excel ์‚ฌ์šฉ์ž๋Š” ํ”ผ๋ฒ— ํ…Œ์ด๋ธ”์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์›์‹œ ๋ฐ์ดํ„ฐ ๋ฐฐ์—ด์„ ๋ช‡ ์ดˆ ๋งŒ์— ์ฝ์„ ์ˆ˜ ์žˆ๋Š” ๋ณด๊ณ ์„œ๋กœ ๋ณ€ํ™˜ํ•  ์ˆ˜ ์žˆ๋Š” ํŽธ๋ฆฌํ•œ ๋„๊ตฌ์ž…๋‹ˆ๋‹ค.

์ด ํŠœํ† ๋ฆฌ์–ผ์—์„œ๋Š” R์—์„œ ํ…Œ์ด๋ธ”์„ ํšŒ์ „ํ•˜๋Š” ๋ฐฉ๋ฒ•๊ณผ ๋„“์€ ํ˜•์‹์—์„œ ๊ธด ํ˜•์‹์œผ๋กœ ๋˜๋Š” ๊ทธ ๋ฐ˜๋Œ€๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๋Œ€๋ถ€๋ถ„์˜ ์ˆ˜์—…์€ ํŒจํ‚ค์ง€์— ์ „๋…ํ•ฉ๋‹ˆ๋‹ค. tidyr ๋ฐ ๊ธฐ๋Šฅ pivot_longer() ะธ pivot_wider().

์†Œ๋‹จ์› 10: R์—์„œ JSON ํŒŒ์ผ ๋กœ๋“œ ๋ฐ ๋ชฉ๋ก์„ ํ…Œ์ด๋ธ”๋กœ ๋ณ€ํ™˜

์ถœํŒ ์ผ : ์›” 25 2020

๋งํฌ :

์„ค๋ช… :
JSON๊ณผ XML์€ ์ผ๋ฐ˜์ ์œผ๋กœ ์••์ถ•์„ฑ์œผ๋กœ ์ธํ•ด ์ •๋ณด๋ฅผ ์ €์žฅํ•˜๊ณ  ๊ตํ™˜ํ•˜๋Š” ๋ฐ ๋งค์šฐ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ํ˜•์‹์ž…๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ์ด๋Ÿฌํ•œ ํ˜•์‹์œผ๋กœ ์ œ์‹œ๋œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„์„ํ•˜๋Š” ๊ฒƒ์€ ์–ด๋ ต๊ธฐ ๋•Œ๋ฌธ์— ๋ถ„์„ํ•˜๊ธฐ ์ „์— ์ด๋ฅผ ํ‘œ ํ˜•์‹์œผ๋กœ ๊ฐ€์ ธ์™€์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ด๊ฒƒ์ด ๋ฐ”๋กœ ์šฐ๋ฆฌ๊ฐ€ ์ด ๋น„๋””์˜ค์—์„œ ๋ฐฐ์šธ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.

์ˆ˜์—…์€ ํŒจํ‚ค์ง€ ์ „์šฉ์ž…๋‹ˆ๋‹ค. tidyr, ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์˜ ํ•ต์‹ฌ์— ํฌํ•จ๋จ tidyverse๋ฐ ๊ธฐ๋Šฅ unnest_longer(), unnest_wider() ะธ hoist().

์†Œ๋‹จ์› 11: qplot() ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋น ๋ฅด๊ฒŒ ํ”Œ๋กœํŒ…

์ถœํŒ ์ผ : 6์›” 1 2020

๋งํฌ :

์„ค๋ช… :
ํŒจํ‚ค์ง€ ggplot2 R๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ๊ฐ€์žฅ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ๋ฐ์ดํ„ฐ ์‹œ๊ฐํ™” ๋„๊ตฌ ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค.

์ด๋ฒˆ ๊ฐ•์˜์—์„œ๋Š” ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ„๋‹จํ•œ ๊ทธ๋ž˜ํ”„๋ฅผ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•์„ ๋ฐฐ์›๋‹ˆ๋‹ค. qplot(), ๊ทธ๋…€์˜ ๋ชจ๋“  ์ฃผ์žฅ์„ ๋ถ„์„ํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต 12: ggplot2 ํŒจํ‚ค์ง€๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ ˆ์ด์–ด๋ณ„๋กœ ํ”Œ๋กฏ ๊ทธ๋ฆฌ๊ธฐ

์ถœํŒ ์ผ : 6์›” 8 2020

๋งํฌ :

์„ค๋ช… :
์ด ๊ฐ•์˜์—์„œ๋Š” ํŒจํ‚ค์ง€์˜ ๋ชจ๋“  ๊ธฐ๋Šฅ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค. ggplot2 ๊ทธ๋ฆฌ๊ณ  ๊ทธ ์•ˆ์— ํฌํ•จ๋œ ๋ ˆ์ด์–ด์— ๊ทธ๋ž˜ํ”„๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๋ฌธ๋ฒ•.

ํŒจํ‚ค์ง€์— ์กด์žฌํ•˜๋Š” ์ฃผ์š” ์ง€์˜ค๋ฉ”ํŠธ๋ฆฌ๋ฅผ ๋ถ„์„ํ•˜๊ณ  ๋ ˆ์ด์–ด๋ฅผ ์ ์šฉํ•˜์—ฌ ๊ทธ๋ž˜ํ”„๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์•Œ์•„๋ด…๋‹ˆ๋‹ค.

๊ฒฐ๋ก 

์ €๋Š” R ์–ธ์–ด์™€ ๊ฐ™์€ ๊ฐ•๋ ฅํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋„๊ตฌ๋ฅผ ํ•™์Šตํ•˜๋Š” ์ฒซ ๋‹จ๊ณ„๋ฅผ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐ ํ•„์š”ํ•œ ๊ฐ€์žฅ ํ•„์š”ํ•œ ์ •๋ณด๋งŒ ๊ฐ•์กฐํ•˜๊ธฐ ์œ„ํ•ด ์ฝ”์Šค ํ”„๋กœ๊ทธ๋žจ ๊ตฌ์„ฑ์— ์ตœ๋Œ€ํ•œ ๊ฐ„๊ฒฐํ•˜๊ฒŒ ์ ‘๊ทผํ•˜๋ ค๊ณ  ๋…ธ๋ ฅํ–ˆ์Šต๋‹ˆ๋‹ค.

์ด ๊ณผ์ •์€ R ์–ธ์–ด๋ฅผ ์‚ฌ์šฉํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„์— ๋Œ€ํ•œ ์ฒ ์ €ํ•œ ๊ฐ€์ด๋“œ๋Š” ์•„๋‹ˆ์ง€๋งŒ ์ด์— ํ•„์š”ํ•œ ๋ชจ๋“  ๊ธฐ์ˆ ์„ ์ดํ•ดํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ฝ”์Šค ํ”„๋กœ๊ทธ๋žจ์€ 12์ฃผ ๋™์•ˆ ์„ค๊ณ„๋˜์—ˆ์ง€๋งŒ ๋งค์ฃผ ์›”์š”์ผ๋งˆ๋‹ค ์ƒˆ๋กœ์šด ๋ ˆ์Šจ์„ ๋ฐ›์„ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค. ๊ตฌ๋…ํ•˜๋‹ค ์ƒˆ๋กœ์šด ๊ฐ•์˜ ๊ฒŒ์‹œ๋ฅผ ๋†“์น˜์ง€ ์•Š๋„๋ก YouTube ์ฑ„๋„์— ๊ฒŒ์‹œํ•˜์„ธ์š”.

์ถœ์ฒ˜ : habr.com

์ฝ”๋ฉ˜ํŠธ๋ฅผ ์ถ”๊ฐ€