Napravite animirane histograme koristeći R

Napravite animirane histograme koristeći R

Animirani stupčasti dijagrami koji se mogu ugraditi izravno u post na bilo kojoj web stranici postaju sve popularniji. Oni prikazuju dinamiku promjena bilo koje karakteristike tijekom određenog vremena i to čine jasno. Pogledajmo kako ih stvoriti pomoću R-a i generičkih paketa.

Skillbox preporučuje: Praktični tečaj "Python programer od nule".

Podsjećamo: za sve čitatelje "Habra" - popust od 10 000 rubalja pri upisu na bilo koji tečaj Skillbox koristeći promotivni kod "Habr".

Paketi

Trebamo pakete u R:

Ovo dvoje je izuzetno potrebno. Osim toga, bit će potrebni tidyverse, domar i vaga za upravljanje podacima, čišćenje niza i formatiranje u skladu s tim.

Podaci

Izvorni skup podataka koji ćemo koristiti u ovom projektu preuzet je s web stranice Svjetske banke. Evo ih - Podaci Svjetske banke. Iste podatke, ako vam trebaju gotovi, možete preuzeti sa projektne mape.

Kakva je ovo informacija? Uzorak sadrži vrijednost BDP-a većine zemalja za nekoliko godina (od 2000. do 2017.).

Obrada podataka

Za pripremu potrebnog formata podataka koristit ćemo kod objavljen u nastavku. Brišemo nazive stupaca, pretvaramo brojeve u brojčani format i pretvaramo podatke pomoću funkcije gather(). Sve primljeno spremamo u gdp_tidy.csv za daljnju upotrebu.

library(tidyverse)
library(janitor)

gdp <- read_csv("./data/GDP_Data.csv")

#select required columns

gdp <- gdp %>% select(3:15)

#filter only country rows

gdp <- gdp[1:217,]

gdp_tidy <- gdp %>%
mutate_at(vars(contains("YR")),as.numeric) %>%
gather(year,value,3:13) %>%
janitor::clean_names() %>%
mutate(year = as.numeric(stringr::str_sub(year,1,4)))

write_csv(gdp_tidy,"./data/gdp_tidy.csv")

Animirani histogrami

Njihovo stvaranje zahtijeva dvije faze:

  • Iscrtavanje kompletnog skupa stvarnih histograma pomoću ggplot2.
  • Animirajte statične histograme sa željenim parametrima koristeći gganimate.

Posljednji korak je renderiranje animacije u željenom formatu, uključujući GIF ili MP4.

Učitavanje knjižnica

  • knjižnica (tidyverse)
  • knjižnica (gganimate)

Upravljanje podatcima

U ovom koraku trebate filtrirati podatke kako biste dobili prvih 10 zemalja za svaku godinu. Dodajmo nekoliko stupaca koji će nam omogućiti prikaz legende za histogram.

gdp_tidy <- read_csv("./data/gdp_tidy.csv")

gdp_formatted <- gdp_tidy %>%
group_by(year) %>%
# The * 1 makes it possible to have non-integer ranks while sliding
mutate(rank = rank(-value),
Value_rel = value/value[rank==1],
Value_lbl = paste0(" ",round(value/1e9))) %>%
group_by(country_name) %>%
filter(rank <=10) %>%
ungroup()

Izrada statičkih histograma

Sada kada imamo paket podataka u potrebnom formatu, počinjemo crtati statičke histograme. Osnovne informacije - top 10 zemalja s najvećim BDP-om za odabrani vremenski interval. Izrađujemo grafikone za svaku godinu.

staticplot = ggplot(gdp_formatted, aes(rank, group = country_name,
fill = as.factor(country_name), color = as.factor(country_name))) +
geom_tile(aes(y = value/2,
height = value,
width = 0.9), alpha = 0.8, color = NA) +
geom_text(aes(y = 0, label = paste(country_name, " ")), vjust = 0.2, hjust = 1) +
geom_text(aes(y=value,label = Value_lbl, hjust=0)) +
coord_flip(clip = "off", expand = FALSE) +
scale_y_continuous(labels = scales::comma) +
scale_x_reverse() +
guides(color = FALSE, fill = FALSE) +
theme(axis.line=element_blank(),
axis.text.x=element_blank(),
axis.text.y=element_blank(),
axis.ticks=element_blank(),
axis.title.x=element_blank(),
axis.title.y=element_blank(),
legend.position="none",
panel.background=element_blank(),
panel.border=element_blank(),
panel.grid.major=element_blank(),
panel.grid.minor=element_blank(),
panel.grid.major.x = element_line( size=.1, color="grey" ),
panel.grid.minor.x = element_line( size=.1, color="grey" ),
plot.title=element_text(size=25, hjust=0.5, face="bold", colour="grey", vjust=-1),
plot.subtitle=element_text(size=18, hjust=0.5, face="italic", color="grey"),
plot.caption =element_text(size=8, hjust=0.5, face="italic", color="grey"),
plot.background=element_blank(),
plot.margin = margin(2,2, 2, 4, "cm"))

Stvaranje dijagrama pomoću ggplot2 vrlo je jednostavno. Kao što možete vidjeti u gornjem dijelu koda, postoji nekoliko ključnih točaka s funkcijom theme(). Oni su neophodni kako bi svi elementi oživjeli bez problema. Neki od njih možda neće biti prikazani ako je potrebno. Primjer: Iscrtane su samo okomite rešetke i legende, ali su naslovi osi i nekoliko drugih komponenti uklonjeni iz područja.

animacija

Ključna funkcija ovdje je conversion_states(), spaja zasebne statičke grafikone. view_follow() se koristi za crtanje linija mreže.

anim = staticplot + transition_states(year, transition_length = 4, state_length = 1) +
view_follow(fixed_x = TRUE) +
labs(title = 'GDP per Year : {closest_state}',
subtitle = "Top 10 Countries",
caption = "GDP in Billions USD | Data Source: World Bank Data")

Prikazivanje

Nakon što je animacija stvorena i pohranjena u anim objektu, vrijeme je da je renderirate pomoću funkcije animate(). Renderer koji se koristi u animate() može biti različit ovisno o vrsti potrebne izlazne datoteke.

GIF

# For GIF

animate(anim, 200, fps = 20, width = 1200, height = 1000,
renderer = gifski_renderer("gganim.gif"))

MP4

# For MP4

animate(anim, 200, fps = 20, width = 1200, height = 1000,
renderer = ffmpeg_renderer()) -> for_mp4

anim_save("animation.mp4", animation = for_mp4 )

Rezultirati

Napravite animirane histograme koristeći R

Kao što vidite, ništa komplicirano. Cijeli projekt dostupan je u moj GitHub, možete ga koristiti kako vam odgovara.

Skillbox preporučuje:

Izvor: www.habr.com

Dodajte komentar