Linguagem R para usuários do Excel (curso em vídeo gratuito)

Devido à quarentena, muitos passam agora a maior parte do tempo em casa, e este tempo pode, e até deve, ser gasto de forma útil.

No início da quarentena resolvi finalizar alguns projetos que comecei há alguns meses. Um desses projetos foi o videocurso “Linguagem R para usuários de Excel”. Com este curso, eu queria diminuir a barreira de entrada no R e preencher um pouco a escassez existente de materiais de treinamento sobre esse assunto em russo.

Se todo o trabalho com dados na empresa em que você trabalha ainda é feito em Excel, então sugiro que você conheça uma ferramenta de análise de dados mais moderna e ao mesmo tempo totalmente gratuita.

Linguagem R para usuários do Excel (curso em vídeo gratuito)

Conteúdo

Se você estiver interessado em análise de dados, talvez esteja interessado em meu telegrama и Youtube canais. A maior parte do conteúdo é dedicada à linguagem R.

  1. referências
  2. Sobre o curso
  3. Para quem é este curso?
  4. Programa do curso
    4.1. Lição 1: Instalando a linguagem R e o ambiente de desenvolvimento RStudio
    4.2. Lição 2: Estruturas de dados básicas em R
    4.3. Lição 3: Lendo dados de arquivos TSV, CSV, Excel e Planilhas Google
    4.4. Lição 4: Filtrando linhas, selecionando e renomeando colunas, pipelines em R
    4.5. Lição 5: Adicionando Colunas Calculadas a uma Tabela em R
    4.6. Lição 6: Agrupando e agregando dados em R
    4.7. Lição 7: União Vertical e Horizontal de Tabelas em R
    4.8. Lição 8: Funções de janela em R
    4.9. Lição 9: Tabelas rotativas ou um análogo de tabelas dinâmicas em R
    4.10. Lição 10: Carregando arquivos JSON em R e convertendo listas em tabelas
    4.11. Lição 11: Plotando rapidamente usando a função qplot()
    4.12. Lição 12: Plotando plotagens camada por camada usando o pacote ggplot2
  5. Conclusão

referências

Sobre o curso

O curso está estruturado em torno da arquitetura tidyverse, e os pacotes incluídos nele: readr, vroom, dplyr, tidyr, ggplot2. Claro, existem outros bons pacotes em R que realizam operações semelhantes, por exemplo data.table, mas a sintaxe tidyverse intuitivo, fácil de ler mesmo para um usuário não treinado, então acho melhor começar a aprender a linguagem R com tidyverse.

O curso irá guiá-lo por todas as operações de análise de dados, desde o carregamento até a visualização do resultado final.

Por que R e não Python? Como R é uma linguagem funcional, é mais fácil para os usuários do Excel migrarem para ela, porque não há necessidade de se aprofundar na programação orientada a objetos tradicional.

No momento estão previstas 12 videoaulas, com duração de 5 a 20 minutos cada.

As aulas serão abertas gradualmente. Toda segunda-feira abrirei acesso a uma nova aula em meu site. Canal do Youtube em uma lista de reprodução separada.

Para quem é este curso?

Acho que isso fica claro no título, no entanto, irei descrevê-lo com mais detalhes.

O curso é voltado para quem usa ativamente o Microsoft Excel em seu trabalho e ali implementa todo o seu trabalho com dados. Em geral, se você abrir o aplicativo Microsoft Excel pelo menos uma vez por semana, o curso será adequado para você.

Não é necessário ter conhecimentos de programação para concluir o curso, porque... O curso é voltado para iniciantes.

Mas, talvez, a partir da lição 4, haja material interessante para usuários ativos do R também, porque... a principal funcionalidade de pacotes como dplyr и tidyr será discutido com algum detalhe.

Programa do curso

Lição 1: Instalando a linguagem R e o ambiente de desenvolvimento RStudio

Data de publicação: Março 23 2020

Links:

Vídeo:

Descrição:
Uma lição introdutória durante a qual baixaremos e instalaremos o software necessário e examinaremos brevemente os recursos e a interface do ambiente de desenvolvimento RStudio.

Lição 2: Estruturas de dados básicas em R

Data de publicação: Março 30 2020

Links:

Vídeo:

Descrição:
Esta lição o ajudará a entender quais estruturas de dados estão disponíveis na linguagem R. Veremos em detalhes vetores, dataframes e listas. Vamos aprender como criá-los e acessar seus elementos individuais.

Lição 3: Lendo dados de arquivos TSV, CSV, Excel e Planilhas Google

Data de publicação: Abril 6 2020

Links:

Vídeo:

Descrição:
Trabalhar com dados, independente da ferramenta, começa com sua extração. Os pacotes são usados ​​durante a aula vroom, readxl, googlesheets4 para carregar dados no ambiente R a partir de arquivos csv, tsv, Excel e Planilhas Google.

Lição 4: Filtrando linhas, selecionando e renomeando colunas, pipelines em R

Data de publicação: Abril 13 2020

Links:

Vídeo:

Descrição:
Esta lição é sobre o pacote dplyr. Nele descobriremos como filtrar dataframes, selecionar as colunas necessárias e renomeá-las.

Também aprenderemos o que são pipelines e como eles ajudam a tornar seu código R mais legível.

Lição 5: Adicionando Colunas Calculadas a uma Tabela em R

Data de publicação: Abril 20 2020

Links:

Vídeo:

Descrição:
Neste vídeo continuamos nosso conhecimento da biblioteca tidyverse e pacote dplyr.
Vejamos a família de funções mutate(), e aprenderemos como usá-los para adicionar novas colunas calculadas à tabela.

Lição 6: Agrupando e agregando dados em R

Data de publicação: Abril 27 2020

Links:

Vídeo:

Descrição:
Esta lição é dedicada a uma das principais operações de análise, agrupamento e agregação de dados. Durante a aula usaremos o pacote dplyr e características group_by() и summarise().

Veremos toda a família de funções summarise()Ie summarise(), summarise_if() и summarise_at().

Lição 7: União Vertical e Horizontal de Tabelas em R

Data de publicação: Maio 4 2020

Links:

Vídeo:

Descrição:
Esta lição o ajudará a compreender as operações de união vertical e horizontal de tabelas.

Uma união vertical é equivalente à operação UNION na linguagem de consulta SQL.

A junção horizontal é mais conhecida pelos usuários do Excel graças à função VLOOKUP; no SQL, tais operações são realizadas pelo operador JOIN.

Durante a aula resolveremos um problema prático durante o qual usaremos pacotes dplyr, readxl, tidyr и stringr.

As principais funções que consideraremos:

  • bind_rows() - junção vertical de tabelas
  • left_join() — junção horizontal de tabelas
  • semi_join() - incluindo juntar tabelas
  • anti_join() - junção de mesa exclusiva

Lição 8: Funções de janela em R

Data de publicação: Maio 11 2020

Links:

Descrição:
As funções de janela têm significado semelhante às de agregação; elas também pegam uma matriz de valores como entrada e realizam operações aritméticas sobre eles, mas não alteram o número de linhas no resultado de saída.

Neste tutorial continuamos a estudar o pacote dplyre funções group_by(), mutate(), bem como novos cumsum(), lag(), lead() и arrange().

Lição 9: Tabelas rotativas ou um análogo de tabelas dinâmicas em R

Data de publicação: Maio 18 2020

Links:

Descrição:
A maioria dos usuários do Excel usa tabelas dinâmicas; esta é uma ferramenta conveniente com a qual você pode transformar uma matriz de dados brutos em relatórios legíveis em questão de segundos.

Neste tutorial, veremos como girar tabelas em R e convertê-las do formato largo para o formato longo e vice-versa.

A maior parte da lição é dedicada ao pacote tidyr e funções pivot_longer() и pivot_wider().

Lição 10: Carregando arquivos JSON em R e convertendo listas em tabelas

Data de publicação: Maio 25 2020

Links:

Descrição:
JSON e XML são formatos extremamente populares para armazenamento e troca de informações, geralmente devido à sua compactação.

Mas é difícil analisar dados apresentados nesses formatos, por isso antes da análise é necessário trazê-los para uma forma tabular, que é exatamente o que aprenderemos neste vídeo.

A lição é dedicada ao pacote tidyr, incluído no núcleo da biblioteca tidyversee funções unnest_longer(), unnest_wider() и hoist().

Lição 11: Plotando rapidamente usando a função qplot()

Data de publicação: 1 2020 junho

Links:

Descrição:
Pacote ggplot2 é uma das ferramentas de visualização de dados mais populares, não apenas em R.

Nesta lição aprenderemos como construir gráficos simples usando a função qplot(), e vamos analisar todos os seus argumentos.

Lição 12: Plotando plotagens camada por camada usando o pacote ggplot2

Data de publicação: 8 2020 junho

Links:

Descrição:
A lição demonstra todo o poder do pacote ggplot2 e a gramática de construção de gráficos em camadas embutidas nele.

Analisaremos as principais geometrias presentes no pacote e aprenderemos como aplicar camadas para construir um gráfico.

Conclusão

Procurei abordar a formação do programa do curso da forma mais concisa possível, destacando apenas as informações mais necessárias para dar os primeiros passos no aprendizado de uma ferramenta de análise de dados tão poderosa como a linguagem R.

O curso não é um guia completo para análise de dados utilizando a linguagem R, mas irá ajudá-lo a entender todas as técnicas necessárias para isso.

Embora o programa do curso tenha duração de 12 semanas, todas as semanas, às segundas-feiras, abrirei acesso a novas aulas, por isso recomendo Subscrever no canal do YouTube para não perder a publicação de uma nova aula.

Fonte: habr.com

Adicionar um comentário