Linguagem R para usuários do Excel (curso em vídeo gratuito)
Devido à quarentena, muitos passam agora a maior parte do tempo em casa, e este tempo pode, e até deve, ser gasto de forma útil.
No início da quarentena resolvi finalizar alguns projetos que comecei há alguns meses. Um desses projetos foi o videocurso “Linguagem R para usuários de Excel”. Com este curso, eu queria diminuir a barreira de entrada no R e preencher um pouco a escassez existente de materiais de treinamento sobre esse assunto em russo.
Se todo o trabalho com dados na empresa em que você trabalha ainda é feito em Excel, então sugiro que você conheça uma ferramenta de análise de dados mais moderna e ao mesmo tempo totalmente gratuita.
Conteúdo
Se você estiver interessado em análise de dados, talvez esteja interessado em meu telegrama и Youtube canais. A maior parte do conteúdo é dedicada à linguagem R.
O curso está estruturado em torno da arquitetura tidyverse, e os pacotes incluídos nele: readr, vroom, dplyr, tidyr, ggplot2. Claro, existem outros bons pacotes em R que realizam operações semelhantes, por exemplo data.table, mas a sintaxe tidyverse intuitivo, fácil de ler mesmo para um usuário não treinado, então acho melhor começar a aprender a linguagem R com tidyverse.
O curso irá guiá-lo por todas as operações de análise de dados, desde o carregamento até a visualização do resultado final.
Por que R e não Python? Como R é uma linguagem funcional, é mais fácil para os usuários do Excel migrarem para ela, porque não há necessidade de se aprofundar na programação orientada a objetos tradicional.
No momento estão previstas 12 videoaulas, com duração de 5 a 20 minutos cada.
As aulas serão abertas gradualmente. Toda segunda-feira abrirei acesso a uma nova aula em meu site. Canal do Youtube em uma lista de reprodução separada.
Para quem é este curso?
Acho que isso fica claro no título, no entanto, irei descrevê-lo com mais detalhes.
O curso é voltado para quem usa ativamente o Microsoft Excel em seu trabalho e ali implementa todo o seu trabalho com dados. Em geral, se você abrir o aplicativo Microsoft Excel pelo menos uma vez por semana, o curso será adequado para você.
Não é necessário ter conhecimentos de programação para concluir o curso, porque... O curso é voltado para iniciantes.
Mas, talvez, a partir da lição 4, haja material interessante para usuários ativos do R também, porque... a principal funcionalidade de pacotes como dplyr и tidyr será discutido com algum detalhe.
Programa do curso
Lição 1: Instalando a linguagem R e o ambiente de desenvolvimento RStudio
Descrição:
Uma lição introdutória durante a qual baixaremos e instalaremos o software necessário e examinaremos brevemente os recursos e a interface do ambiente de desenvolvimento RStudio.
Descrição:
Esta lição o ajudará a entender quais estruturas de dados estão disponíveis na linguagem R. Veremos em detalhes vetores, dataframes e listas. Vamos aprender como criá-los e acessar seus elementos individuais.
Lição 3: Lendo dados de arquivos TSV, CSV, Excel e Planilhas Google
Descrição:
Trabalhar com dados, independente da ferramenta, começa com sua extração. Os pacotes são usados durante a aula vroom, readxl, googlesheets4 para carregar dados no ambiente R a partir de arquivos csv, tsv, Excel e Planilhas Google.
Lição 4: Filtrando linhas, selecionando e renomeando colunas, pipelines em R
Descrição:
Neste vídeo continuamos nosso conhecimento da biblioteca tidyverse e pacote dplyr.
Vejamos a família de funções mutate(), e aprenderemos como usá-los para adicionar novas colunas calculadas à tabela.
Descrição:
Esta lição é dedicada a uma das principais operações de análise, agrupamento e agregação de dados. Durante a aula usaremos o pacote dplyr e características group_by() и summarise().
Veremos toda a família de funções summarise()Ie summarise(), summarise_if() и summarise_at().
Lição 7: União Vertical e Horizontal de Tabelas em R
Descrição:
As funções de janela têm significado semelhante às de agregação; elas também pegam uma matriz de valores como entrada e realizam operações aritméticas sobre eles, mas não alteram o número de linhas no resultado de saída.
Neste tutorial continuamos a estudar o pacote dplyre funções group_by(), mutate(), bem como novos cumsum(), lag(), lead() и arrange().
Lição 9: Tabelas rotativas ou um análogo de tabelas dinâmicas em R
Descrição:
A maioria dos usuários do Excel usa tabelas dinâmicas; esta é uma ferramenta conveniente com a qual você pode transformar uma matriz de dados brutos em relatórios legíveis em questão de segundos.
Neste tutorial, veremos como girar tabelas em R e convertê-las do formato largo para o formato longo e vice-versa.
A maior parte da lição é dedicada ao pacote tidyr e funções pivot_longer() и pivot_wider().
Lição 10: Carregando arquivos JSON em R e convertendo listas em tabelas
Descrição:
JSON e XML são formatos extremamente populares para armazenamento e troca de informações, geralmente devido à sua compactação.
Mas é difícil analisar dados apresentados nesses formatos, por isso antes da análise é necessário trazê-los para uma forma tabular, que é exatamente o que aprenderemos neste vídeo.
A lição é dedicada ao pacote tidyr, incluído no núcleo da biblioteca tidyversee funções unnest_longer(), unnest_wider() и hoist().
Lição 11: Plotando rapidamente usando a função qplot()
Descrição:
A lição demonstra todo o poder do pacote ggplot2 e a gramática de construção de gráficos em camadas embutidas nele.
Analisaremos as principais geometrias presentes no pacote e aprenderemos como aplicar camadas para construir um gráfico.
Conclusão
Procurei abordar a formação do programa do curso da forma mais concisa possível, destacando apenas as informações mais necessárias para dar os primeiros passos no aprendizado de uma ferramenta de análise de dados tão poderosa como a linguagem R.
O curso não é um guia completo para análise de dados utilizando a linguagem R, mas irá ajudá-lo a entender todas as técnicas necessárias para isso.
Embora o programa do curso tenha duração de 12 semanas, todas as semanas, às segundas-feiras, abrirei acesso a novas aulas, por isso recomendo Subscrever no canal do YouTube para não perder a publicação de uma nova aula.