Devido à quarentena, muitos passam agora a maior parte do tempo em casa, e este tempo pode, e até deve, ser gasto de forma útil.
No início da quarentena resolvi finalizar alguns projetos que comecei há alguns meses. Um desses projetos foi o videocurso “Linguagem R para usuários de Excel”. Com este curso, eu queria diminuir a barreira de entrada no R e preencher um pouco a escassez existente de materiais de treinamento sobre esse assunto em russo.
Se todo o trabalho com dados na empresa em que você trabalha ainda é feito em Excel, então sugiro que você conheça uma ferramenta de análise de dados mais moderna e ao mesmo tempo totalmente gratuita.

Conteúdo
Se você estiver interessado em análise de dados, talvez esteja interessado em meu и canais. A maior parte do conteúdo é dedicada à linguagem R.
4.1.
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
4.8.
4.9.
4.10.
4.11.
4.12.
referências
Sobre o curso
O curso está estruturado em torno da arquitetura tidyverse, e os pacotes incluídos nele: readr, vroom, dplyr, tidyr, ggplot2. Claro, existem outros bons pacotes em R que realizam operações semelhantes, por exemplo data.table, mas a sintaxe tidyverse intuitivo, fácil de ler mesmo para um usuário não treinado, então acho melhor começar a aprender a linguagem R com tidyverse.
O curso irá guiá-lo por todas as operações de análise de dados, desde o carregamento até a visualização do resultado final.
Por que R e não Python? Como R é uma linguagem funcional, é mais fácil para os usuários do Excel migrarem para ela, porque não há necessidade de se aprofundar na programação orientada a objetos tradicional.
No momento estão previstas 12 videoaulas, com duração de 5 a 20 minutos cada.
As aulas serão abertas gradualmente. Toda segunda-feira abrirei acesso a uma nova aula em meu site. em uma lista de reprodução separada.
Para quem é este curso?
Acho que isso fica claro no título, no entanto, irei descrevê-lo com mais detalhes.
O curso é voltado para quem usa ativamente o Microsoft Excel em seu trabalho e ali implementa todo o seu trabalho com dados. Em geral, se você abrir o aplicativo Microsoft Excel pelo menos uma vez por semana, o curso será adequado para você.
Não é necessário ter conhecimentos de programação para concluir o curso, porque... O curso é voltado para iniciantes.
Mas, talvez, a partir da lição 4, haja material interessante para usuários ativos do R também, porque... a principal funcionalidade de pacotes como dplyr и tidyr será discutido com algum detalhe.
Programa do curso
Lição 1: Instalando a linguagem R e o ambiente de desenvolvimento RStudio
Data de publicação: Março 23 2020
Links:
Vídeo:

Descrição:
Uma lição introdutória durante a qual baixaremos e instalaremos o software necessário e examinaremos brevemente os recursos e a interface do ambiente de desenvolvimento RStudio.
Lição 2: Estruturas de dados básicas em R
Data de publicação: Março 30 2020
Links:
Vídeo:

Descrição:
Esta lição o ajudará a entender quais estruturas de dados estão disponíveis na linguagem R. Veremos em detalhes vetores, dataframes e listas. Vamos aprender como criá-los e acessar seus elementos individuais.
Lição 3: Lendo dados de arquivos TSV, CSV, Excel e Planilhas Google
Data de publicação: Abril 6 2020
Links:
Vídeo:

Descrição:
Trabalhar com dados, independente da ferramenta, começa com sua extração. Os pacotes são usados durante a aula vroom, readxl, googlesheets4 para carregar dados no ambiente R a partir de arquivos csv, tsv, Excel e Planilhas Google.
Lição 4: Filtrando linhas, selecionando e renomeando colunas, pipelines em R
Data de publicação: Abril 13 2020
Links:
Vídeo:

Descrição:
Esta lição é sobre o pacote dplyr. Nele descobriremos como filtrar dataframes, selecionar as colunas necessárias e renomeá-las.
Também aprenderemos o que são pipelines e como eles ajudam a tornar seu código R mais legível.
Lição 5: Adicionando Colunas Calculadas a uma Tabela em R
Data de publicação: Abril 20 2020
Links:
Vídeo:

Descrição:
Neste vídeo continuamos nosso conhecimento da biblioteca tidyverse e pacote dplyr.
Vejamos a família de funções mutate(), e aprenderemos como usá-los para adicionar novas colunas calculadas à tabela.
Lição 6: Agrupando e agregando dados em R
Data de publicação: Abril 27 2020
Links:
Vídeo:

Descrição:
Esta lição é dedicada a uma das principais operações de análise, agrupamento e agregação de dados. Durante a aula usaremos o pacote dplyr e características group_by() и summarise().
Veremos toda a família de funções summarise()Ie summarise(), summarise_if() и summarise_at().
Lição 7: União Vertical e Horizontal de Tabelas em R
Data de publicação: Maio 4 2020
Links:
Vídeo:

Descrição:
Esta lição o ajudará a compreender as operações de união vertical e horizontal de tabelas.
Uma união vertical é equivalente à operação UNION na linguagem de consulta SQL.
A junção horizontal é mais conhecida pelos usuários do Excel graças à função VLOOKUP; no SQL, tais operações são realizadas pelo operador JOIN.
Durante a aula resolveremos um problema prático durante o qual usaremos pacotes dplyr, readxl, tidyr и stringr.
As principais funções que consideraremos:
bind_rows()- junção vertical de tabelasleft_join()— junção horizontal de tabelassemi_join()- incluindo juntar tabelasanti_join()- junção de mesa exclusiva
Lição 8: Funções de janela em R
Data de publicação: Maio 11 2020
Links:
Descrição:
As funções de janela têm significado semelhante às de agregação; elas também pegam uma matriz de valores como entrada e realizam operações aritméticas sobre eles, mas não alteram o número de linhas no resultado de saída.
Neste tutorial continuamos a estudar o pacote dplyre funções group_by(), mutate(), bem como novos cumsum(), lag(), lead() и arrange().
Lição 9: Tabelas rotativas ou um análogo de tabelas dinâmicas em R
Data de publicação: Maio 18 2020
Links:
Descrição:
A maioria dos usuários do Excel usa tabelas dinâmicas; esta é uma ferramenta conveniente com a qual você pode transformar uma matriz de dados brutos em relatórios legíveis em questão de segundos.
Neste tutorial, veremos como girar tabelas em R e convertê-las do formato largo para o formato longo e vice-versa.
A maior parte da lição é dedicada ao pacote tidyr e funções pivot_longer() и pivot_wider().
Lição 10: Carregando arquivos JSON em R e convertendo listas em tabelas
Data de publicação: Maio 25 2020
Links:
Descrição:
JSON e XML são formatos extremamente populares para armazenamento e troca de informações, geralmente devido à sua compactação.
Mas é difícil analisar dados apresentados nesses formatos, por isso antes da análise é necessário trazê-los para uma forma tabular, que é exatamente o que aprenderemos neste vídeo.
A lição é dedicada ao pacote tidyr, incluído no núcleo da biblioteca tidyversee funções unnest_longer(), unnest_wider() и hoist().
Lição 11: Plotando rapidamente usando a função qplot()
Data de publicação: 1 2020 junho
Links:
Descrição:
Pacote ggplot2 é uma das ferramentas de visualização de dados mais populares, não apenas em R.
Nesta lição aprenderemos como construir gráficos simples usando a função qplot(), e vamos analisar todos os seus argumentos.
Lição 12: Plotando plotagens camada por camada usando o pacote ggplot2
Data de publicação: 8 2020 junho
Links:
Descrição:
A lição demonstra todo o poder do pacote ggplot2 e a gramática de construção de gráficos em camadas embutidas nele.
Analisaremos as principais geometrias presentes no pacote e aprenderemos como aplicar camadas para construir um gráfico.
Conclusão
Procurei abordar a formação do programa do curso da forma mais concisa possível, destacando apenas as informações mais necessárias para dar os primeiros passos no aprendizado de uma ferramenta de análise de dados tão poderosa como a linguagem R.
O curso não é um guia completo para análise de dados utilizando a linguagem R, mas irá ajudá-lo a entender todas as técnicas necessárias para isso.
Embora o programa do curso tenha duração de 12 semanas, todas as semanas, às segundas-feiras, abrirei acesso a novas aulas, por isso recomendo no canal do YouTube para não perder a publicação de uma nova aula.
Fonte: habr.com
