Aula 1 - Motivação e o Operador Pipe
1 O Tidyverse
Bem-vindo ao nosso minicurso de Fundamentos de Processamento de Dados Utilizando o Tidyverse!
O Tidyverse é uma coleção de pacotes R projetados para facilitar a manipulação, visualização e análise de dados de forma eficaz e consistente. Este curso foi elaborado para oferecer a você uma compreensão sólida dos princípios fundamentais do Tidyverse e das técnicas para limpeza, organização e análise de dados.
Ao longo deste minicurso, você terá a oportunidade de aprender os conceitos centrais do Tidyverse, começando com o uso do pacote dplyr para realizar operações de manipulação de dados de maneira intuitiva, utilizando o operador pipe (|>) para encadear comandos. Em seguida, exploraremos o pacote tidyr e tibble para modificação e processamento de dados. Além disso, abordaremos conceitos essenciais do Tidyverse, como o padrão de dados “tidy” e a filosofia de “verbos” para manipulação de dados.
Nosso objetivo é capacitar você a se sentir confiante na utilização do Tidyverse para explorar, limpar e transformar conjuntos de dados, preparando-os para análises avançadas,visualizações informativas e modelos de qualquer natureza. Este minicurso é adequado para pessoas com um conhecimento prévio no R ou para aqueles que desejam aprimorar suas habilidades de manipulação de dados usando o Tidyverse.
2 Tidy Workflow
Os pacotes que utilizam a metodologia tidy de programação não se limitam apenas a parte de limpeza e organização de dados.
O processo de: Coleta, limpeza, organização, exploração, modelagem e entrega pode ser toda realizada utilizando os pacotes do tidyverse, no processo que é conhecido como tidy workflow
O objetivo desse minicurso é introduzir os alunos a primeira etapa desse processo: Leitura, limpeza e organização dos dados, parte essa que é a pedra angular de todos os projetos de análises e modelagens.
Tal etapa se caracteriza pelo tempo que pode ser gasto, onde em diversos contextos, a tarefa de limpeza e organização de dados necessita de um tempo maior que etapas como análise exploratória e modelagem
Os principais pacotes dessa etapa são: readr, readxl, janitor, dplyr, tidyr e tibble. e esses serão os pacotes trabalhados nesse curso
2.1 Ggplot
Pacote de construção gráfica do tidyverse