Apresentamos o curso:
"Aplicações em R para Data Science"
que é realizado em 4 módulos de 4 horas, nos formatos presencial ou ao vivo on line.
Objetivo
O objetivo deste curso é apresentar ferramentas avançadas de manipulação, análise e modelagem de dados. Capacitando profissionais a resolverem problemas analíticos utilizando modelos estatísticos e computacionais, dando escala, agilidade e agregando valor aos resultados de projetos de Data Science.
Módulo I
Ingestão e manipulação avançada de dados
(4 horas)
- Conectando a diversas fontes de dados;
- SQL usando o R;
- Manipulação de datas e strings;
- Filtros, Seleção, Ordenamento e Agregação de dados.
Módulo II
Aprendizado estatístico e de máquina I (Statistical e Machine Learning I)
(4 horas)
- Modelos estatísticos de predição (Reg. Linear Múltipla e Modelos não lineares);
- Técnicas Multivariadas (PCA e Agrupamento);
- Modelos de classificação (Reg. Logística).
Módulo III
Aprendizado estatístico e de máquina II (Statistical e Machine Learning II)
(4 horas)
- Modelos de predição e classificação (Árvores de decisão/regressão, Random Forests, SVM, Redes Neurais);
Módulo IV
Projeto Prático
(4 horas)
- O último período será dedicado a elaboração de um projeto prático no qual os participantes serão encorajados e aplicar as técnicas aprendidas sobre um conjunto de dados próprio, resolvendo um problema real.