Programa de Certificación Especializado

Data Science: Estadística y Análisis de Datos en R

COHORTE 2021-III

Workshop (Clases en vivo)

Aprende a utilizar R para analizar y graficar bases de datos en Ciencias. Este programa te llevará de Zero a Hero en temas estadísticos aplicados a Ciencias utilizando R como un experto.

Vistas recientes

Inicio: 20 de Setiembre, 2021.

Cierre: 21 de Enero, 2022.

Fecha máxima para presentar exámenes: 01 de Marzo de 2022.

Acceso a campus virtual (archivos, videos) hasta: 01 de Marzo de 2022.

Clases: Lunes, Miércoles y Viernes.

Horario: 6:00 a 8:30 pm (GMT-5, hora oficial de Lima, Quito, Bogotá) 

revisa la diferencia horaria aquí (Google).https://www.brackinstitute.com/inscripciones

87 horas de clase en vivo.

05 certificados de cursos (uno por curso, 30 horas académicas cada uno).

01 certificado detallado de finalización del programa  (incluye temario y notas, emitido por 150 horas académicas).

Archivos descargables, PDFs de las diapositivas, scripts, R Markdowns, retos personales y en grupo, concursos entre compañeros (challenges en vivo) y prácticas de casa.

Visualización y descarga de videos de las clases posterior a cada sesión.

Sobre este programa

Actualmente la Ciencia de Datos, el análisis estadístico y la capacidad de inferir conocimientos son la piedra angular de la investigación científica. Este programa certificado de 15 semanas está diseñado para sumergirte en conceptos estadísticos aplicados con el lenguaje de programación R de manera práctica y didáctica.


Dirigido a

Estudiantes y profesionales de diferentes áreas de la ciencias: biólogos, ingenieros, especilistas ambientales, analistas, consultores, monitores, entre otros.


Requisitos mínimos

  • No se requieren conocimientos previos de estadística. Si los tienes, excelente.

  • No se requieren conocimientos previos de ningún lenguaje de programación.


Al finalizar el Programa obentrás

Cinco (05) certificados de cada curso del programa, un (01) certificado del programa de especialización y un (01) documento con el temario y las calificaciones obtenidas.


Para obtener la Certificación

Para obtener el certificado del curso de especialización debes haber aprobado los cinco examenes (uno por curso) con nota mínima de 16. Cada examen tiene tres intentos para aprobar. Para intentos adicionales deberás pagar la tasa de derecho de reintento ($ 15 para tres nuevos intentos). Los participantes que aprueben el examen de cada módulo recibirán unicamente una Constancia de Participación en el curso. Aquellos estudiantes que hayan aprobado los cuatro módulos del programa recibirán automáticamente la certificación del “Curso de Especialización Data Science: Estadística Avanzada y Análisis de Datos en R” a nombre del Instituto de Ciencias Antonio Brack. Los alumnos que se graduen del curso de especialización con nota de 20 recibirán esta certificación bajo la distinción “Con Honores”.

RCohorte21-III.png

¿Qué aprenderás?

  • Comprender y producir ordenes informáticas de análisis en el lenguaje de programación R en nivel básico e intermedio.

  • Manejar bases de datos y proyectos en RStudio.

  • Elaborar gráficas estadísticas de alta calidad.

  • Interpretar los fundamentos estadístico de análisis descriptivos básico, correlaciones, e inferenciales mediante regresiones lineales (simple, múltiple, ANOVA, ANCOVA, LMM, GLM, GLMM, y análisis multivariados), utilizando lenguaje de programación R. Interpretación y reporte.

 

Sílabus detallado

C1 - Introducción a R para Ciencias (3 Semanas)

  • Qué es R y lenguaje R

  • R y RStudio

  • Operaciones en lenguaje R

  • Estructrura de datos en el lenguaje R

  • Vector, Matriz, Lista, Factor, DataFrame, Tibble

  • Indexación de variables

  • Operadores lógicos

  • Valores perdidos

  • Funciones, sintáxis y argumentos

  • Librerías y repositorios

  • Obtener ayuda en RStudio y la web

  • Generación de proyectos en RStudio

  • Directorios de trabajo

  • Preprocesamiento de tablas para cargar en RStudio

  • Renombrar y editar variables en RStudio

  • Importar y Exportar archivos en RStudio

  • Inspección de variables

  • Conociendo la librería tidyverse

  • Tablas anchas y largas

  • Funciones de dplyr para manejar tablas

  • Filtrado y selección

  • Reordenamiento de tablas

  • Creación de nuevas variables

  • Pipe


C2 - Análisis Estadístico Básico con R (3 Semanas)

  • Introducción a las probabilidades

  • Variables aleatorias

  • Distribuciones teóricas y empíricas de probabilidades

  • Función de Densidad

  • Funciones de medidas de tendencia central: media (aritmética, geométrica, armónica), mediana, moda

  • Funciones de medidas de dispersión

  • Error estándar, margen de error  e intervalos de confianza

  • ¿Qué significa el p-valor?

  • Nivel de significancia

  • Pruebas de hipótesis

  • Test Paramétricos y No Paramétricos

  • Test de normalidad: simetría y curtosis, KS Test, SW Test, AD Test, Q-Q Plot

  • T-Student (una muestra, muestras independientes, varianzas iguales, varianzas desiguales)

  • Test de Wilcoxon de una muestra

  • Test de Rangos con Signo de Wilcoxon

  • Test U de MannWhitney

  • Regresión lineal simple y verificación de supuestos teóricos

  • Outliers en regresiones lineales

  • Test ANOVA (una y dos vías) y verificación de supuestos teóricos

  • Test Kruskall Wallis y verificación de supuestos teóricos

  • Test Post-hoc (paramétrico y no paramétrico)

  • Tópico avanzado de ANOVA

  • ANCOVA y verificación de supuestos teóricos

  • Poder de Análisis

  • Análisis de correlación (Pearson, Spearman, Kendall, Biserial, Punto Biserial)


C3 - Gráficos avanzados con ggplot2 (3 Semanas)

  • Introducción a ggplot2: gramática de gráficos

  • Geométricas para gráficos de una variable (X)

  • Gráfico de área

  • Gráfico de densidad

  • Polígono de frecuencias

  • Histrograma de frecuencias

  • Q-Q Plots

  • Geométricas para gráficos de una variable (X) discreta

  • Gráfico de barras

  • Geométricas para gráficos de dos variables: X continua, Y continua

  • Gráficas de dispersión de puntos

  • Jittering

  • Gráfico de densidad de puntos

  • Gráfico de hexágonos

  • Adicionando regresiones lineales a los gráficos

  • Geométricas para gráficos de dos variables: X discreta, Y continua

  • Boxplot (Gráfico de cajas)

  • Gráfico de violín

  • Geométricas para gráficos de dos variables: X discreta, Y continua

  • Gráfico de conteos

  • Geométricas para gráficos de 3 variables

  • Gráfico de Tiles

  • Posiciones, Stats y Transformaciones

  • Funciones adicionales

  • Modificar escalas (continuas y discretas)

  • Escalas de color

  • Color Picker y Códigos Hexadecimales

  • Cambiando formas de los puntos y líneas

  • Escalas y ejes

  • Rotamiento y Faceting de gráficos

  • Etiquetas y Geométricas de texto

  • Temas

  • Tópicos de color y paletas

  • Librerías adicionales y asociadas a ggplot2

  • Gráficos estadísticos con ggpubr, ggstatsplot

  • Correlogramas con ggcorrplot

  • Trabajando con gganimate, magick y patchwork

  • Exportación de gráficos en alta calidad


C4 - Análisis Multivariados con R (3 Semanas)

  • Estadística Multivariada

  • Análisis Multivariados

  • ¿Qué es ordenamiento?

  • Gráfico n-dimensionales

  • Preprocesamiento de datos multivariados

  • Transformaciones

  • Matrices de distancia

  • Medidas de distancia

  • Librerías asociadas a análisis multivariados

  • Agrupamiento Jerárquico (Clustering)

  • Ordenamiento sin restricciones

  • Análisis de Componentes Principales (PCA)

  • Limitaciones del PCA

  • Análisis de Correspondencia (CA)

  • Análisis de Coordenadas Principales (PCoA o MDS)

  • Escalamiento Multidimensional No Métrico (NMDS)

  • Gráfico de Estrés

  • Introducción al análisis canónico

  • Análisis de Redundancia (RDA)

  • Gráfico Triplot

  • Análisis de Redundancia Parcial (Partial RDA)

  • Árbol de Regresión Múltiple (MRT)

  • Análisis Discriminante Lineal (LDA) y Cuadrático (QDA)

  • Gráfico de partición de las clasificaciones LDA y QDA

  • Análisis de Correspondencia Canónica (CCA)

  • Análisis de Múltiples Factores (MFA)

  • Gráficos con funciones asociadas a ggplot2


C5 - Análisis Estadístico Avanzado con R (3 Semanas)

  • Breve repaso sobre modelamiento

  • ¿Cómo abordar problemas estadísticos? 

  • Modelo lineal de efectos mixtos (LMM)

  • Diferencias entre LMM y ANOVA para muestras repetidas

  • Terminología para modelos de efectos mixtos

  • Enfoques de análisis Regresión lineal simple y LMM

  • Definición de un LM

  • Topología de un LMM

  • Generando un LMM en R

  • Gráficas asociadas a ggplot2 de los modelos LMM

  • Relación GLM y LM: Definición matemática

  • Distribuciones teóricas de probabilidades en GLM

  • Función de enlace (link function)

  • Topología de un GLM

  • Generando GLMs en R

  • Regresión Logística (Bernoulli  y Binomial): Odds, OR, Logit

  • Deviance, Pseudo R cuadrado y p-valor de un GLM, IC

  • Selección de modelos: Stepwise regression, criterios de información

  • Regresión de Poisson

  • Lidiando con Sobredispersión

  • Regresión Quasipoisson

  • Regresión Binomial Negativa

  • Regresión Beta

  • Modelos de Hurdle, Zero-inflados y Zero-truncados

  • Gráficas asociadas a ggplot2 de los modelos GLM

  • Introducción a los GLM de efectos mixtos (GLMM)

  • Inferencias basadas en Máxima verosimilitud y Monte Carlo S.

  • Generando GLMMs en R

  • Topología de un GLMM

  • Regresión Logistica de Efectos Mixtos

  • Regresión de Poissonde Efectos Mixtos

  • Sobredispersión en modelos de Efectos Mixtos

  • Regresión Quasipoisson y Binomial Negativa de Efectos Mixtos

  • Gráficas asociadas a ggplot2 de los modelos GLMM

Una muestra de lo que a aprenderás a realizar (haz click)

Correlograma
press to zoom
Gráfico de barras porcentuales
press to zoom
Gráficos estadísticos automáticos
press to zoom
Datos de correlaciones y regresiones en los gráficos
press to zoom
Gráficos animados
press to zoom
Gráficos de efectos
press to zoom
PCA
press to zoom
Regresión Beta
press to zoom
Gráfico de Odds Ratios
press to zoom
Regresión de Poisson
press to zoom
Agrupamiento jerárquico (Clustering)
press to zoom
Regresión logística
press to zoom
LMM
press to zoom
Curva ROC
press to zoom
Regresión de Poisson
press to zoom
Regresión de Hurdle
press to zoom
LDA
press to zoom
Distancias
press to zoom
PCA
press to zoom
CA
press to zoom
PCA
press to zoom
CCA
press to zoom
Funciones de densidad
press to zoom
MDS o PCoA
press to zoom
Diagrama de Shepard
press to zoom
1/2

Instructor

Image-empty-state.png

Blgo. Irwing S. Saldaña

Biólogo de la Universidad Nacional de Trujillo (Perú). Investigador CONCYTEC (RENACYT: P0038629), asociado al Dpto. de Ecoinformática y Biogeografía, Instituto de Ciencias Antonio Brack, y a la ONG CINBIOTYC. Me interesa desarrollar el campo de la ecoinformática con un enfoque integrativo, utilizando aplicaciones estadísticas y de aprendizaje automático, para dilucidar los procesos de especiación y evolución que dan forma a la distribución actual y futura de aves de rango-restringido y amenazadas en ecosistemas críticos de los Andes Tropicales.

Certificado por

Image-empty-state.png
Image-empty-state.png

Inversión

Costo por curso:  

  • 195 soles (Perú)

  • $50 (Latinoamérica, USA y España)


Por el programa completo (descuento por pago único): 

  • 750 soles (225 soles de ahorro) ó

  • 200 dólares (50 dólares de ahorro).


Descuentos adicionales sobre el costo de pago único:

  • 10% de descuento para grupos de 2 personas. [S/. 675 ó $180 por persona]

  • 15% de descuento para grupos de 3 o 4 personas. [S/. 640 ó $170 por persona]

  • 20% de descuento para grupos de 5 a más personas. [S/. 600 ó $160 por persona]

  • 40% de descuento por ser estudiante actual de pregrado (presentar documento de matrícula vigente como sustento). [S/. 450 ó $120 por persona]


Revisar detalles de los pagos en la página de inscripción.


Escríbenos en el chat de nuestra fan page en Facebook o través de nuestro email para activar los beneficios. Haz click en los íconos para ir directo a hablar con nosotros.