MacBook%20Pro%20on%20white%20surface_edi

Workshop (Clases en vivo)

Incluye

90 horas de clase en vivo

Certificados por 130 horas académicas

+50 archivos descargables

Asignaciones y cuestionarios

Acceso hasta el 15 de Diciembre 2021

Programa de Certificación Especializado

Data Science: Estadística y Análisis de Datos en R

Aprende a utilizar R para analizar y graficar bases de datos en Ciencias. Este programa te llevará de Zero a Hero en temas estadísticos aplicados a Ciencias utilizando R como un experto.

Vistas recientes

Fechas: 04 de Julio al 10 de Octubre de 2021

Horario: Domingos (6 horas), 9-12 hrs y 16-19 hrs (GMT-5, hora oficial de Lima, Quito, Bogotá)

90 horas de clase en vivo

05 cursos (26 horas académicas cada uno)

06 Certificados por un total de 130 horas académicas

Acceso hasta el 15 de Diciembre 2021

Sobre este curso

Actualmente la Ciencia de Datos, el análisis estadístico y la capacidad de inferir conocimientos son la piedra angular de la investigación científica. Este programa certificado de 15 semanas está diseñado para sumergirte en conceptos estadísticos aplicados con el lenguaje de programación R de manera práctica y didáctica.


Dirigido a

Estudiantes y profesionales de diferentes áreas de la ciencias: biólogos, ingenieros, especilistas ambientales, analistas, consultores, monitores, entre otros.


Requisitos mínimos

  • No se requieren conocimientos previos de estadística. Si los tienes, excelente.

  • No se requieren conocimientos previos de ningún lenguaje de programación.


Al finalizar el Programa obentrás

Cinco (05) certificados de cada curso del programa, un (01) certificado del programa de especialización y un (01) documento con el temario y las calificaciones obtenidas.


Para obtener la Certificación

Para obtener el certificado del curso de especialización debes haber aprobado los cinco examenes (uno por curso) con nota mínima de 16. Cada examen tiene tres intentos para aprobar. Para intentos adicionales deberás pagar la tasa de derecho de reintento ($ 15 para tres nuevos intentos). Los participantes que aprueben el examen de cada módulo recibirán unicamente una Constancia de Participación en el curso. Aquellos estudiantes que hayan aprobado los cuatro módulos del programa recibirán automáticamente la certificación del “Curso de Especialización Data Science: Estadística Avanzada y Análisis de Datos en R” a nombre del Instituto de Ciencias Antonio Brack. Los alumnos que se graduen del curso de especialización con nota de 20 recibirán esta certificación bajo la distinción “Con Honores”.

¿Qué aprenderás?

  • Comprender y producir ordenes informáticas de análisis en el lenguaje de programación R en nivel básico e intermedio.

  • Manejar bases de datos y proyectos en RStudio.

  • Elaborar gráficas estadísticas de alta calidad.

  • Interpretar los fundamentos estadístico de análisis descriptivos básico, correlaciones, e inferenciales mediante regresiones lineales (simple, múltiple, ANOVA, ANCOVA, LMM, GLM, GLMM, y análisis multivariados), utilizando lenguaje de programación R. Interpretación y reporte.

Instructor

Image-empty-state.png

Blgo. Irwing S. Saldaña

Biólogo de la Universidad Nacional de Trujillo (Perú). Investigador CONCYTEC (RENACYT: P0038629), asociado al Dpto. de Ecoinformática y Biogeografía, Instituto de Ciencias Antonio Brack, y a la ONG CINBIOTYC. Me interesa desarrollar el campo de la ecoinformática con un enfoque integrativo, utilizando aplicaciones estadísticas y de aprendizaje automático, para dilucidar los procesos de especiación y evolución que dan forma a la distribución actual y futura de aves de rango-restringido y amenazadas en ecosistemas críticos de los Andes Tropicales.

Certificado por

Image-empty-state.png
Image-empty-state.png

Inversión

Costo por curso:  

  • 195 soles (Perú)

  • $50 (Latinoamérica, USA y España)


Descuento por un solo pago: 

  • 750 soles (225 soles de ahorro) ó

  • 200 dólares (50 dólares de ahorro).


Descuentos sobre el costo de un solo pago:

  • 10% de descuento para grupos de 2 personas. [S/. 675 ó $180 por persona]

  • 15% de descuento para grupos de 3 o 4 personas. [S/. 640 ó $170 por persona]

  • 20% de descuento para grupos de 5 a más personas. [S/. 600 ó $160 por persona]

  • 40% de descuento por ser estudiante de pregrado (presentar documento de matrícula vigente como sustento). [S/. 450 ó $120 por persona]


Revisar detalles de los pagos en la página de inscripción.


Escríbenos en el chat de nuestra fan page en Facebook o través de nuestro email para activar los beneficios. Haz click en los íconos para ir directo a hablar con nosotros.

 

Una muestra de lo que a aprenderás a realizar (haz click)

GLM Regresión Logística
LMM (interceptos y pendientes aleatorias)
PCA
LDA
MRT
NMDS
Geom Tiles
Lineas
Dispersión de Puntos
Boxplot
Histograma
gganimate
gganimate
Geom curve
Modelamiento
Geom density 2D
LMM (interceptos aleatorios)
Facetas
Scatter Plot
1/1

Sílabus Detallado

C1 - Introducción a R para Ciencias (3 Semanas)

  • Qué es R y lenguaje R

  • R y RStudio

  • Operaciones en lenguaje R

  • Estructrura de datos en el lenguaje R

  • Vector, Matriz, Lista, Factor, DataFrame, Tibble

  • Indexación de variables

  • Operadores lógicos

  • Valores perdidos

  • Funciones, sintáxis y argumentos

  • Librerías y repositorios

  • Obtener ayuda en RStudio y la web

  • Generación de proyectos en RStudio

  • Directorios de trabajo

  • Preprocesamiento de tablas para cargar en RStudio

  • Renombrar y editar variables en RStudio

  • Importar y Exportar archivos en RStudio

  • Inspección de variables

  • Conociendo la librería tidyverse

  • Tablas anchas y largas

  • Funciones de dplyr para manejar tablas

  • Filtrado y selección

  • Reordenamiento de tablas

  • Creación de nuevas variables

  • Pipe


C2 - Análisis Estadístico Básico con R (3 Semanas)

  • Introducción a la estadística

  • Margen de error (Intervalos de confianza)

  • Nivel de significacia

  • Funciones de medidas de tendencia central

  • Media, mediana (aritmética, geométrica, armónica), moda

  • Funciones de medidas de dispersión

  • Pruebas de hipótesis

  • ¿Qué significa el p-valor?

  • Significancia de las pruebas estadísticas

  • Distribuciones de probabilidades

  • Función de densidad

  • Test Paramétricos y No Paramétricos

  • Test de normalidad: simetría y curtosis, KS Test, SW Test, AD Test, Q-Q Plot

  • T-Student (una muestra, muestras independientes, varianzas iguales, varianzas desiguales)

  • Test de Wilcoxon de una muestra

  • Test de Rangos con Signo de Wilcoxon

  • Test U de MannWhitney

  • Regresión lineal simple y verificación de supuestos teóricos

  • Outliers en regresiones lineales

  • Test ANOVA (una y dos vías) y verificación de supuestos teóricos

  • Test Kruskall Wallis y verificación de supuestos teóricos

  • Test Post-hoc (paramétrico y no paramétrico)

  • Tópico avanzado de ANOVA

  • ANCOVA y verificación de supuestos teóricos

  • Poder de Análisis

  • Análisis de correlación (Pearson, Spearman, Kendall, Biserial, Punto Biserial)


C3 - Gráficos avanzados con ggplot2 (3 Semanas)

  • Introducción a ggplot2: gramática de gráficos

  • Geométricas para gráficos de una variable (X)

  • Gráfico de área

  • Gráfico de densidad

  • Polígono de frecuencias

  • Histrograma de frecuencias

  • Q-Q Plots

  • Geométricas para gráficos de una variable (X) discreta

  • Gráfico de barras

  • Geométricas para gráficos de dos variables: X continua, Y continua

  • Gráficas de dispersión de puntos

  • Jittering

  • Gráfico de densidad de puntos

  • Gráfico de hexágonos

  • Adicionando regresiones lineales a los gráficos

  • Geométricas para gráficos de dos variables: X discreta, Y continua

  • Boxplot (Gráfico de cajas)

  • Gráfico de violín

  • Geométricas para gráficos de dos variables: X discreta, Y continua

  • Gráfico de conteos

  • Geométricas para gráficos de 3 variables

  • Gráfico de Tiles

  • Posiciones, Stats y Transformaciones

  • Funciones adicionales

  • Modificar escalas (continuas y discretas)

  • Escalas de color

  • Color Picker y Códigos Hexadecimales

  • Cambiando formas de los puntos y líneas

  • Escalas y ejes

  • Rotamiento y Faceting de gráficos

  • Etiquetas y Geométricas de texto

  • Temas

  • Tópicos de color y paletas

  • Librerías adicionales y asociadas a ggplot2

  • Gráficos estadísticos con ggpubr, ggstatsplot

  • Correlogramas con ggcorrplot

  • Trabajando con gganimate, magick y patchwork

  • Exportación de gráficos en alta calidad


C4 - Análisis Multivariados con R (3 Semanas)

  • Estadística Multivariada

  • Análisis Multivariados

  • ¿Qué es ordenamiento?

  • Gráfico n-dimensionales

  • Preprocesamiento de datos multivariados

  • Transformaciones

  • Matrices de distancia

  • Medidas de distancia

  • Librerías asociadas a análisis multivariados

  • Agrupamiento Jerárquico (Clustering)

  • Ordenamiento sin restricciones

  • Análisis de Componentes Principales (PCA)

  • Limitaciones del PCA

  • Análisis de Correspondencia (CA)

  • Análisis de Coordenadas Principales (PCoA o MDS)

  • Escalamiento Multidimensional No Métrico (NMDS)

  • Gráfico de Estrés

  • Introducción al análisis canónico

  • Análisis de Redundancia (RDA)

  • Gráfico Triplot

  • Análisis de Redundancia Parcial (Partial RDA)

  • Árbol de Regresión Múltiple (MRT)

  • Análisis Discriminante Lineal (LDA) y Cuadrático (QDA)

  • Gráfico de partición de las clasificaciones LDA y QDA

  • Análisis de Correspondencia Canónica (CCA)

  • Análisis de Múltiples Factores (MFA)

  • Gráficos con funciones asociadas a ggplot2


C5 - Análisis Estadístico Avanzado con R (3 Semanas)

  • Breve repaso sobre modelamiento

  • ¿Cómo abordar problemas estadísticos? 

  • Modelo lineal de efectos mixtos (LMM)

  • Diferencias entre LMM y ANOVA para muestras repetidas

  • Terminología para modelos de efectos mixtos

  • Enfoques de análisis Regresión lineal simple y LMM

  • Definición de un LM

  • Topología de un LMM

  • Generando un LMM en R

  • Gráficas asociadas a ggplot2 de los modelos LMM

  • Relación GLM y LM: Definición matemática

  • Distribuciones teóricas de probabilidades en GLM

  • Función de enlace (link function)

  • Topología de un GLM

  • Generando GLMs en R

  • Regresión Logística (Bernoulli  y Binomial): Odds, OR, Logit

  • Deviance, Pseudo R cuadrado y p-valor de un GLM, IC

  • Selección de modelos: Stepwise regression, criterios de información

  • Regresión de Poisson

  • Lidiando con Sobredispersión

  • Regresión Quasipoisson

  • Regresión Binomial Negativa

  • Regresión Beta

  • Modelos de Hurdle, Zero-inflados y Zero-truncados

  • Gráficas asociadas a ggplot2 de los modelos GLM

  • Introducción a los GLM de efectos mixtos (GLMM)

  • Inferencias basadas en Máxima verosimilitud y Monte Carlo S.

  • Generando GLMMs en R

  • Topología de un GLMM

  • Regresión Logistica de Efectos Mixtos

  • Regresión de Poissonde Efectos Mixtos

  • Sobredispersión en modelos de Efectos Mixtos

  • Regresión Quasipoisson y Binomial Negativa de Efectos Mixtos

  • Gráficas asociadas a ggplot2 de los modelos GLMM