Universidad Peruana Cayetano Heredia
Departamento de Bioquímica, Biología Molecular y Farmacología

Tópicos en Análisis de Datos y Bioestadística  2007-II

Coordinador del curso: Mirko Zimic

Créditos: (4 horas crédito)

Horario de clases:  Martes y Jueves  2:00pm - 4:00pm
Inicio de clases:      Martes 21 de Agosto

Descargar syllabus


Profesor responsable:          
            Mirko Zimic                 mzimic@gmail.com               anexo: 2604

Asistentes de práctica:       
            Patricia Sheen 
           patricia.sheen@gmail.com       anexo: 2604

Secretaria del departamento:       
            Delia García                dcfbioq@upch.edu.pe             anexo:  2413

 

Bases de datos a utilizar en el curso
- Base drogas legales          (Informe técnico)
- Base drogas legales (1000 observaciones)
- ENDES

 

 

Guías Stata
Guía de stata 1 
Guía de instalación de stata 
Comandos básicos 
Estadística descriptiva 1 
Estadística descriptiva 2 
Inferencia en variables cuantitativas 

 

CRONOGRAMA DE CLASES

Semana 1. Introducción a los conceptos estadísticos.  Definición de observables físicos. Cuantificación y medición. Procesos determinísticos y procesos aleatorios. Constantes y variables aleatorias. Tipos de variables. Definición frecuentista de probabilidad y de distribución probabilística. Distribuciones probabilísticas especiales y distribuciones sesgadas. Definición de parámetros y estimadores. Definición de la Estadística Bayesiana.
(semana 1)  (semana 1(2))  

Semana 2. Manejo básico de Stata. Descripción del programa, ventajas y desventajas. Manejo de bases de datos, uso de la memoria, exportando resultados a otros programas. Manipulación de datos: visualización, selección, creación y agregación. Uso de archivos de bitácora (.log). Uso de programas de comandos (.do)
 

Semana 3. Exploración y presentación de datos. Definición de tipos de datos, presentación de datos en tablas de contingencia y resumen, presentaciones gráficas diversas. Estadística descriptiva simple: medidas de tendencia central y dispersión. Presentación de histogramas. Definición y manejo de valores fuera de rango (outliers). Outliers estadísticos y outliers biológicos.
(semana 3)  (semana 3(2))  (Teoría de errores)

Semana 4. Estadística descriptiva. Prevalencia e incidencia. Sensibilidad y especificidad. Manejo de proporciones, razones y tasas provenientes de datos nominales en estudios epidemiológicos. Análisis exploratorio con variables continuas. Exploración gráfica y tabular bivariada. Estimación puntual e intervalos de confianza.. Relación entre la sensibilidad, valor predictivo positivo y prevalencia de la enfermedad. Teorema de Bayes.
(semana 4)

 Semana 5. Prueba de hipótesis. Hipótesis más comunes en estudios epidemiológicos. Enunciando preguntas de investigación como hipótesis. Selección de la prueba estadística apropiada para una cierta hipótesis. Selección del nivel de significancia. Concepto de resultados “estadísticamente significativos”. Obteniendo resultados y formulando conclusiones. Errores posibles en las pruebas de hipótesis.
(semana 5) (pruebas estadísticas)
 

1er EXAMEN PARCIAL   (Descargar Examen Práctico  #1)

Semana 6. Inferencias con datos categóricos. Revisión de los conceptos y métodos de prueba de hipótesis. Asociación entre datos categóricos mediante pruebas chi-cuadrado. Concepto de la prueba chi-cuadrado. Pruebas exactas de Fisher y corrección de Yates. Concordancia. Estadístico Kappa.
(clase chi2)

Semana 7. Inferencias sobre prevalencias e incidencias. Tipos de diseño de estudios epidemiológicos. Estudios de cohorte y caso-control. Frecuencia de enfermedad y frecuencia de exposición. Fuerza de asociación, riesgo relativo y razón de momios. Pruebas estadísticas disponibles. Confusión e interacción. Corrección de Mantel-Haenszel. Uso de pruebas exactas. 

Semana 8. Inferencias sobre variables continuas. Pruebas paramétricas y no paramétricas. Condiciones para escoger la prueba adecuada. Comparación de dos promedios: pruebas T de Student y Mann-Whitney. Comparación de más de dos promedios: análisis de varianza y prueba de Kruskal-Wallis. Pruebas post-hoc. Correcciones por comparaciones múltiples: prueba de Bonferroni. Concepto de varianza explicada. Correlación: pruebas R de Pearson y Rho de Spearman. 

Semana 9. Regresión lineal simple. Regresión lineal simple. Pruebas de normalidad para la variable dependiente (prueba de Shapiro Wilkins). Inferencias sobre la media y el Teorema del Límite Central. Transformación de la variable dependiente para buscar la normalidad. Tratamiento de las variables predoctoras (independientes): categorización, transformación.
 

2do EXAMEN PARCIAL

Semana 10. Regresión lineal múltiple sobre datos continuos. Efecto total y efecto directo. Ajuste sobre potenciales variables confusoras. Interpretación de los coeficientes de regresión. Obtención del mejor modelo estadístico lineal múltiple. Prueba de las razones de verosimilitud. Selección del mejor modelo comenzando con el modelo saturado. Selección del mejor modelo comenzando con el modelo simple e incluyendo gradualmente variables significativas.
(base PPD)

Semana 11. Regresión logística simple. Regresión logística simple. Interpretación de los coeficientes de regresión: riesgo y protección, razón de momios. Equivalencia de la regresión logística con la tabla 2x2 y el cálculo directo de la razón de momios.

Semana 12. Regresión logística múltiple. Regresión logística múltiple. Efecto total y efecto directo. Ajuste sobre potenciales variables confusoras. Interpretación de los coeficientes de regresión: riesgo y protección, razón de momios. Predictor lineal para la clasificación de la variable dependiente. Curvas ROC la probabilidad de la correcta clasificación.

Semana 13. Análisis de tiempo para evento. Estudios longitudinales. Densidad de incidencia y tasas de incidencia. Supuestos y validez. Censoring. Análisis actuarial y de Kaplan Meier. Hazard, falla y sobrevivencia. Presentación gráfica. Prueba de log-rank.

3er EXAMEN PARCIAL 

Semana 14. Regresión de Cox para datos de tiempo a evento. Modelos de Cox para las proporciones de hazard. Verifiación de la premisa de la proporcionalidad del hazard.
(base survival_generators)  (base survival_drug)  (base survival_cancer)

Semana 15. Análisis longitudinal.  Datos longitudinales. Estructuras de correlación. Regresiones de Modelos Lineales Generalizados.

Semana 16. Exposición de proyectos

4to EXAMEN PARCIAL 

 

EXAMEN SUSTITUTORIO     (14 Diciembre)

 _______________________________________________________________________

Sitios de Interés:

The Peru Applied Biostatistics and Epidemiology Network  http://www.abeperu.net/