Descripción
Conoce la tutora del curso

Tutor: Juan Sebastian Moreno
Economista y Magíster en Economía de la Universidad de los Andes.
Se desempeña como profesor magistral del Taller de R y de Economía Matemática. Amplia experiencia como profesor complementario para los cursos de Macroeconomía 3, Pensando Problemas, Econometría y el aprendizaje de máquinas.
Trabajó en el Ministerio de Hacienda y Crédito Público en temas de riesgo sobre los pasivos de la nación. Se desempeñó como investigador en el CESED (Centro de Estudios sobre Seguridad y Drogas) donde se especializó en temas de cultivos de coca y sus determinantes. Actualmente es investigador senior en temas de Machine Learning, procesamiento del lenguaje natural y Deep Learning.

Tutor: Mateo Dulce
Economista y matemático de la Universidad de los Andes, y Magíster en Economía de la misma universidad, título en que obtuvo el grado Cum Laude.
Se ha desempeñado como profesor asistente de los cursos de Cálculo integral y ecuaciones diferenciales, Álgebra lineal, y Macroeconomía y finanzas internacionales. Fue asistente de investigación en la Facultad de Economía en el estudio de sistemas dinámicos para modelar el comportamiento criminal en Bogotá.
Actualmente se desempeña como Director del área de Minería de Datos en Quantil | Matemáticas Aplicadas, donde se dedica al diseño, desarrollo e implementación de modelos matemáticos y de aprendizaje automático para la resolución de problemas prácticos de la industria, el gobierno, y la academia.
- Entender un contexto/problemática a partir de una o múltiples bases de datos.
- Identificar oportunidades utilizando las habilidades proveidas por la analítica de datos
- Elegir entre múltiples técnicas estadísticas las más adecuadas para resolver cada problema
- Interpretar los resultados de los modelos implementados
- Escoger el mejor modelo a partir de distintas métricas de evaluación de los modelos
- Monitorear y superar los obstáculos comunes en un proyecto de analítica
- Separar y delegar de manera óptima las tareas de un proyecto de analítica
-
Comprender las fortalezas, limitaciones, supuestos y debilidades de cada técnica implementada
Hágase experto en la gestión de datos para el sector salud
- Introducción a la analítica de datos ( Definición de conceptos básicos: Big Data, minería de datos, ML)
- Metodologías para el desarrollo de proyectos de Analítica de Datos (CRISP-DM, SEMMA, KDD)
-
Fases de un proyecto de análisis de datos (Comprensión del problema, comprensión y pre-procesamiento de los datos, modelaje, evaluación, y despliegue)
- Introducción al aprendizaje de máquinas I (Análisis supervisado)
- Estimación de función objetivo (Análisis paramétrico vs. No paramétrico / Interpretabilidad vs. Predicción)
- Interpretación (Correlación vs Causalidad)
- Selección de parámetros (Sesgo vs. Varianza)
- Comprensión y preprocesamiento de datos y sus Tipos: estructurados, no estructurados, streaming, tipos de variables
- Estadística descriptiva parte I y II; correlaciones, dispesión
- Analítica descriptiva (Visualización de datos)
- Procesamiento de datos (Extracción, transformación y carga de datos)
- Introducción y Preparación de Datos (técnicas de minería de datos) parte I y II
- Técnicas de regresión base parte I y II
- Técnicas de clasificación base
- Matriz de confusión
- Técnicas avanzadas de clasificación y regresión parte I y II
- Árboles de decisión parte I y II
- Preparación de los datos y Metodologías de Agrupamiento: k-medias y Grupos jerárquicos
- Métricas de agrupamiento: Homogeneidad y Heterogeneidad - inercia o varianza interna de los grupos, coeficiente de silueta; indice de dunn
- Escogencia de número de grupos
- Discretización de campos numéricos
- Evaluación de resultados - Parte I y II
- Planificación de despliegue y Despliegue
- Planeación del control y del mantenimiento - Parte I y II
- Creación de un Informe Final
- Revisión final del proyecto