Objetivos
El machine learning es una rama de la inteligencia artificial, cuyo objetivo es desarrollar técnicas que permitan que las computadoras aprendan. Es decir cuando su desempeño mejora con la experiencia. Se trata de diseñar algoritmos para convertir muestras de datos en programas, sin tener que escribirlos. Los programas resultantes deben ser capaces de generalizar comportamientos e inferencias para un conjunto de grandes datos. Las aplicaciones son amplias que incluyen motores de búsqueda, diagnósticos médicos, detección de fraude en el uso de tarjetas de crédito, análisis del mercado de valores, clasificación de secuencias de ADN, reconocimiento del habla y del lenguaje escrito, juegos y robótica.
Destinatarios del curso
Está dirigido a cualquier persona con conocimientos equivalentes al de la Diplomatura de Ciencia de Datos.
Programa Analítico
Regresiones
- Regresión Lineal
- Regresión polinómica
- Regresión exponencial y logarítmica
- Regresión de dos variables
- Cálculo de regresiones en R con lm
- Cálculo de regresiones logísticas en R con glm
Árboles de decisión
- Algoritmo básico en Excel
- División en entrenamiento y prueba
- Uso de Rpart y cp
- Predicción y valoración de la solución
- Uso de Party
- Aplicación al problema del call center
Clusters
- Algoritmo básico en Excel
- Uso de kmeans
- Ejemplo de aplicación real
- Otros algoritmos de agrupamiento en R
- Ejercicio de aplicación de agrupamiento de mascotas
Reglas de Asociación
- Algoritmo básico en Access
- División en entrenamiento y prueba
- Uso de arules en R
- Ejemplo de una aplicación real votación de reglas
- Ejemplo de una aplicación real a datos de ventas en supermercados
Redes Neuronales
- Algoritmo básico en Excel
- División en entrenamiento y prueba
- Uso de neuralnet
- Predicción y valoración de la solución
- Discusión del problema de legibilidad de los resultados desde el negocio
- Competencia entre árboles y redes en un caso concreto
Algoritmos genéticos
- Algoritmo básico en Excel
- Discusión del tipo de problemas en los que se aplica
- Discusión de otros mecanismos de optimización
- Implementación en R del uso de algoritmos genéticos como Valores reales
- Binarios
- Permutaciones
Series temporales
- Taxonomía
- Separación de componentes
- Predicciones
- ARIMA implementado en R
- Predicción en series con un único período
- Predicción en series con múltiples períodos
- Predicción en series con períodos variables: renormalización
Método de Simulación de Montecarlo
- Algoritmo básico en Excel
- Discusión de la utilidad del método
- Comparación con el análisis de escenarios
- Ejemplo de una aplicación real
- Ejemplo simple implementado en R
Minería de textos
- Clasificación supervisada de piezas de texto
- Construcción de una red semántica
- Discusión de las posibilidades de reconocimiento de voz
- Ejemplos de aplicación real del algoritmo de clasificación
- Aplicación a la detección de sentimientos
Bayes Ingenuo
- Implementación en Excel
- Comparación de 4 algoritmos predictivos (Bayes ingenuo, árboles, redes neuronales y regresión logística)
- Ejemplo de aplicación en R
Random Forest
- Descripción conceptual del método
- Paquete randomForest
- Ejemplo de aplicación
- Comparación con otras técnicas
Métodos Bayesianos
- Descripción conceptual del método: Regresión lineal bayesiana
- Regresión logística bayesiana
- Inferencia bayesiana
- Red bayesiana
- Ejemplos de aplicación
- Paquete BAS
- Paquete brms
- Paquete arm
- Paquete bnlearnd
- Comparación con otras técnicas
Máquina de soporte vectorial
- Descripción conceptual del método
- Paquete e1071
- Ejemplo de aplicación
- Comparación con otras técnicas
Modalidad de cursado
- Modalidad a distancia de forma Online.
- Clases por videoconferencias interactivas, una teórica y una práctica. La duración de cada clase es de aproximadamente una hora.
- El alumno deberá realizar cierta actividad complementaria con material de soporte de las clases, trabajos con enfoque práctico y proyectos reales orientados a la Ciencia de Datos.
Fechas y horarios
03 de Febrero 2025 (últimas vacantes)
Lunes 21:30 Horas
Miércoles 21:00 Horas
17 de Febrero 2025
Lunes 19:00 Horas y Lunes 21:30 Horas
Las 2 clases semanales se dictan en vivo por Zoom y tienen una duración de 45 a 90 minutos dependiendo del tema y la interacción con los estudiantes. Todas las clases quedan grabadas a disposición de los estudiantes y no se exige asistencia.
Los horarios de las clases se llevan a cabo después de las 19:00 horas los días de semana y por la mañana los sábados, dependiendo de las distintas etapas de la cursada, del tema y del profesor que las imparta, y pueden variar.
Las 2 clases semanales se dictan en vivo por Zoom y tienen una duración de 45 a 90 minutos dependiendo del tema y la interacción con los estudiantes. Todas las clases quedan grabadas a disposición de los estudiantes y no se exige asistencia.