Objetivos
La Diplomatura en Big data está orientada a enseñar a procesar, con aplicaciones informáticas no tradicionales grandes y complejos conjuntos de datos, estructurados y no estructurados, para extraer valor de los datos almacenados.
El objetivo es formular predicciones a través de los patrones observados. Las aplicaciones permiten crear informes estadísticos y modelos predictivos utilizados en muchísimas áreas temáticas.
Veremos que es y que no es Big Data, cuando nos conviene usar los métodos de procesamiento en paralelo al tiempo que la pasamos revista al ecosistema de hadoop. Cubriremos los criterios para diseñar un cluster de hadoop distinguiendo entre los nodos maestros, esclavos y de borde.
Recorreremos el uso de herramientas específicas como Spark, Cassandra, Pig, Hive, Google Cloud Sql y Google Big Table.
Modalidad de cursado
Diplomatura en Big Data a distancia de forma Online.
- Dos clases semanales por videoconferencias interactivas, una teórica y una práctica. La duración de cada clase es de 30 a 60 minutos dependiendo del tema, la cantidad de participantes y el nivel de intervenciones conseguido.
- El estudiante tiene actividad complementaria con material de soporte de las clases, material teórico para estudiar, ejercicios resueltos y para resolver, corrección de ejercicios y autoevaluaciones.
- La dedicación recomendada a estas actividades es de ocho horas semanales.
- Soporte docente por Grupo de WhatsApp, email y foro.
Programa analítico
Unidad 1: ¿Qué es y que no es Big Data?
Unidad 2: ¿Cuándo usar técnicas de Big Data?
Unidad 3: Infraestructura de Big Data
Unidad 4: Hadoop
Unidad 5: Pig
Unidad 6: Hive
Unidad 7: Google Cloud SQL
Unidad 8: Google Big Table
Unidad 9: Spark
Unidad 10: Cassandra
Instancias de evaluación
Examen final.
Requisitos de aprobación
Mínimo 60 % de respuestas correctas.
Equipo docente de la Diplomatura en Big Data
- Ignacio Urteaga
- Laura Siri
- Susana Sarmiento
- Guillermo Garofalo