Máster en Ingeniería de Sistemas de Toma de Decisiones

1500 horas

100% Online

2380€

1895€

Descargar programa en PDF

Solicita Información

Nombre *

Apellidos *

Correo electrónico *

He leído y acepto la Política de Privacidad

Presentación

El Máster en Ingeniería de Sistemas de Toma de Decisiones es tu pasaporte hacia el futuro de la gestión inteligente. En un mundo donde la información es poder, saber cómo analizar y utilizar datos para tomar decisiones estratégicas es fundamental. Este máster te prepara para enfrentar desafíos complejos mediante el aprendizaje de técnicas avanzadas de decisión y modelización de incertidumbre. Con un enfoque en herramientas como el análisis de datos, simulación y metaheurísticas, te convertirás en un experto en transformar datos en decisiones sólidas. La creciente demanda de profesionales capacitados en Big Data y minería de datos hace que esta formación sea especialmente valiosa. Optar por este máster significa estar a la vanguardia de la innovación, mejorando tus habilidades en áreas clave como la optimización y la gestión de bases de datos. A través de un formato online flexible, tendrás la oportunidad de aprender desde cualquier lugar, adaptando tus estudios a tus necesidades personales y profesionales.

¿Quién puede acceder a la formación?

El Máster en Ingeniería de Sistemas de Toma de Decisiones está dirigido a profesionales y titulados en ingeniería, matemáticas o ciencias afines interesados en profundizar en modelos de decisión, análisis de datos y técnicas de optimización. Ideal para quienes buscan actualizarse en big data, minería de datos y técnicas avanzadas como la simulación de Monte Carlo o Six Sigma.

Objetivos

‘- Aplicar modelos y técnicas avanzadas de decisión para optimizar procesos complejos. – Desarrollar sistemas de apoyo a la decisión utilizando algoritmos heurísticos. – Implementar métodos bayesianos en situaciones de incertidumbre para mejorar la precisión. – Utilizar simulación de Monte Carlo para evaluar riesgos en la toma de decisiones. – Emplear técnicas de minería de datos para transformar datos en decisiones estratégicas. – Diseñar soluciones de Big Data para el procesamiento eficiente de grandes volúmenes de datos. – Integrar el método Six Sigma para mejorar la calidad y eficiencia en proyectos de ingeniería.

Salidas Profesionales

‘- Analista de datos en sectores avanzados – Consultor en sistemas de decisión – Especialista en Big Data para ingeniería – Experto en optimización y algoritmos – Ingeniero de sistemas de soporte a la decisión – Desarrollador de soluciones de minería de datos – Gestor de proyectos Six Sigma – Consultor en seguridad y gestión de bases de datos – Responsable de innovación tecnológica en decisiones empresariales

PARTE 1. INGENIERÍA DE LA DECISIÓN

PARTE 2. MODELIZACIÓN Y TRATAMIENTO DE LA INCERTIDUMBRE

PARTE 3. SIMULACIÓN Y METAHEURÍSTICAS

PARTE 4. GESTIÓN DE BASES DE DATOS

UNIDAD DIDÁCTICA 1. INTRODUCCIÓN A LAS BASES DE DATOS

UNIDAD DIDÁCTICA 2. EL MODELO DE BASES DE DATOS RELACIONAL

UNIDAD DIDÁCTICA 3. LENGUAJE DE CONSULTA SQL

UNIDAD DIDÁCTICA 4. MYSQL COMO SISTEMA GESTOR DE BASES DE DATOS RELACIONALES

UNIDAD DIDÁCTICA 5. SALVAGUARDA Y RECUPERACIÓN DE DATOS

UNIDAD DIDÁCTICA 6. BASES DE DATOS DISTRIBUIDAS

UNIDAD DIDÁCTICA 7. SEGURIDAD DE LOS DATOS

UNIDAD DIDÁCTICA 8. TRANSFERENCIA DE DATOS

PARTE 5. MINERÍA DE DATOS

UNIDAD DIDÁCTICA 1. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO

UNIDAD DIDÁCTICA 2. R COMO HERRAMIENTA PARA BIG DATA

UNIDAD DIDÁCTICA 3. PRE-PROCESAMIENTO & PROCESAMIENTO DE DATOS

UNIDAD DIDÁCTICA 4. ANÁLISIS DE LOS DATOS

UNIDAD DIDÁCTICA 5. PROCESAMIENTO DISTRIBUIDO DE DATOS CON HADOOP

UNIDAD DIDÁCTICA 6. WEKA Y DATA MINING

PARTE 6. BIG DATA PARA INGENIERÍAS

UNIDAD DIDÁCTICA 1. INTRODUCCIÓN

UNIDAD DIDÁCTICA 2. BATCH PROCESSING

MapReduce

- Entorno MapReduce
- Función Map y función Reduce
- Flujo de datos
- Características de MapReduce
- Uso de MarpReduce
- Ventajas e inconvenientes de Map Reduce
- Ejercicios y ejemplos con MapReduce

Hadoop

- Entorno Hadoop
- Almacenamiento: HDFS
- Características de HDFS

Apache Hadoop YARN

- Funciones de Framework computacionales
- YARN: El gestor de recursos del cluster
- Conceptos de Apache Spark
- Ejecución de Computational Frameworks en YARN
- Exploración de las aplicaciones de YARN Applications a través de la Web UIs y de Shell

Agregación de los logs de YARN

- Configuración de Hadoop y registros de Daemon
- Localizar configuraciones y aplicar cambios de configuración
- Gestión de instancias de Role y añadir servicios
- Configuración del servicio HDFS
- Configuración de los logs de Hadoop Daemon
- Configuración del servicio YARN

Obtención de datos en HDFS

- Ingestión de datos desde fuentes de recursos externos con Flume
- Ingestión de datos desde bases de datos relacionales con Sqoop
- REST Interfaces
- Buenas prácticas para la importación de datos

Planificación de un cluster Hadoop

- Consideraciones generales de planificación
- Elección correcta de Hardware
- Opciones de Virtualización
- Consideraciones de red
- Configuración de nodos

Instalación y configuración de Hive, Pig e Impala
Clientes Hadoop incluidos en Hue

- ¿Qué es un cliente de Hadoop?
- Instalación y configuración de clientes Hadoop
- Instalación y configuración de Hue
- Autorizaciones y autenticación Hue

Configuración avanzada de un cluster

- Parámetros avanzados de configuración
- Configuración de puertos Hadoop
- Configuración de HDFS para la organización en rack
- Configuración de HDFS para obtención de alta disponibilidad

Seguridad Hadoop

- ¿Por qué es importante la seguridad en Hadoop?
- Conceptos del sistema de seguridad de Hadoop
- Qué es Kerberos y cómo funciona
- Securización de un clúster Hadoop Cluster con Kerberos
- Otros conceptos de seguridad

Gestión de recursos

- Configuración de cgroups con Static Service Pools
- El Fair Scheduler
- Configuración de Dynamic Resource Pools
- Configuraciones de CPU y memoria YARN
- Impala Query Scheduling

Mantenimiento de un cluster

- Chequeo del estado de HDFS
- Copia de datos entre clústers
- Añadir y eliminar de nodos en el clúster
- Rebalanceo del Cluster
- Directorio de Snapshots
- Actualización del clúster

Solución de problemas y monitorización de un cluster

- Sistema general de monitorización
- Monitorización de clústers Hadoop
- Solución de problemas habituales en el clúster de Hadoop
- Errores habituales en la configuración

UNIDAD DIDÁCTICA 3. CIENCIA DE DATOS

UNIDAD DIDÁCTICA 4. DESARROLLO PARA SPARK Y HADOOP

Datasets y Dataframes
Operaciones en Dataframe
Trabajar con Dataframes y Schemas
Crear Dataframes a partir de Data Sources
Guardar DataFrames en Data Sources
DataFrame Schemas
Rapidez y lentitud de ejecución
Análisis de datos con consultas de DataFrame

- Consultar DataFrames con el empleo de expresiones de columna
- Agrupación y agregación de consultas
- Unión de DataFrames

- Introducción RDD
- RDD Data Sources
- Creando y guardando RDDs
- Operaciones con RDDs

Transformación de datos con RDDs

- Escritura y paso de funciones de transformación
- Ejecuciones de transformación
- Conversión entre RDDs y DataFrames

Agregación de datos con Pair RDDs

- Key-Valué Pair RDDs
- Mal-Reduce
- Otras operaciones Pair RDD

Consulta y vistas de tablas con Spark SQL

- Datasets y DataFrames
- Creación de Datasets
- Ejecución y guardado de Datasets
- Operaciones de Dataset

Creación, configuración y ejecución de aplicaciones Spark

- Creación de una aplicación Spark
- Compilar y ejecutar la aplicación
- Application Deployment Mode
- La interfaz Spark Application Web UI
- Configuración de las propiedades de la aplicación

Procesamiento distribuido

- Apache Spark en un Clúster
- Particiones RDD
- Ejemplo: Particionamiento en consultas
- Etapas y Tareas
- Planificación de tareas de ejecución

Persistencia de datos distribuidos

- Persistencia en Datasets y DataFrames
- Persistencia en niveles de almacenamiento
- Visualización de RDDs persistentes

Patrones comunes al procesar datos con Spark

- Casos comunes de uso de Spark
- Algoritmos de iteración en Apache Spark
- Machine Learning

Spark Streaming: Introducción a DStreams

- Vista general de Spark Streaming
- DStreams
- Desarrollo de aplicaciones en Streaming

Spark Streaming: procesamiento de múltiples lotes

- Operaciones Multi-Batch
- Time Slicing
- Operaciones de estado
- Operaciones Sliding Window
- Vista previa: Streaming estructurado

Apache Spark Streaming: Data Sources

- Vista general de Streaming Data Source
- Apache Flume y Apache Kafka Data Sources
- Ejemplo: uso de un Kafka Direct Data Source

UNIDAD DIDÁCTICA 5. ANÁLISIS DE DATOS

Introducción a Pig

- ¿Qué es Pig?
- Características de Pig
- Casos de empleo de Pig
- Interacción con Pig

Análisis de datos básico con Pig

- Sintaxis Pig Latin
- Carga de datos
- Tipos simples de datos
- Definición de campos
- Datos de salida
- Vistas y esquemas
- Filtrado y ordenación de datos
- Funciones habituales

Procesado de datos complejos con Pig

- Formatos de almacenamiento
- Tipos de datos complejos y anidados
- Agrupaciones
- Funciones predefinidas para datos complejos
- Iteración de datos agrupados

Operaciones con multiconjuntos de datos con Pig

- Técnicas para combinar conjuntos de datos
- Unión de conjuntos de datos con Pig
- Conjunto de operaciones
- División de conjuntos de datos

Troubleshooting y optimización de Pig

- Troubleshooting en Pig
- Inicio de sesión
- Empleo de UI web Hadoop
- Muestreo de datos y depuración
- Visión general del rendimiento
- Comprensión del plan de ejecución
- Consejos para mejorar el rendimiento de Jobs en Pig

Introducción a Hive e Impala

- ¿Qué es Hive?
- ¿Qué es Impala?
- ¿Por qué utilizar Hive e Impala?
- Schema y almacenamiento de datos
- Comparación entre Hive y bases de datos tradicionales
- Casos de uso

Consultas con Hive e Impala

- Tablas y bases de datos
- Sintaxis básica en consultas Hive e Impala
- Tipos de datos
- Empleo de Hue para ejecutar consultas
- Empleo de Beeline (la Shell de Hive)
- Empleo de la Shell de Impala

Administración de datos

- Almacenamiento de datos
- Creación de bases de datos y tablas
- Carga de datos
- Alteración de bases de datos y tablas
- Simplificación de consultas con vistas
- Almacenamiento de resultados de consultas

Almacenamiento y datos de rendimiento

- Partición de tablas
- Carga de datos en tablas particionadas
- Cuándo utilizar el particionamiento
- Elección de formato de almacenamiento
- Gestión de metadatos
- Control de acceso a datos

Análisis de datos relacional con Hive e Impala

- Unión de conjuntos de datos
- Funciones predefinidas habituales
- Agregaciones y Windowing

Datos complejos con Hive e Impala

- Datos complejos con Hive
- Datos complejos con Impala

Análisis de texto con Hive e Impala

- Empleo de expresiones regulares
- Procesamiento de texto con SerDes en Hive
- Análisis de los sentimientos y N•Grams

Optimización Hive

- Rendimiento de las consultas
- Bucketing
- Indexación de datos
- Hive en Spark

Optimización de Impala

- Ejecución de consultas
- Mejorar el rendimiento de Impala

Extendiendo Hive e Impala

- Customizar SerDes y formatos de fichero en Hive
- Transformación de datos con Scripts personalizados en Hive
- Funciones definidas por el usuario
- Consultas parametrizadas
- Comparación entre MapReduce, Pig, Hive, Impala, y bases de datos relacionales. ¿Cuál elegir?

PARTE 7. ALGORITMOS DE BIGDATA PARA INGENIERÍAS

UNIDAD DIDÁCTICA 1. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO

UNIDAD DIDÁCTICA 2. R COMO HERRAMIENTA PARA BIG DATA

UNIDAD DIDÁCTICA 3. PRE-PROCESAMIENTO &, PROCESAMIENTO DE DATOS

UNIDAD DIDÁCTICA 4. ANÁLISIS DE LOS DATOS

UNIDAD DIDÁCTICA 5. PROCESAMIENTO DISTRIBUIDO DE DATOS CON HADOOP

UNIDAD DIDÁCTICA 6. WEKA Y DATA MINING

PARTE 8. CALIDAD: SEIS SIGMA

UNIDAD DIDÁCTICA 1. INTRODUCCIÓN AL SIX SIGMA

UNIDAD DIDÁCTICA 2. PROYECTOS Y PROCESOS

UNIDAD DIDÁCTICA 3. EL MÉTODO DMAIC

UNIDAD DIDÁCTICA 4. MÉTODOS DE ESTADÍSTICA BÁSICA APLICADA AL SIX SIGMA

UNIDAD DIDÁCTICA 5. MÉTODOS DE ESTADÍSTICA AVANZADA APLICADOS AL SIX SIGMA

UNIDAD DIDÁCTICA 6. CONTROL AVANZADO

UNIDAD DIDÁCTICA 7. EXPERIMENTOS

UNIDAD DIDÁCTICA 8. MINITAB

Titulación

Doble Titulación: – Titulación de Máster en Ingeniería de Sistemas de Toma de Decisiones con 1500 horas expedida por EDUCA BUSINESS SCHOOL como Escuela de Negocios Acreditada para la Impartición de Formación Superior de Postgrado, con Validez Profesional a Nivel Internacional – Titulación Universitaria de Curso Universitario en Creación y Gestión de Base de Datos SQL con 200 horas y 8 ECTS expedida por UTAMED – Universidad Tecnológica Atlántico Mediterráneo.