912 171 879
Buscador de Cursos & Artículos
Categorías
DENOMINACIÓN
Entrenamiento de modelos en sistemas de Inteligencia Artificial basados en aprendizaje automático
CÓDIGO
MF2493_3
DESCRIPCIÓN
Módulo formativo MF2493_3: Entrenamiento de modelos en sistemas de Inteligencia Artificial basados en aprendizaje automático
DURACIÓN
150 horas
CAPACIDADES Y CRITERIOS DE EVALUACIÓN
C1: Utilizar herramientas estadísticas y de aprendizaje automático para encontrar correlaciones entre variables con anterioridad al diseño y entrenamiento de modelos.
CE1.1 Describir técnicas de la estadística y el aprendizaje automático (‘machine learning’) para la detección de correlaciones entre variables, tanto lineales como no lineales.
CE1.2 Describir procedimientos de categorización de variables tales como mapas de bits (‘one‐hot vectors’) u otros, explicando sus características y objetivos.
CE1.3 Describir técnicas de transformación matemática tales como logaritmos, exponenciales, funciones trigonométricas u otras, explicando sus características y objetivos.
CE1.4 Enumerar herramientas que incorporan técnicas estadísticas y/o de aprendizaje automático, describiendo sus características.
CE1.5 En un supuesto práctico de aplicación de técnicas de análisis de datos:
‐ Encontrar las correlaciones entre variables, tanto lineales como no lineales, aplicando técnicas de la estadística y del aprendizaje automático a través de herramientas o código.
‐ Aplicar procedimientos de categorización y codificación de las variables tales como mapas de bits (‘one‐hot vectors’) u otros, mediante software o herramientas.
‐ Aplicar transformaciones matemáticas a las variables, teniendo en cuenta su distribución.
‐ Identificar las variables de entrada más explicativas, tomando las que tienen mayor correlación con las variables de salida, para tenerlas en cuenta durante el diseño de los modelos.
‐ Documentar las variables de entrada y de salida, incluyendo los detalles analizados y las correlaciones encontradas.
C2: Aplicar técnicas de reducción sobre muestras de conjuntos de datos, mediante programación o herramientas software, para obtener una representación de los mismos mediante variables latentes.
CE2.1 Identificar técnicas de reducción de la dimensión, tales como análisis de componentes principales ‐PCA‐, t‐SNE, autocodificadores (‘autoencoders’) basados en redes neuronales y otras, explicando sus características.
CE2.2 Describir lenguajes de programación y herramientas aplicables a la codificación de técnicas de reducción, explicando sus características y funcionalidades.
CE2.3 En un supuesto práctico de aplicación de técnicas de reducción sobre las muestras de un conjunto de datos:
‐ Elegir las técnicas de reducción a aplicar, considerando aquellas que realizan una mayor reducción de la dimensión mientras conservan la mayor variabilidad de las muestras.
‐ Aplicar la técnica de reducción elegida usando el lenguaje indicado en el supuesto y aplicando las transformaciones.
‐ Aplicar la técnica de reducción elegida usando herramientas software y aplicando las transformaciones.
‐ Documentar el trabajo realizado, indicando las técnicas de reducción de la dimensión aplicadas al conjunto de datos con el que se esté trabajando, los valores concretos de los parámetros de configuración de cada técnica y los resultados obtenidos en cuanto a reducción de la dimensión y pérdida de explicación de la variabilidad, enfatizando el balance entre la proporción de reducción y la pérdida de variabilidad en función de uno o más parámetros.
C3: Aplicar técnicas de representación gráfica, visualizando los datos para corroborar las correlaciones encontradas y verificar la reducción aplicada anteriormente.
CE3.1 Enumerar técnicas de representación gráfica, identificando su tipo, elementos y utilidad práctica.
CE3.2 Describir herramientas de utilidad para la representación gráfica, explicando sus características.
CE3.3 En un supuesto práctico de visualización gráfica de datos:
‐ Escribir programas utilizando técnicas de representación para corroborar las correlaciones y verificar la reducción de la dimensión sobre el conjunto de datos.
‐ Elaborar las gráficas usando infografías o diapositivas, organizándolas para su presentación al equipo de trabajo y elegir las transformaciones a usar en los modelos a
entrenar.
‐ Redactar un informe con los resultados, explicando cómo se ha obtenido cada gráfica y aportando una valoración en base a aspectos cualitativos y cuantitativos y la correlación entre variables latentes.
C4: Aplicar técnicas de diseño de modelos basados en aprendizaje automático (‘machine learning’ ‐ML‐) para aplicarlos sobre un conjunto de datos con el objeto de abordar el problema planteado según su tipo ‐de regresión o de clasificación.
CE4.1 Enumerar técnicas de aprendizaje automático, tales como redes neuronales, máquinas de soporte vectorial, modelos de mixturas gaussianas, árboles de decisión u otras, describiendo sus características.
CE4.2 Identificar los posibles experimentos a codificar y aplicar para evaluar modelos diseñados y las combinaciones de parámetros que conducen a mejores resultados tales como:
‐ El coeficiente de aprendizaje para las redes neuronales (‘learning rate’), el número de capas, el número de neuronas en cada capa, los tipos de activación a utilizar en las capas ocultas,
‐ El número de grupos (‘clusters’) para el algoritmo k‐means, y
‐ El número de árboles a generar en el caso de ‘random‐forests’.
CE4.3 Describir las métricas a utilizar para evaluar modelos, tales como:
‐ La desviación porcentual entre valores predichos y reales en problemas de regresión como la predicción del volumen de ventas semanal por producto.
‐ La ratio de falsos positivos y la de falsos negativos para un problema de clasificación.
‐ Otras métricas relacionadas con las ratios anteriores como ‘accuracy’, ‘precision’, ‘recall’ o ‘sensitivity’, ‘specificity’, y área bajo la curva ROC (‘Receiver Operating Characteristic’), explicando sus características.
CE4.4 En un supuesto práctico de diseño de modelos basados en técnicas de aprendizaje automático:
‐ Elegir las técnicas de aprendizaje automático a aplicar, en base al análisis exploratorio de los datos y el estudio visual y gráfico realizado previamente.
‐ Evaluar los modelos diseñados, programando código para entrenarlos y realizando experimentos que permitan ver qué combinaciones de parámetros de configuración conducen a mejores resultados.
‐ Seleccionar métricas en función de las técnicas de aprendizaje automático aplicadas, teniendo en cuenta el problema a resolver.
‐ Evaluar los modelos diseñados en base a las métricas seleccionadas, decidiendo, bien la creación de nuevos modelos desde cero, bien el rediseño de modelos anteriores en función de que los resultados obtenidos se adecúen a los esperados.
‐ Incluir comentarios en el código escrito, detallando el papel que juega cada variable, describiendo las funciones y algoritmos.
‐ Generar la documentación, detallando los modelos diseñados con todas sus variantes.
Capacidades cuya adquisición debe ser completada en un entorno real de trabajo.
C1 respecto a CE1.5; C2 respecto a CE2.3; C3 respecto a CE3.3; C4 respecto a CE4.4.
Otras Capacidades:
Responsabilizarse del trabajo que desarrolla y del cumplimiento de los objetivos.
Demostrar cierto grado de autonomía en la resolución de contingencias relacionadas con su actividad.
Comunicarse eficazmente con las personas adecuadas en cada momento, respetando los canales establecidos en la organización.
Adaptarse a la organización, a sus cambios organizativos y tecnológicos, así como a situaciones o contextos nuevos.
Adoptar actitudes posturales adecuadas en el entorno de trabajo.
Mostrar una actitud de respeto hacia los compañeros, procedimientos y normas de la empresa.
Cumplir las medidas que favorezcan el principio de igualdad de trato y de oportunidades entre hombres y mujeres.
Valorar el talento y el rendimiento profesional con independencia del sexo.
Aplicar de forma efectiva el principio de igualdad de trato y no discriminación en las condiciones de trabajo entre mujeres y hombres.
CONTENIDOS
1 Técnicas Estadísticas en el ámbito del aprendizaje automático
Técnicas estadísticas para el análisis exploratorio de datos, transformaciones simples y/o de reducción de la dimensión de las muestras. Características.
Distribuciones de probabilidad.
Técnicas de representación gráfica aplicables a la representación de variables en muestras: histogramas, mapas de dispersión y otras técnicas.
Técnicas de transformación de datos de entrada. Técnicas aplicadas a cada variable de manera singular (Escalado a valores dentro de un rango, normalización a media cero y desviación típica uno). Funciones matemáticas de una o más variables (logaritmo, exponencial, raíz cuadrada, x2, xn, seno, coseno, tangente hiperbólica u otros). Técnicas aplicadas a todas las variables de entrada (expansión polinómica para aumento de la dimensión de las muestras en problemas de regresión, técnicas de reducción de la dimensión de las muestras: PCA, t‐SNE, ‘autoencoders’ basados en redes neuronales. Finalidad y aplicación).
Herramientas software que implementen técnicas estadísticas en el ámbito del análisis de datos.
2 Visualización de datos y resultados en el aprendizaje automático
Técnicas de visualización de datos y resultados (Gráficas de dispersión, Histogramas, Mapas de color/densidad, Curva ROC u otros).
Herramientas software aplicables a técnicas de representación de datos y de resultados.
3 Técnicas de entrenamiento en el aprendizaje automático
Tipos de aprendizaje automático: supervisado, no supervisado, semi‐supervisado, por refuerzo.
Tipos de problemas: clasificación, regresión, segmentación, detección de objetos.
Técnicas paramétricas: Basadas en distribuciones de probabilidad conocidas: ‘Gaussian Mixture Models’ u otras.
Técnicas no paramétricas: (árboles de decisión: clásicos, ‘random forest’, ‘gradient boosting’, ‘extremely randomized trees’; Vecinos más próximos (k‐NN); ‘Kernel density estimation’; ‘Support Vector Machines’ (SVM); K‐Means.
Técnicas Holísticas: redes neuronales: ‘fully connected’, ‘convolutional’, ‘recurrent’, ‘transformers’, ‘autoencoders’, ‘encoder‐decoder’, seq2seq u otras.
Técnicas de regularización para evitar el sobreaprendizaje.
Métricas para evaluar la calidad de los modelos diseñados y entrenados: MSE, MAE, ‘accuracy’, precisión, ‘recall’ o ‘sensitivity’, ‘specificity’, ‘F1‐score’, ratio de falsos positivos y de falsos negativos, área bajo la curva ROC, ‘DICE coeffient’, ‘Intersection over Union’ (IoU), y otros específicos del problema a abordar.
Herramientas software con la implementación de las técnicas de aprendizaje automático.
SI QUIERES APRENDER MÁS…
TE LLAMAMOS Y TE LO EXPLICAMOS TODO
