Introducción | Equipo | Galería | Publicaciones | Proyectos | Contacto |
---|
Ponencia de apertura de la jornada de presentación de avances del proyecto ENERGYDATA
Gijón, 13/07/2018, por Ignacio Díaz
Resumen
En esta ponencia presentaré la jornada y trataré de hacer una revisión de la evolución que ha tenido la investigación del grupo GSDPI en el campo de la analítica de datos de procesos. Trataré de establecer un hilo conductor entre las líneas de trabajo de los últimos 10 años, marcadas por el uso del SOM como herramienta de visualización e integración del conocimiento, las línea de trabajo actuales, marcadas por el uso de nuevas técnicas de proyección (t-SNE) herramientas de visualización interactiva (D3, p5js) y técnicas de analítica visual (iDR, cubo de datos interactivo) y el futuro, herramientas deep learning y sus aplicaciones en la analítica de datos de procesos y sistemas.
VAE Características - generalización del SOM (mapeo continuo, espacios latentes n-dim) - fundamentos sólidos (modelo generativo, Kullback-Leibler) - hibridables (LSTM, convolucionales) Usos - visualización DR - visualización dinámica (VAE+conv, VAE+LSTM) - semántica del espacio latente subespacios de fallo direcciones de optimización coordenadas cualitativas - detección de fallos (residuos) denoising AE - separación de señales (NILM) - filtrado avanzado (ruido, señal determinista) GAN (latente->datos) - generación de ejemplos virtuales (data augmentation) - semántica del espacio latente - detección de novedades <- discriminador (one-class)
conv1D - Clasificación y regresión con señales (1 canal, n canales) - Visualización de filtros (FFT de kernels) - Análisis de sensibilidad - Feature visualization (maximizar activación, clase, etc.) conv2D - convertir series temporales --> imágenes (stft / istft, señal / matriz) - conv2D + stft análisis espacial y temporal VAE-conv2d: señal -> stft -> conv2d -> latente -> conv2dt -> istft -> señal - Feature visualization (maximizar activación, clase, etc.)
predicción directa en series temporales predicción de secuencias de estados secuenciación del proceso métodos -> niveles de señal (Keogh), codificación (codebooks)... datos proceso -> secuencia estados CGGATAGCAAACGA... datos proceso -> secuencia de palabras CGAT CCGAAT CAGGT ... word embeddings análisis de espacios de palabras palabras similares <--> coordenadas similares attribute / difference vectors man -> woman uncle -> aunt king -> queen algebra semántica (colah) W("woman") - W("man") ~ W("aunt") - W("uncle") W("woman") - W("man") ~ W("king") - W("queen") hipótesis análisis de procesos: W("actual") + W("eficiente") - W("ineficiente") = ?
Transfer learning Aprendizaje no supervisado (muchos datos sin etiquetas) Explotar arquitecturas (alexnet, googlenet, resnet, vgg, inception) análisis de imagen convertir a imagen y aplicar Crear arquitecturas específicas para datos del Hospital datos de laminación DL + Móvil (tensorflow.js, keras.js, otros) ventajas mobilenet (red optimizada para móvil) acceso a sensores móvil -> cámara, acelerómetros, micro, etc. neurochips en los móviles aplicaciones clasificación imágenes tiempo real médicas (ej. dermatología) detección de fallos (ej. identificación de grietas, defectos, etc.) calidad (ej. análisis básico texturas [ej espumas en pasteurización], color [vinos], turbidez, etc.) DL + Visualización de datos Feature visualization -> buscar patrones que maximizan respuestas (activaciones, clases, etc.) Visualización kernels conv1D Visualización e interacción en espacios latentes visualización directa en espacio latente -> planos, proyecciones interacción sobre espacio latente -> visualización espacio datos (morphing en espacios latentes a lo largo de attribute vectors) Style transfer combinación de funciones de coste foto + cuadro Van Gogh -> foto estilo Van Gogh similar a los "skins" personalizables en apps hipótesis: proceso actual + modelo de eficiencia -> ¿proceso eficiente?
[→ deep learning y visualización web]. Extracto de una propuesta de TFM para abordar algunas confluencias entre deep learning y visualización de datos e interacción. Se plantea entre ellas, llevar DL al móvil a través de tecnologías web, usando la librería tensorflow.js
Actividad realizada en el marco del proyecto DPI2015-69891-C2-2-R, financiada por el Ministerio de Economía y Competitividad (MINECO), Programa Estatal de I+D+i Orientada a los Retos de la Sociedad y por el Fondo Europeo de Desarrollo Regional (FEDER) "Una manera de hacer Europa" |