Introducción | Equipo | Galería | Publicaciones | Contacto |
---|
Los algoritmos DR son capaces de encontrarestructuras latentes de baja dimensión ocultas en datos de alta dimensionalidad, permitiendo obtener un mapa en un espacio de baja dimensión (2D o 3D) que conserva la estructura más significativa de datos. | |
Estos algoritmos se basan en el cómputo de las distancias mutuas entre los elementos de un espacio de entrada, para obtener una representación de los mismos en un espacio de visualización de baja dimensión (2D/3D) que preserva en sus aspectos más importantes la estructura definida por esas distancias mutuas. Estos algoritmos definen, por tanto, un mapeo o proyección del espacio de entrada sobre el espacio de visualización que conserva la estructura y relaciones topológicas más significativas de los datos en el espacio original. Los algoritmos DR son herramientas extremadamente útiles en el campo de la analítica visual, ya que proporcionan una forma avanzada de "espacialización" de los datos, es decir, la generación de representaciones visuales donde la proximidad espacial entre dos elementos \(i\)y \(j\) en la visualización representan similitud entre los correspondientes elementos \(\mathbf x_i\) y \(\mathbf x_j\) en el espacio de alta dimensión. |
Por otra parte, un elemento clave en la analítica visual es la interacción. Las técnicas de interacción como el zoom, traslación y la rotación de los datos, el focus & context, brushing,etc, permiten al usuario reconfigurar la visualización para centrarse en los aspectos interesantes de los datos o para descartar información irrelevante. En elprocedimiento típico de uso de los algoritmos de DR para la visualización de datos, la interacción tiene lugar a menudo después del cómputo de la proyección. El usuario establece una configuración inicial para el algoritmo de DR, lo ejecuta hasta la convergencia y, después de N iteraciones, los resultados de salida se utilizan para producir una visualización. El usuario puede después utilizar técnicas de interacción para reconfigurar esta visualización o incluso decidir ejecutar el algoritmo de DR con otra parametrización, iniciando el ciclo de nuevo.
Sin embargo, la interacción puede ir más allá de este enfoque, si se permite al usuario tomar el control completo del comportamiento del algoritmo DR durante la convergencia visualizando los resultados intermedios. Utilizando algoritmos no convexos, como el SNE (stochastic neighbor embedding), que se basan en un mecanismo de aproximación iterativo, la visualización de los resultados intermedios describe una estructura cambiante que revela de forma dinámica los cambios en las relaciones entre las muestras en función del conjunto de variables elegidas.
El resultado es una visualización que cambia dinámicamente -una transición animada- la cual permite al usuario seguir los cambios en la proyección resultante ante cambios en la formulación del problema, tales como, por ejemplo, los cambios en la métrica del espacio de entrada a través de la modificación de los pesos de las variables de entrada, o en presencia de datos de entrada de variantes (por ejemplo, en los procesos dinámicos en los que los elementos de los datos de entrada cambian con el tiempo).
La investigación publicada en esta página ha sido financiada por fondos del Principado de Asturias, del Ministerio de Economía y Competitividad (mineco) y por fondos FEDER de la Unión Europea en los proyectos DPI2009-13398-C02/01 y DPI2015-69891-C2-2-R |
Abajo se muestra un poster con la idea de iDR, presentado en el simposio ESANN2014, en Brujas, Bélgica (versión en pdf disponible aquí)
.A continuación se muestra un poster mostrando la interpretación en espacio de estados del comportamiento dinámico de algoritmos iDR, presentado en el simposio ESANN2016, en Brujas, Bélgica (versión en pdf disponible aquí)
.