Información generale
Dr. Christian Desrosiers
Dr. Sylvie Ratté
Contactos (outliers)
Jose Pasillas
Contactos (LLTF)
Alpa Shah
Subvenciones
Conacyt, beca doctorale
Enlaces ensenciales
ERRARE
El proyecto ERRARE tiene como objetivo estudiar las anomalías en todas sus formas y en todos los tipos de datos. Su objetivo es presentar las técnicas innovadoras para la detección e interpretación de estos datos particulares.
ERRARE: OUTLIERS
Ensemble outlier detection for data quality improvement: a diverse an adaptable approach
Las anomalías y los errores son problemas correlacionados que están presentes en la mayoría de los conjuntos de datos del mundo real. Sin embargo, los enfoques actuales que se ocupan de estos problemas son útiles sólo para un tipo específico de conjunto de datos y se limitan sólo a la determinación de las anomalías, no para su clasificación posterior. El objetivo fue desarrollar un proceso unificado, capaz de adaptar el conjunto de técnicas de detección de anomalías en el conjunto de datos, diferenciando entre los errores y anomalías (que representan datos posiblemente interesantes).
Este enfoque se basa en el entendimiento de que la capacidad de adaptación es un factor clave para evaluar las diferentes bases de datos, a continuación, se propone un proyecto de investigación que consiste básicamente en: un conjunto de diferentes tipos de técnicas de detección de anomalías, mejorando el rendimiento del ensamblado basándose en diversidad y exactitud.
Nuestro enfoque propuesto pretende ser un paso hacia el desarrollo de un entorno de trabajo unificado, capaz de buscar y clasificar las anomalías - error o de datos interesantes, adaptando automáticamente el conjunto de técnicas de detección de anomalías.
ERRARE: LLTF
La detección de comportamiento anormal usando la factorización log-lineal de tensores para el control de seguridad.
La ubicación en tiempo real por radiofrecuencia es un enfoque muy popular para el monitoreo de securidad. Sin embargo, en un entorno abierto y dinámico, donde los patrones rara vez se repiten, es difícil implementar un modelo que podría analizar el volumen en tiempo real de la información entrante para detectar eventos anormales. Estos datos entrantes pueden ser representados por una matriz multidimensional, llamado tensor. La información latente extraído por medio de métodos de descomposición tensor han sido probados para la representación de datos ambientales. En consecuencia, se propone un modelo robusto y escalable donde utilizamos herramientas de aprendizaje automático para la agrupación y la predicción de estos factores latentes para detectar anomalías en tiempo real.