Vers une théorie fonctionnelle des records : applications à la détection d'anomalies

Mines Saint-Étienne

Domaine scientifique Analyse de données & intelligence artificielle

Record theory

Probabilité à dimension infinie

RKHS

Détection d'anomalies

Analyse fonctionnelle des données

Information pratique

Directeur de thèse

Anis HOAYEK

Encadrants

Supervisor: Anis HOAYEK, Associate Professor (HDR and expert in record theory)
Co-Advisor 1: Mireille Batton-Hubert, Professor (Expert in data science for anomaly detection)
Co-Advisor 2: Xavier Bay, Associate Professor (Expert in functional data analysis)

Laboratoire d’accueil

Institut Henri Fayol – Département Génie Mathématique et Industriel (GMI).
LIMOS (UMR CNRS 6158)
IT’M Factory

Plus d'information

Description

La théorie des records fournit des outils probabilistes essentiels pour comprendre les événements extrêmes : des phénomènes qui dépassent les fluctuations habituelles et influencent des décisions cruciales dans les domaines scientifiques, techniques et sociaux. Elle est donc particulièrement pertinente pour la détection des anomalies, car celles-ci se produisent souvent dans des situations extrêmes. Si la théorie classique des records est bien comprise dans des contextes à dimension finie [1,2], l'essor des données fonctionnelles et à haute dimension a créé un fossé théorique important [3,4]. Les sources de données modernes, telles que les trajectoires des capteurs industriels, les courbes environnementales ou les signaux biomédicaux, sont des objets fonctionnels dans des espaces à dimension infinie [4,5,6]. La réduction de ces données à des vecteurs à dimension finie détruit souvent leurs structures temporelles et leurs comportements extrêmes, limitant ainsi la capacité à détecter des anomalies fonctionnelles rares, c'est-à-dire des trajectoires ou des modèles inhabituels s'écartant du comportement typique du système [4,7].

La recherche sur la théorie des records dans les espaces à dimension infinie, tels que Hilbert et RKHS, reste limitée [8]. Les modèles d'record classiques ont du mal à saisir les dépendances complexes inhérentes aux données à haute dimension. Pour surmonter cette limitation, le développement d'approches « d'record fonctionnel » inspirées de l'analyse des données fonctionnelles et de la modélisation basée sur RKHS semble être une direction prometteuse [8,9].

Ce projet vise à établir les fondements mathématiques de la théorie des records fonctionnels, permettant une compréhension probabiliste plus approfondie des modèles extrêmes dans les flux de données fonctionnelles. Il marque une rupture majeure avec l'état de l'art en étendant la théorie des records au-delà des espaces euclidiens, à l'aide d'outils issus de l'analyse fonctionnelle et de la géométrie RKHS [3,8]. Le cadre qui en résulte intègre les statistiques d'record dans la détection des anomalies fonctionnelles, un domaine dans lequel la théorie classique des records montre ses limites [5,10,11,12]. En capturant les événements rares dans la géométrie des données à dimension infinie, il fournit une modélisation interprétable et robuste : contrairement aux approches ponctuelles, il prend en compte des trajectoires entières, préservant la structure temporelle et géométrique tout en exploitant l'intégralité du contenu informationnel. Cette perspective révèle des modèles fonctionnels rares invisibles pour les méthodes classiques [3,7,10,11] et permet la classification des anomalies, des écarts locaux à court terme aux anomalies contextuelles persistantes ou à long terme. De plus, sa formulation mathématique solide simplifie les modèles existants et réduit la complexité computationnelle par rapport aux alternatives basées sur les données, permettant une détection en ligne et non supervisée sans formation. Le projet ouvre ainsi une nouvelle voie de recherche à la croisée de la théorie des records, de la théorie des valeurs extrêmes et de l'analyse des données fonctionnelles.

Les applications sont vastes et ont un impact important. Dans le secteur industriel, la théorie des records fonctionnels détecte des profils opérationnels rares dans les réseaux de capteurs et les systèmes cyber-physiques, et soutient la surveillance intelligente de l'énergie et le contrôle continu de la qualité dans la fabrication complexe [10,11,12]. En science climatique, elle offre une description novatrice des courbes de température ou records de pollution [4]. Enfin, dans le domaine de la santé, elle permet d'identifier des schémas physiologiques inhabituels (courbes ECG et signaux cérébraux) que les méthodes ponctuelles négligent [5,12]. Ces cas d'utilisation s'inscrivent parfaitement dans les objectifs stratégiques de l'IMT en matière d'industrie responsable, de transition énergétique et d'ingénierie de la santé.

Bibliographie

1. Hoayek, A. S., Ducharme, G. R., & Khraibani, Z. (2017). Distribution-free inference in record series. Extremes, 20(3), 585-603.
2. Hoayek, A. (2016).. Estimation des paramètres pour des modèles adaptés aux séries de records (Doctoral dissertation, Université Montpellier).
3. Hsing, T., & Eubank, R. (2015). Theoretical Foundations of Functional Data Analysis, with an Introduction to Linear Operators. Wiley. [DOI:10.1002/9781118762547]
4. French, J., Kokoszka, P., Stoev, S., & Hall, L. (2019). Quantifying the risk of heat waves using extreme value theory and spatio-temporal functional data. Computational Statistics & Data Analysis, 135, 107–122
5. Li, B., & Solea, E. (2018). A nonparametric graphical model for functional data with application to brain networks based on fMRI. Journal of the American Statistical Association, 113(522), 1373–1386.
6. Wittenberg, P., Neumann, L., & Mendler, A. (2025). Covariate-adjusted functional data analysis for structural health monitoring. Data-Centric Engineering. Cambridge University Press.
7. Müller, H.G. (2016). Peter Hall, functional data analysis and random objects. Annals of Statistics, 44(5), 2017–2021
8. Liu, M. (2024). Statistical Learning and Inference for Functional Predictor Models via Reproducing Kernel Hilbert Space. University of Alberta.
9. Wang, J., Wong, R.K.W., & Zhang, X. (2022). Low-rank covariance function estimation for multidimensional functional data. Journal of the American Statistical Association, 117(540), 1921–1937
10. Kamel, M., Hoayek, A., & Batton-Hubert, M. (2025, February). Coupling Variable Selection and Anomaly Detection: Record-Based Approach. In 2025 5th IEEE Middle East and North Africa Communications Conference (MENACOMM) (pp. 1-6). IEEE.
11. Kheirallah, R., Hoayek, A., Batton-Hubert, M., & Burlat, P. (2025). Anomaly Detection in a Production Line: Statistical Learning Approach and Industrial Application. Procedia CIRP, 134, 1017-1022.
12. Li, B., & Song, J. (2017). Nonlinear sufficient dimension reduction for functional data. Annals of Statistics, 45(3), 1757–1787.