Débruitage des données épidémiques : une nouvelle approche pour améliorer les prévisions de propagation des maladies

Débruitage des données épidémiques : une nouvelle approche pour améliorer les prévisions de propagation des maladies

Une bonne prévision de la propagation des maladies infectieuses est un défi majeur en épidémiologie. L’efficacité des interventions de santé publique dépend de la précision des prévisions, afin de détecter les épidémies à l’avance, optimiser l’allocation des ressources et appliquer les mesures de confinement au bon moment. Cependant, les données épidémiologiques sont souvent incomplètes ou peu fiables en raison du sous-déclaration, des dépistages limités et des problèmes de confidentialité. De nombreuses infections restent non-détectées, notamment aux premiers stades de l’épidémie, et la structure des interactions au sein des populations ajoute un degré de complexité supplémentaire à la modélisation de la transmission des maladies. Ces limitations introduisent une incertitude significative dans les modèles épidémiologiques traditionnels qui dépendent de données de bonne qualité pour faire des prévisions précises

Pour relever ces défis, Olga Klopp, professeure en Systèmes d'Information, Data Analytics et Opérations, et ses co-auteurs Claire Donnat (Université de Chicago) et Nicolas Verzelen (INRAE, Montpellier), ont introduit une nouvelle approche qui améliore les prévisions épidémiologiques en appliquant une technique mathématique connue sous le nom de débruitage par Variation Totale (VT), initialement développée dans le domaine du traitement du signal. En adaptant cette méthode à la modélisation épidémiologique, ils montrent que cette méthode est efficace pour reconstituer les données manquantes et affiner les prévisions de la dynamique des maladies sur les réseaux de contact. Elle permet d’estimer plus précisément les probabilités d’infection, constituant ainsi un outil précieux pour le suivi des épidémies, même en cas de données partielles.

Défis liés aux données et à la modélisation des épidémies

La modélisation de la transmission des maladies infectieuses repose généralement sur des modèles compartimentaux qui catégorisent les individus en divers états possibles par rapport à la maladie, tels que les individus susceptibles de contracter la maladie, les individus infectieux et les individus rétablis. Ces modèles ont été largement utilisés pour étudier la propagation des maladies, mais leur précision est limitée par la qualité des données disponibles. Dans les situations réelles, l’observation des processus épidémiques est souvent partielle : certains individus infectés ne sont pas testés ou ne signalent pas leurs symptômes, et les contraintes liées à la confidentialité restreignent l’accès aux données de contact précises. Par ailleurs, la transmission s’effectue au sein de réseaux sociaux complexes, où certains individus occupent une position clé et contribuent davantage à la propagation des infections que d’autres. Les modèles traditionnels ont du mal à intégrer ces complexités, ce qui entraîne des biais potentiels dans les prévisions.

Les modèles épidémiologiques basés sur des réseaux de contacts offrent une approche plus raffinée en capturant l'hétérogénéité des interactions au sein d'une population. Cependant, l'efficacité de ces modèles dépend également de la fiabilité des données sous-jacentes. Les observations manquantes peuvent entraîner des conclusions trompeuses sur la trajectoire d'une épidémie, en particulier lorsque les premiers cas ne sont pas détectés. Il est donc essentiel de relever le défi des données incomplètes afin d’améliorer la fiabilité des prévisions épidémiques.

Débruitage par Variation Totale pour la Prévision des Épidémies

Pour améliorer la modélisation épidémiologique en présence de données bruités et incomplètes, cette étude propose l'utilisation du débruitage par Variation Totale, une méthode initialement développée pour améliorer la qualité des images et des signaux en supprimant les distorsions aléatoires tout en préservant les caractéristiques structurelles clés. Appliquée aux données épidémiologiques, cette méthode reconstruit les informations manquantes et corrige les incohérences liées aux sous-déclarations ou aux lacunes dans les observations.

Cette approche repose sur le principe que la propagation des maladies obéit à des schémas prévisibles, surtout parmi des groupes d'individus en interaction. Grâce à la structure naturelle des réseaux de contacts, la méthode de débruitage VT calcule les risques de contamination plus précisément, offrant des prévisions solides même sans données exhaustives. L'étude démontre  que cette approche garantit des estimations à la fois robustes et cohérentes, généralisant ainsi des résultats mathématiques précédemment restreints à d'autres catégories de données. Sa capacité à corriger l'information manquante rend cette approche particulièrement utile pour la détection précoce des épidémies, un moment critique où les données sont rares mais dont les interventions en temps opportun sont cruciales.

Une innovation clé de cet étude est l'extension du débruitage par VT à des contextes où seules des observations partielles sur les cas d'infection sont disponibles. Souvent, dans la pratique, les systèmes de surveillance sanitaire ne détectent qu'une partie des cas réels à cause des limites de test et de déclaration. L'étude démontre que le débruitage par VT reste efficace dans ces conditions en incorporant un cadre probabiliste qui prend en compte les observations manquantes. Cette adaptation garantit que, même lorsque de grandes portions de la population restent non observées, la méthode est toujours capable de fournir des estimations fiables de la propagation des maladies.

Des prévisions plus fiables permettent une meilleure allocation des ressources médicales, des interventions plus ciblées et une prise de décision plus efficace concernant les mesures de contrôle de l’épidémie, telles que les politiques de quarantaine et les campagnes de vaccination. La capacité à inférer les données manquantes améliore également les systèmes d'alerte précoce, permettant un suivi plus efficace des épidémies émergentes.

 Application aux données de la COVID-19

Afin de valider l'efficacité de cette approche, l'étude intègre une analyse numérique basée sur les données COVID-19 de Californie. En utilisant les données sur les cas rapportés et les réseaux de contact, les chercheurs ont appliqué le débruitage par VT pour reconstruire la progression de l'épidémie  Les résultats démontrent que la méthode identifie avec succès les tendances clés dans les dynamiques d'infection tout en compensant les lacunes des données disponibles. Des comparaisons avec des approches de modélisation traditionnelles montrent que le débruitage par VT conduit à des prévisions plus précises, en particulier aux phases précoces d'une épidémie lorsque l'incertitude des données est la plus élevée. Cette utilisation illustre l'intérêt de cette méthode pour le monitorage épidémique en temps réel et la planification des mesures, notamment lorsque les données de surveillance complètes ne sont pas disponibles

Alors que la santé publique continue de faire face à de nouveaux défis liés aux maladies infectieuses émergentes, améliorer la précision des prévisions épidémiques reste une priorité critique. Cette recherche apporte des éléments prometteurs qui pourraient renforcer les capacités prédictives et notre niveau de préparation aux futures épidémies

Cette approche offre une contribution qui va au-delà de l'épidémiologie, en apportant un éclairage sur la manière de traiter les données incomplètes ou imparfaites dans la modélisation par réseaux. Le manque d'information est un enjeu majeur non seulement pour le suivi des maladies infectieuses, mais aussi dans des secteurs tels que la propagation de la désinformation, les prévisions économiques ou le suivi environnemental. Le succès de l'adaptation du débruitage par VT à la modélisation épidémique souligne son potentiel en tant qu'outil versatile pour l'extraction de motifs significatifs à partir de données rares et peu fiables.

Référence

Donnat, C., Klopp, O., & Verzelen, N. (2024). One-Bit Total Variation Denoising over Networks with Applications to Partially Observed Epidemics. arXiv preprint arXiv:2405.00619.

Suivez nous sur les réseaux