Les statistiques au temps de Covid-19

Les statistiques au temps de Covid-19

La propagation du Covid-19 a mis le monde entier sous une pression sans précédent. Dans ce contexte, toute méthode pouvant donner des prévisions fiables sur le développement de la pandémie est une aide précieuse. Les données sur le développement du Covid-19 des différents pays sont analysées pour essayer de prédire ce à quoi nous pouvons nous attendre. 

Dès le tout début de l’épidémie du Covid-19, les scientifiques ont commencé à parler de la croissance exponentielle du nombre des malades. Cette croissance implique que le nombre de personnes infectées double toujours après la même période, ce qui mène très vite à des chiffres alarmants. Dans de nombreux pays, comme en France, les gens vivent un confinement avec des restrictions strictes. L’objectif est de ralentir cette croissance exponentielle. Sans ces restrictions, la croissance sera-t-elle toujours exponentielle ? Clairement, non. Si une grande partie de la population est ou a déjà été contaminée, cette croissance va ralentir : elle va d’abord devenir linéaire et, plus tard, s’arrêter complètement. 

La croissance exponentielle dépend du taux de reproduction de base, appelé R0, c’est-à-dire le nombre moyen de personnes infectées par un malade.  Ce taux est actuellement estimé aux environs de 2,5 pour le Covid-19 . Si le taux de reproduction est supérieure à 1, l’épidémie croît exponentiellement. Donc pour l’arrêter ou au moins la ralentir, il faut réduire ce taux et le ramener à une valeur inférieure ou égale à 1. En réalité, si on suppose que les personnes déjà infectées sont immunisées, le taux effectif de reproduction dépend  de la proportion r de gens qui ont été déjà contaminés : il est égal à R0(1−r). Plus il y a de personnes immunisées, moins le taux de reproduction est important. Donc l’épidémie cesse de progresser lorsque R0(1−r) descend en dessous de 1.  Si on suppose que le taux de reproduction de base actuel est de 2,5, il faudra que 60 % de la population soit immunisée ce qui semble un chiffre beaucoup trop élevé étant donnée les estimations actuelles du taux de létalité du Covid-19. Avec ce modèle on voit que la question de la sortie du confinement s’avère délicate. S’il n’y a pas une bonne immunité du groupe, c’est-à-dire  la proportion r assez élevée, et qu’il reste un nombre non-négligeable de malades, la croissance exponentielle risque de repartir.

De façon générale, les modèles utilisés pour les prédictions de l’évolution des épidémies sont bien connus depuis assez longtemps. Ils se basent sur des équations différentielles décrivant l’évolution du nombre de personnes saines, exposées, infectées et remises. Une fois les  paramètres de base estimés, ces modèles sont capables de produire des prédictions sur les dimensions et la durée possible de l’épidémie. Il est à noter que ces modèles sont une simplification de la réalité : ils ne prennent pas en compte beaucoup de facteurs qui peuvent influencer la propagation d’un virus comme, par exemple, la façon dont les gens interagissent. Les prédictions fournies par ces modèles sont utiles uniquement si on a de bonnes estimations pour les paramètres de base. Quelle est la situation dans le cas de Covid-19 ? Malheureusement, pour certains paramètres clés les estimations disponibles sont assez floues. 

Prenons l’exemple du taux de létalité et de la proportion des personnes contaminées (le taux de morbidité). Ces deux paramètres sont essentiels pour prédire l’évolution d’une épidémie et le nombre probable de victimes. Les estimations fiables de ces deux paramètres se heurtent au problème des données incomplètes pour le nombre des décès et le nombre des personnes contaminées. En réalité, on ne sait pas combien de personnes ont été contaminées par le Covid-19 et combien de personnes en sont mortes.  Les chiffres qui sont publiés correspondent au nombre des personnes décédées après avoir reçu un diagnostic de Covid-19 positif ou lorsqu'un diagnostic post-mortem est effectué. Toutes les morts causées par le Covid-19 ne lui sont pas forcément attribuées : par exemple, le test peut ne pas avoir été effectué ou avoir donné un faux négatif. 

D’autre part, la dynamique du nombre de personnes contaminées est cruciale pour déterminer le taux de reproduction et le taux de létalité. Un des facteurs importants d’ignorance sur cette dynamique sont les cas asymptomatiques ou à symptômes très faibles qui échappent aux statistiques disponibles. La faible ampleur du dépistage en France rend ces données très incertaines. Le problème est que, même pour des projections de quelques semaines, un écart de quelques points peut donner des résultats très différents. Or, pour concevoir des stratégies adéquates de sortie du confinement, il faudra des résultats fiables. Avoir des données qui reflètent la réalité de cette pandémie est une urgence.

Une solution sera de procéder à des tests aléatoires quotidiens dans la population pour obtenir une idée plus réaliste du nombre de personnes contaminées et de son évolution. Cette solution s’avère assez difficile à mettre en place dans les conditions du confinement et à cause du nombre limité de tests disponibles. Il faudra trouver des solutions innovantes pour recueillir des données épidémiologiques pour répondre aux défis soulevés par la pandémie du Covid-19 qui seront, sans doute, à l’origine de nouveaux développements dans la méthodologie des études épidémiologiques.

Suivez nous sur les réseaux