Dans la revue Lancet Public Health, les chercheurs affirment qu'au 11 mai 2020, 5,7 % des adultes français avaient déjà été infectés par le Covid-19. (Source : https://www.thelancet.com/journals/lanpub/article/PIIS2468-2667 (21) 00064-5/fulltext)
On se servira de cette donnée pour les parties A et B de cet exercice.
Partie A
On prélève un individu dans la population française adulte au 11 mai 2020.
On note I l'événement : « l'adulte a déjà été infecté par le Covid-19 ».
Quelle est la probabilité que cet individu prélevé ait déjà été infecté par le Covid-19 ?
On sait que 5,7 % des adultes ont déjà été infectés.
Donc la probabilité que l'individu choisi ait déjà été infecté est de P (I ) =\dfrac{5{,}7}{100} = 0{,}057.
La probabilité que cet individu prélevé ait déjà été infecté par le Covid-19 est égale à 0,057.
On prélève un échantillon de 100 personnes de la population supposées choisies de façon indépendante les unes des autres.
On assimile ce prélèvement à un tirage avec remise.
On appelle X la variable aléatoire qui compte le nombre de personnes ayant déjà été infectées.
Quelle loi suit la variable aléatoire X ?
On a une épreuve de Bernoulli, dont le succès : « l'individu choisi a déjà été infecté » a une probabilité p = 0{,}057.
On répète cette épreuve 100 fois.
On sait que prélèvement des 100 individus est assimilé à un tirage avec remise.
Par conséquent, l'épreuve est répétée 100 fois de manière identique et indépendante.
X est une variable aléatoire qui compte le nombre de succès parmi ces répétitions.
On en déduit que la variable aléatoire X suit la loi binomiale de paramètres N = 100 et p = 0{,}057.
La variable aléatoire X suit la loi binomiale de paramètres N = 100 et p = 0{,}057.
Quelle est l'espérance mathématique de X ?
On sait que X la loi binomiale de paramètres N = 100 et p = 0{,}057.
Son espérance est donc égale à :
E(X)=np=100 \times 0{,}057=5{,}7
L'espérance mathématique de X est égale à 5,7.
Comment peut-on interpréter l'espérance de X ?
On sait que l'espérance mathématique de X est égale à 5,7.
Cela signifie que dans un échantillon de 100 personnes, en moyenne 5,7 d'entre elles avaient déjà été infectées.
Dans un échantillon de 100 personnes adultes choisies au sein de la population française le 11 mai 2020, en moyenne 5,7 d'entre elles avaient déjà été infectées par le Covid-19.
Quelle est la probabilité qu'il n'y ait aucune personne infectée dans l'échantillon ?
On veut calculer la probabilité qu'il n'y ait aucune personne infectée dans l'échantillon.
Autrement dit, on veut calculer P(X=0).
Or, on sait que X suit la loi binomiale de paramètres N = 100 et p = 0{,}057.
On a donc pour tout entier naturel k :
P(X=k)=\begin{pmatrix} 100 \cr\cr k \end{pmatrix} 0{,}057^k (1-0{,}057)^{100-k}
Par conséquent :
P(X=0)=\begin{pmatrix} 100 \cr\cr 0 \end{pmatrix} 0{,}057^0 (1-0{,}057)^{100-0}=0{,}943^{100} \approx 0{,}0028.
La probabilité qu'il n'y ait aucune personne infectée dans l'échantillon est d'environ 0,0028.
Quelle est la probabilité qu'il y ait au moins 2 personnes infectées dans l'échantillon ?
On veut calculer la probabilité qu'il y ait au moins 2 personnes infectées dans l'échantillon.
Autrement dit, on veut calculer P(X \geqslant 2).
On a :
P(X \geqslant 2) = 1 - P(X \lt 2)= 1 - (P(X=0)+P(X=1))
Or, on sait que X suit la loi binomiale de paramètres N = 100 et p = 0{,}057.
On a donc pour tout entier naturel k :
P(X=k)=\begin{pmatrix} 100 \cr\cr k \end{pmatrix} 0{,}057^k (1-0{,}057)^{100-k}
On déjà calculé P(X=0).
On calcule P(X=1) :
P(X=1)=\begin{pmatrix} 100 \cr\cr 1 \end{pmatrix} 0{,}057^1 (1-0{,}057)^{100-1}=100 \times 0{,}057 \times 0{,}943^{99} \approx 0{,}0171.
On obtient ainsi :
1 - (P(X=0)+P(X=1)) \approx 1 - 0{,}0028 - 0{,}171 = 0{,}9801
On en conclut que :
P(X \geqslant 2) \approx 0{,}9801
La probabilité qu'il y ait au moins 2 personnes infectées dans l'échantillon est d'environ 0,9801.
Quel est le plus petit entier n tel que P (X \leqslant n) \gt 0{,}9 ?
Avec la calculatrice, on obtient successivement :
- P (X \leqslant 1) \approx 0{,}0199
- P (X \leqslant 2) \approx 0{,}071
- P (X \leqslant 3) \approx 0{,}1719
- P (X \leqslant 4) \approx 0{,}3199
- P (X \leqslant 5) \approx 0{,}4915
- P (X \leqslant 6) \approx 0{,}6558
- P (X \leqslant 7) \approx 0{,}7892
- P (X \leqslant 8) \approx 0{,}8829
- P (X \leqslant 9) \approx 0{,}9408
On observe que P (X \leqslant 8) \lt 0{,}9 et que P (X \leqslant 9) \gt 0{,}9.
On en déduit que le plus petit entier n tel que P (X \leqslant n) \gt 0{,}9 est 9.
Le plus petit entier n tel que P (X \leqslant n) \gt 0{,}9 est 9.
Comment interpréter la réponse à la question précédente ?
« Le plus petit entier n tel que P (X \leqslant n) \gt 0{,}9 est 9 » s'interprète de la manière suivante :
Dans un échantillon de 100 adultes de la population française choisis le 11 mai 2020, il y a une probabilité supérieure à 0,9 qu'au plus 9 d'entre eux aient été infectés par le Covid-19.
Partie B
Un test a été mis en place : celui-ci permet de déterminer (même longtemps après l'infection) si une personne a ou non déjà été infectée par le Covid-19. Si le test est positif, cela signifie que la personne a déjà été infectée par le Covid-19.
Deux paramètres permettent de caractériser ce test : sa sensibilité et sa spécificité.
La sensibilité d'un test est la probabilité qu'il soit positif sachant que la personne a été infectée par la maladie. (II s'agit donc d'un vrai positif.)
La spécificité d'un test est la probabilité que le test soit négatif sachant que la personne n'a pas été infectée par la maladie. (II s'agit donc d'un vrai négatif.)
Le fabricant du test fournit les caractéristiques suivantes :
- Sa sensibilité est de 0,8.
- Sa spécificité est de 0,99.
On prélève un individu soumis au test dans la population française adulte au 11 mai 2020.
On note T l'événement « le test réalisé est positif ».
Quel arbre de probabilités modélise la situation ?
On sait que :
P(I)=0{,}057
On en déduit que :
P(\overline{I})=1-0{,}057=0{,}943
On sait par ailleurs que :
La probabilité que le test soit positif sachant que la personne a été infectée par la maladie est de 0,8.
Autrement dit, on a :
P_I(T)=0{,}8
On en déduit que :
P_I(\overline{T})=1-0{,}8=0{,}2
On sait également que :
La probabilité que le test soit négatif sachant que la personne n'a pas été infectée par la maladie est de 0,99.
Autrement dit, on a :
P_{\overline{I}}(\overline{T})=0{,}99
On en déduit que :
P_{\overline{I}}(T)=1-0{,}99=0{,}01
L'arbre de probabilités qui modélise la situation est le suivant :

Combien vaut P(T) ?
D'après la formule des probabilités totales, on a :
P(T)=P(I \cap T)+P(\overline{I} \cap T)
Or, on a :
- P(I \cap T)=P_I(T) \times P(I) = 0{,}8 \times 0{,}057=0{,}0456
- P(\overline{I} \cap T )=P_\overline{I}(T) \times P(\overline{I}) = 0{,}01 \times 0{,}943=0{,}00943
On en déduit que :
P(T)=0{,}0456+0{,}00943=0{,}05503
P(T) est égale à 0,05503.
Quelle est la probabilité qu'un individu ait été infecté sachant que son test est positif ?
On cherche la probabilité qu'un individu ait été infecté sachant que son test est positif.
Autrement dit, on cherche à calculer P_T(I).
On a :
P_T(I)=\dfrac{P(I \cap T)}{P(T)}
Or :
- P(I \cap T)=0{,}0456
- P(T)=0{,}055 03
On en déduit que :
P_T(I)=\dfrac{0{,}0456}{0{,}05503} \approx 0{,}8286
La probabilité qu'un individu ait été infecté sachant que son test est positif est d'environ 0,8286.
Partie C
On considère un groupe d'une population d'un autre pays soumis au même test de sensibilité 0,8 et de spécificité 0,99.
Dans ce groupe, la proportion d'individus ayant un test positif est de 29,44 %.
On choisit au hasard un individu de ce groupe.
Quelle est la probabilité qu'il ait été infecté ?
On cherche à calculer la probabilité que l'individu ait été infecté.
Autrement dit, on cherche à calculer P(I).
On sait par hypothèse que le test est le même.
Sa sensibilité et sa spécificité sont les mêmes.
Seule la probabilité d'avoir été préalablement infecté est modifiée.
Cette probabilité n'est pas connue. On la note x.
On a donc l'arbre de probabilités suivant :

D'après la formule des probabilités totales, on a :
P(T)=P(I \cap T)+P(\overline{I} \cap T)
Or, on a :
- P(I \cap T)=P_I(T) \times P(I) = 0{,}8 \times x=0{,}8x
- P(\overline{I} \cap T )=P_\overline{I}(T) \times P(\overline{I}) = 0{,}01 \times (1-x)
On en déduit que :
P(T)=0{,}8x+0{,}01 \times (1-x)=0{,}79x+0{,}01
Par ailleurs, on sait par hypothèse que 29,44 % des gens ont un test positif.
Autrement dit :
P(T)=0{,}2944
On obtient ainsi l'équation d'inconnue x suivante :
0{,}79x+0{,}01=0{,}2944
Cette équation a pour solution :
x=\dfrac{0{,}2844}{0{,}79}=0{,}36
On en conclut que :
P(I)=0{,}36
Si on choisit au hasard un individu de ce groupe, la probabilité qu'il ait été infecté est de 0,36.