I. L'idée de la probabilité conditionnelle
Quand on sait qu'un événement \(B\) s'est déjà réalisé, l'espace des possibilités se réduit à \(B\). La probabilité d'un autre événement \(A\) sachant que \(B\) est réalisé s'appelle la probabilité conditionnelle de \(A\) sachant \(B\).
Imagine que tu tires une carte dans un jeu de 52 cartes. La probabilité d'obtenir un roi est \(4/52=1/13\). Mais si quelqu'un te dit "la carte est rouge", les possibilités se réduisent à 26 cartes rouges, dont 2 sont des rois. La probabilité conditionnelle est \(2/26=1/13\) — la même ! Les rois sont indépendants de la couleur.
En revanche, si on te dit "la carte est un as ou un roi", il y a 8 telles cartes (4 as + 4 rois), dont 4 rois. La probabilité d'un roi sachant "as ou roi" est \(4/8=1/2\) — très différente de \(1/13\). Cette information est pertinente.
La probabilité conditionnelle quantifie précisément comment une information nouvelle modifie notre évaluation d'un événement.
II. Définition et formule de multiplication
Si \(B\) est réalisé, l'univers se réduit à \(B\). Dans ce nouvel univers, la probabilité de \(A\) est la proportion de \(B\) qui est aussi dans \(A\), soit \(A\cap B\). Pour que cette "probabilité réduite" satisfasse les axiomes de Kolmogorov (en particulier \(P(B\mid B)=1\)), on normalise par \(P(B)\) :
\(P(A\mid B) = \frac{P(A\cap B)}{P(B)}\) — l'unique définition compatible avec les axiomes \(\square\)
Vérification : \(P(B\mid B)=P(B\cap B)/P(B)=P(B)/P(B)=1\) ✓ et \(P(\emptyset\mid B)=0/P(B)=0\) ✓
III. Formule des probabilités totales
Quand on ne peut pas calculer directement \(P(A)\) mais qu'on peut le décomposer à travers une partition de l'univers, on utilise la formule des probabilités totales.
Si \(B_1, B_2, \ldots, B_k\) forment une partition de \(\Omega\) (mutuellement exclusifs et exhaustifs : \(\bigcup B_i=\Omega\), \(B_i\cap B_j=\emptyset\)), alors :
\[P(A) = \sum_{i=1}^{k} P(A\mid B_i)\times P(B_i)\]
Puisque les \(B_i\) partitionnent \(\Omega\), les événements \(A\cap B_i\) partitionnent \(A\) :
\(A = (A\cap B_1)\cup(A\cap B_2)\cup\cdots\cup(A\cap B_k)\) — réunion disjointe
Par l'additivité des probabilités sur les incompatibles :
\(P(A) = \sum_i P(A\cap B_i) = \sum_i P(A\mid B_i)\times P(B_i) \quad \square\)
IV. Formule de Bayes
La formule de Bayes permet de "remonter" des effets vers les causes : connaissant la probabilité que l'effet \(A\) soit produit par la cause \(B_i\), elle donne la probabilité que la cause soit \(B_i\) sachant qu'on a observé \(A\).
La formule de Bayes est l'outil fondamental du raisonnement sous incertitude. Elle formalise comment une observation (\(A\)) met à jour notre évaluation de la probabilité d'une hypothèse (\(B_j\)).
En médecine : \(B_1\) = "patient malade", \(B_2\) = "patient sain", \(A\) = "test positif". On calcule \(P(B_1\mid A)\) = probabilité d'être vraiment malade sachant un test positif — ce qui intègre la prévalence de la maladie et la précision du test.
Au Burkina : \(B_1\) = "saison des pluies", \(A\) = "ciel nuageux". Les agriculteurs du Sahel utilisent intuitivement Bayes : sachant les nuages (observation), ils révisent leur estimation de la probabilité de pluie.
V. Arbres de probabilité — lecture et construction
Un arbre de probabilité représente graphiquement une expérience aléatoire à plusieurs étapes. Chaque branche porte la probabilité de la transition. La probabilité d'un chemin est le produit des probabilités sur ce chemin (formule de multiplication). La probabilité d'un événement est la somme des chemins menant à cet événement (formule des probabilités totales).
Arbre de dépistage paludisme — produit sur chaque chemin, somme pour les événements finaux
VI. Exemples travaillés
Dans une classe de Terminale de Ouagadougou, 60 % des élèves ont révisé (R) et 40 % n'ont pas révisé (\(\bar{R}\)). Parmi ceux qui ont révisé, 80 % réussissent (S). Parmi ceux qui n'ont pas révisé, 30 % réussissent.
Formule des probabilités totales :
\(P(S)=P(S\mid R)\times P(R)+P(S\mid\bar{R})\times P(\bar{R})\)
\(=0{,}80\times0{,}60+0{,}30\times0{,}40=0{,}48+0{,}12=\mathbf{0{,}60}\)
Formule de Bayes — P(R | S) : Sachant qu'un élève a réussi, quelle est la probabilité qu'il ait révisé ?
\(P(R\mid S)=\dfrac{P(S\mid R)\times P(R)}{P(S)}=\dfrac{0{,}80\times0{,}60}{0{,}60}=\dfrac{0{,}48}{0{,}60}=\mathbf{0{,}80}\)
Interprétation : 80 % des élèves qui ont réussi avaient révisé.
En utilisant l'arbre ci-dessus (P(M)=0,15, sensibilité=0,95, spécificité=0,90) :
P(T+) par les probabilités totales :
\(P(T+)=P(T+\mid M)\times P(M)+P(T+\mid S)\times P(S)\)
\(=0{,}95\times0{,}15+0{,}10\times0{,}85=0{,}1425+0{,}0850=0{,}2275\)
Valeur prédictive positive (VPP) — formule de Bayes :
\(P(M\mid T+)\) = probabilité d'être vraiment malade sachant test positif :
\(P(M\mid T+)=\dfrac{P(T+\mid M)\times P(M)}{P(T+)}=\dfrac{0{,}1425}{0{,}2275}\approx\mathbf{0{,}626}\)
Malgré un test très précis (95 % sensibilité, 90 % spécificité), si la maladie est rare (15 %), un test positif n'est vrai que dans 62,6 % des cas — c'est le paradoxe du test de dépistage !
Une urne contient 5 boules rouges (R) et 3 boules bleues (B). On tire 2 boules successivement sans remise.
Arbre :
1er tirage : P(R₁) = 5/8, P(B₁) = 3/8.
2ème tirage sachant R₁ : P(R₂|R₁) = 4/7 (4 R restantes sur 7), P(B₂|R₁) = 3/7.
2ème tirage sachant B₁ : P(R₂|B₁) = 5/7, P(B₂|B₁) = 2/7.
P(R₁ ∩ R₂) :
\(P(R_1\cap R_2)=\frac{5}{8}\times\frac{4}{7}=\frac{20}{56}=\frac{5}{14}\)
P(une rouge et une bleue) :
\(P=(R_1\cap B_2)\text{ ou }(B_1\cap R_2)=\frac{5}{8}\times\frac{3}{7}+\frac{3}{8}\times\frac{5}{7}=\frac{15}{56}+\frac{15}{56}=\frac{30}{56}=\frac{15}{28}\)
VII. Indépendance de deux événements
Deux événements \(A\) et \(B\) sont indépendants si la réalisation de l'un ne modifie pas la probabilité de l'autre. C'est une propriété symétrique.
VIII. Application concrète ⭐
La SOFITEX (Société Burkinabè des Fibres Textiles) contrôle la qualité des semences de coton. Une machine produit des semences de deux origines :
- 60 % proviennent de la variété A (\(V_A\)) et 40 % de la variété B (\(V_B\))
- Parmi les semences \(V_A\) : 5 % sont défectueuses
- Parmi les semences \(V_B\) : 12 % sont défectueuses
- a) Construire l'arbre de probabilité complet.
- b) Calculer la probabilité qu'une semence choisie au hasard soit défectueuse.
- c) Sachant qu'une semence est défectueuse, quelle est la probabilité qu'elle provienne de la variété B ? (Formule de Bayes)
- d) Deux semences sont tirées indépendamment. Calculer la probabilité qu'exactement une soit défectueuse.
b) Probabilité qu'une semence soit défectueuse (D) :
\(P(D)=P(D\mid V_A)\times P(V_A)+P(D\mid V_B)\times P(V_B)\)
\(=0{,}05\times0{,}60+0{,}12\times0{,}40=0{,}030+0{,}048=\mathbf{0{,}078}\)
7,8 % des semences sont défectueuses.
c) Probabilité que la semence défectueuse vienne de \(V_B\) — Bayes :
\(P(V_B\mid D)=\dfrac{P(D\mid V_B)\times P(V_B)}{P(D)}=\dfrac{0{,}048}{0{,}078}=\dfrac{48}{78}=\dfrac{8}{13}\approx\mathbf{61{,}5\%}\)
Bien que \(V_B\) ne représente que 40 % de la production, elle est responsable de 61,5 % des défauts — car son taux de défaut est plus de deux fois supérieur à celui de \(V_A\).
d) Exactement une défectueuse sur deux tirages indépendants :
\(P(D)=0{,}078\) et \(P(\bar{D})=0{,}922\).
\(P(\text{exactement 1})=P(D_1\cap\bar{D}_2)+P(\bar{D}_1\cap D_2)\)
\(=0{,}078\times0{,}922+0{,}922\times0{,}078=2\times0{,}078\times0{,}922\approx\mathbf{0{,}1438}\approx14{,}4\%\)
✏️ Exercices d'application
On sait que \(P(A)=0{,}4\), \(P(B)=0{,}5\) et \(P(A\cap B)=0{,}2\).
- a) Calculer \(P(A\mid B)\) et \(P(B\mid A)\).
- b) A et B sont-ils indépendants ? Justifier.
- c) Calculer \(P(A\cup B)\) et \(P(\bar{A}\mid B)\).
b) \(P(A)\times P(B)=0{,}4\times0{,}5=0{,}2=P(A\cap B)\) → A et B sont indépendants. (Et on remarque que \(P(A\mid B)=P(A)\) ✓.)
c) \(P(A\cup B)=0{,}4+0{,}5-0{,}2=\mathbf{0{,}7}\). \(P(\bar{A}\mid B)=1-P(A\mid B)=1-0{,}4=\mathbf{0{,}6}\).
Dans une mine artisanale de la région de Koudougou, les ouvriers viennent de deux villages : 70 % du village A et 30 % du village B. Les ouvriers du village A ont 15 % de chances d'être en retard le lundi, contre 25 % pour ceux du village B.
- a) Quelle est la probabilité qu'un ouvrier choisi au hasard soit en retard le lundi ?
- b) Un ouvrier est en retard. Quelle est la probabilité qu'il vienne du village A ?
b) \(P(A\mid R)=\frac{0{,}105}{0{,}180}=\frac{105}{180}=\frac{7}{12}\approx\mathbf{58{,}3\%}\).
On lance deux dés équilibrés. Soit \(A\) = "la somme est 7" et \(B\) = "le premier dé donne 4".
- a) Calculer \(P(A)\) et \(P(B)\).
- b) Calculer \(P(A\cap B)\).
- c) A et B sont-ils indépendants ?
b) "Somme 7 et premier dé = 4" → (4,3) uniquement. \(P(A\cap B)=1/36\).
c) \(P(A)\times P(B)=\frac{1}{6}\times\frac{1}{6}=\frac{1}{36}=P(A\cap B)\) → A et B sont indépendants. Intuitivement : savoir que le premier dé donne 4 ne change pas la probabilité que la somme soit 7.
Un inspecteur sanitaire visite deux marchés de Ouagadougou : Rood Woko (R) et Pissy (P). Il visite Rood Woko avec probabilité 0,6 et Pissy avec probabilité 0,4. À Rood Woko, il trouve une infraction avec probabilité 0,35. À Pissy, avec probabilité 0,20.
- a) Quelle est la probabilité qu'il trouve une infraction lors de sa visite ?
- b) Sachant qu'il a trouvé une infraction, quelle est la probabilité qu'il soit à Rood Woko ?
- c) Sachant qu'il n'a pas trouvé d'infraction, quelle est la probabilité qu'il soit à Pissy ?
b) \(P(R\mid I)=\frac{0{,}210}{0{,}290}=\frac{21}{29}\approx\mathbf{72{,}4\%}\).
c) \(P(\bar{I})=1-0{,}290=0{,}710\). \(P(P\cap\bar{I})=0{,}80\times0{,}4=0{,}320\). \(P(P\mid\bar{I})=0{,}320/0{,}710\approx\mathbf{45{,}1\%}\).
Dans la région du Centre-Nord burkinabè pendant la saison des pluies, 20 % de la population est infectée par le paludisme. Un test rapide a une sensibilité de 90 % (P(T+|malade) = 0,90) et une spécificité de 85 % (P(T−|sain) = 0,85).
- a) Calculer P(T+) — la probabilité qu'un habitant testé au hasard soit positif.
- b) Calculer la Valeur Prédictive Positive (VPP) = P(malade | T+).
- c) Calculer la Valeur Prédictive Négative (VPN) = P(sain | T−).
- d) Si le programme de santé teste 10 000 personnes, combien de faux positifs (sains mais T+) sont attendus ?
a) \(P(T+)=0{,}90\times0{,}20+0{,}15\times0{,}80=0{,}180+0{,}120=\mathbf{0{,}300}\). 30 % des personnes testées seront positives.
b) VPP = \(P(M\mid T+)=\frac{0{,}180}{0{,}300}=0{,}60=\mathbf{60\%}\). Un résultat positif correspond à un vrai cas dans 60 % des situations.
c) \(P(T-)=1-0{,}300=0{,}700\). \(P(S\cap T-)=0{,}85\times0{,}80=0{,}680\). VPN = \(0{,}680/0{,}700\approx\mathbf{97{,}1\%}\). Un résultat négatif est rassurant.
d) Faux positifs = P(S∩T+) × 10 000 = 0,120 × 10 000 = 1 200 personnes saines mais diagnostiquées positives.
À retenir
- Probabilité conditionnelle : \(P(A\mid B)=P(A\cap B)/P(B)\) — probabilité de \(A\) dans l'univers réduit à \(B\).
- Formule de multiplication : \(P(A\cap B)=P(B)\times P(A\mid B)\).
- Probabilités totales : \(P(A)=\sum_i P(A\mid B_i)\times P(B_i)\) pour toute partition \((B_i)\).
- Bayes : \(P(B_j\mid A)=P(A\mid B_j)\times P(B_j)/P(A)\) — remonter des effets vers les causes.
- Arbre : produit sur chaque chemin, somme des chemins menant à l'événement.
- Indépendance : \(P(A\cap B)=P(A)\times P(B)\) — la réalisation de l'un n'affecte pas l'autre.
- \(P(A\mid B)\neq P(B\mid A)\) — ne jamais inverser les conditionnements !
- Paradoxe du test : même un test très précis peut avoir une faible VPP si la maladie est rare.