I. Les trois mesures de tendance centrale
Une mesure de tendance centrale est un nombre unique qui résume l'ensemble d'une série statistique en donnant une valeur « typique » ou « centrale ». Il en existe trois principales, chacune répondant à une question différente.
Sensible aux valeurs extrêmes.
Robuste aux valeurs extrêmes.
Peut être multiple ou inexistant.
Relation empirique — pas une loi exacte.
II. La moyenne arithmétique — définition et propriétés
Pour toute série, \(\displaystyle\sum_{i=1}^{k} n_i(x_i - \bar{x}) = 0\).
Preuve :
\(\sum n_i(x_i-\bar{x}) = \sum n_i x_i - \bar{x}\sum n_i = N\bar{x} - \bar{x}\cdot N = 0 \quad \square\)
Interprétation : la moyenne est le "point d'équilibre" de la série. Si on plaçait des masses \(n_i\) sur une règle aux positions \(x_i\), la règle serait en équilibre en \(\bar{x}\). C'est pourquoi la moyenne est aussi appelée le centre de gravité de la série.
La moyenne de la série transformée est la transformation de la moyenne.
Si les valeurs sont grandes, on peut centrer et réduire : choisir un pivot \(a\) et calculer \(d_i = x_i - a\). La moyenne est alors \(\bar{x} = a + \bar{d}\), et \(\bar{d}\) est plus facile à calculer sur des petits nombres.
Exemple : pour calculer la moyenne de 1 503, 1 507, 1 512, 1 498, 1 510, on pose \(a=1\,500\) et on calcule la moyenne de 3, 7, 12, -2, 10, qui est \(\bar{d}=6\). Donc \(\bar{x}=1\,506\). Beaucoup plus rapide que de sommer les cinq grands nombres !
III. Moyenne sur données groupées en classes
Quand les données sont regroupées en classes, on ne connaît pas les valeurs individuelles exactes. On utilise le centre de classe \(c_i\) comme représentant de toutes les valeurs dans cette classe.
IV. La médiane — définition rigoureuse
La médiane est la valeur qui partage la série ordonnée en deux parties de même effectif. Sa définition précise dépend de la parité de \(N\).
La médiane a une propriété d'optimalité remarquable : parmi tous les points \(c\), c'est la médiane qui minimise la somme \(\displaystyle\sum_{i=1}^N |x_i - c|\).
La moyenne, elle, minimise la somme des carrés des déviations : \(\displaystyle\sum_{i=1}^N (x_i - c)^2\).
C'est cette différence (valeur absolue vs carré) qui explique pourquoi la médiane est robuste aux outliers : si une valeur est très loin, elle contribue peu à \(\sum|x_i-c|\) en proportion — mais contribue beaucoup à \(\sum(x_i-c)^2\), ce qui "tire" la moyenne vers elle.
V. Le mode
Le mode est la valeur (ou la classe) qui apparaît le plus fréquemment. Pour les données discrètes, c'est la valeur d'effectif maximal. Pour les données groupées en classes, c'est la classe modale (celle de fréquence maximale), et le mode estimé se calcule par la méthode des aires.
VI. Comparaison et choix de la bonne mesure
Gauche : distribution symétrique — les trois mesures coïncident. Droite : distribution asymétrique à droite — les trois mesures divergent.
VII. Exemples travaillés
Les notes d'un devoir de 15 élèves d'un lycée de Ouagadougou sont :
6, 8, 12, 14, 10, 12, 16, 8, 12, 18, 10, 14, 12, 6, 10
Tableau récapitulatif :
| Valeur \(x_i\) | Effectif \(n_i\) | \(n_i x_i\) |
|---|---|---|
| 6 | 2 | 12 |
| 8 | 2 | 16 |
| 10 | 3 | 30 |
| 12 | 4 | 48 |
| 14 | 2 | 28 |
| 16 | 1 | 16 |
| 18 | 1 | 18 |
| Total | 15 | 168 |
Moyenne :
\(\bar{x} = \dfrac{168}{15} = 11{,}2\)
Mode : la valeur 12 a l'effectif maximal (\(n=4\)) → \(\text{Mo} = 12\)
Médiane : \(N=15\) impair → médiane = \(x_{(8)}\) (la 8ème valeur dans la série ordonnée).
Série ordonnée : 6,6,8,8,10,10,10,12,12,12,12,14,14,16,18
La 8ème valeur est 12 → \(\text{Me}=12\)
Utiliser le tableau de précipitations de la Leçon 1 pour estimer la moyenne.
| Classe | Centre \(c_i\) | Effectif \(n_i\) | \(n_i c_i\) |
|---|---|---|---|
| [400;500[ | 450 | 4 | 1 800 |
| [500;700[ | 600 | 8 | 4 800 |
| [700;900[ | 800 | 10 | 8 000 |
| [900;1100[ | 1000 | 6 | 6 000 |
| [1100;1300[ | 1200 | 2 | 2 400 |
| Total | — | 30 | 23 000 |
\(\bar{x} = \dfrac{23\,000}{30} \approx \mathbf{766{,}7}\) mm
La médiane était 760 mm (Leçon 1). La moyenne est légèrement supérieure, ce qui indique une légère asymétrie à droite dans les données de précipitations.
Les températures moyennes mensuelles (en °C) à Ouagadougou sur un an sont :
27,4 ; 30,1 ; 33,8 ; 36,2 ; 35,4 ; 32,1 ; 29,5 ; 28,8 ; 30,6 ; 32,0 ; 29,7 ; 27,1
Calculer la moyenne en posant \(d_i = x_i - 30\).
Déviations \(d_i = x_i-30\) : −2,6 ; 0,1 ; 3,8 ; 6,2 ; 5,4 ; 2,1 ; −0,5 ; −1,2 ; 0,6 ; 2,0 ; −0,3 ; −2,9
\(\sum d_i = -2{,}6+0{,}1+3{,}8+6{,}2+5{,}4+2{,}1-0{,}5-1{,}2+0{,}6+2{,}0-0{,}3-2{,}9 = 12{,}7\)
\(\bar{d} = \dfrac{12{,}7}{12} \approx 1{,}058\)
\(\bar{x} = 30 + \bar{d} \approx 30 + 1{,}058 = \mathbf{31{,}06}°C\)
La température moyenne annuelle à Ouagadougou est d'environ 31,1°C.
Dans un lycée de Bobo-Dioulasso, deux classes passent l'examen :
Classe A : 32 élèves, moyenne 13,5 sur 20.
Classe B : 28 élèves, moyenne 11,8 sur 20.
Calculer la moyenne générale des deux classes réunies.
\(\bar{x}_{\text{total}} = \dfrac{32\times13{,}5+28\times11{,}8}{32+28} = \dfrac{432+330{,}4}{60} = \dfrac{762{,}4}{60} \approx \mathbf{12{,}71}\)
Erreur fréquente : \(\frac{13{,}5+11{,}8}{2} = 12{,}65\) ≠ 12,71. On ne peut pas faire la moyenne des moyennes si les groupes n'ont pas le même effectif !
VIII. Application concrète ⭐
Une enquête compare les revenus mensuels (en milliers de FCFA) dans deux quartiers :
Quartier Gounghin (quartier populaire) — 10 ménages :
45, 52, 48, 60, 55, 47, 51, 58, 53, 49
Quartier Ouaga 2000 (quartier aisé) — 10 ménages :
85, 120, 95, 850, 110, 78, 92, 105, 88, 97
- a) Calculer la moyenne et la médiane de chaque quartier.
- b) Laquelle des deux mesures représente mieux le "revenu typique" dans chaque cas ? Pourquoi ?
- c) Si on fusionne les deux quartiers en un seul échantillon, calculer la moyenne globale.
- d) Le mode existe-t-il dans ces deux séries ? Que nous dit cette absence ?
a) Gounghin :
\(\bar{x}_G = \frac{45+52+48+60+55+47+51+58+53+49}{10} = \frac{518}{10} = \mathbf{51{,}8}\) mille FCFA
Série ordonnée : 45,47,48,49,51,52,53,55,58,60. \(N=10\) pair :
\(\text{Me}_G = \frac{51+52}{2} = \mathbf{51{,}5}\) mille FCFA ≈ moyenne. Distribution symétrique.
Ouaga 2000 :
\(\bar{x}_O = \frac{85+120+95+850+110+78+92+105+88+97}{10} = \frac{1720}{10} = \mathbf{172}\) mille FCFA
Série ordonnée : 78,85,88,92,95,97,105,110,120,850.
\(\text{Me}_O = \frac{95+97}{2} = \mathbf{96}\) mille FCFA
b) Analyse :
Pour Gounghin : moyenne ≈ médiane → les deux sont bonnes. La distribution est symétrique.
Pour Ouaga 2000 : la moyenne (172) est tirée vers le haut par le ménage à 850 000 FCFA. La médiane (96) représente mieux le revenu typique — 9 ménages sur 10 gagnent moins de 120 000 FCFA.
c) Moyenne globale (20 ménages) :
\(\bar{x}_{\text{total}} = \frac{N_G\bar{x}_G+N_O\bar{x}_O}{N_G+N_O} = \frac{10\times51{,}8+10\times172}{20} = \frac{518+1720}{20} = \frac{2238}{20} = \mathbf{111{,}9}\)
d) Mode : Aucune valeur ne se répète dans les deux séries → pas de mode. Cela est typique des données continues ou des petits échantillons. L'absence de mode n'est pas un problème — simplement, aucune valeur n'est "typique" au sens de la répétition.
✏️ Exercices d'application
Pour la série de données suivante (nombre de sacs de mil par ménage dans un village du Sahel) :
3, 5, 2, 7, 4, 5, 3, 8, 5, 4, 6, 3, 5, 2, 9, 4, 5, 3, 6, 4
- a) Construire le tableau effectifs/fréquences.
- b) Calculer la moyenne, la médiane et le mode.
- c) Vérifier que la somme des écarts à la moyenne est nulle.
b) \(\sum n_i x_i=4+12+16+25+12+7+8+9=93\). \(\bar{x}=93/20=4{,}65\).
Série ordonnée, \(N=20\) pair : Me = moy. 10ème et 11ème valeurs. Les 10 premières : 2,2,3,3,3,3,4,4,4,4 → 10ème = 4, 11ème = 5. Me \(=(4+5)/2=4{,}5\).
Mode : 5 (effectif 5, le maximum). Mo = 5.
c) \(\sum n_i(x_i-4{,}65)=2(-2{,}65)+4(-1{,}65)+4(-0{,}65)+5(0{,}35)+2(1{,}35)+1(2{,}35)+1(3{,}35)+1(4{,}35)\)
\(=-5{,}3-6{,}6-2{,}6+1{,}75+2{,}7+2{,}35+3{,}35+4{,}35=0\) ✓
La production de coton (en kg/ha) dans 40 exploitations des Hauts-Bassins :
| Classe [kg/ha] | [600;800[ | [800;1000[ | [1000;1200[ | [1200;1400[ | [1400;1600] |
|---|---|---|---|---|---|
| Effectif | 5 | 12 | 14 | 7 | 2 |
- a) Calculer la moyenne par les centres de classes.
- b) Calculer la médiane par interpolation.
- c) Identifier la classe modale et estimer le mode.
\(\sum n_i c_i = 5\times700+12\times900+14\times1100+7\times1300+2\times1500=3500+10800+15400+9100+3000=41800\).
\(\bar{x}=41800/40=\mathbf{1045}\) kg/ha.
b) Fréquences cum : 0,125 ; 0,425 ; 0,775 ; 0,950 ; 1,000. Classe médiane : [1000;1200[ (F de 0,425 à 0,775).
Me = \(1000+\frac{0{,}5-0{,}425}{0{,}35}\times200=1000+\frac{0{,}075}{0{,}35}\times200=1000+42{,}9\approx\mathbf{1043}\) kg/ha.
c) Classe modale : [1000;1200[ (\(n=14\)). Mode estimé ≈ centre = \(\mathbf{1100}\) kg/ha.
- a) Une classe de 25 élèves a une moyenne de 12,4 au premier devoir. Deux élèves absents ont des notes de 8 et 15 au deuxième passage. Quelle est la nouvelle moyenne des 27 élèves ?
- b) Les salaires mensuels (en milliers FCFA) de 5 employés d'une entreprise de Koudougou sont 95, 110, 85, 125, 130. Si le patron accorde une augmentation de 8 000 FCFA à tous, quelle est la nouvelle moyenne ?
- c) Si à la place il accorde une augmentation de 5 % à tous, quelle est la nouvelle moyenne ?
b) Moyenne actuelle : \((95+110+85+125+130)/5=545/5=109\) mille FCFA. Augmentation de 8 000 FCFA = 8 mille FCFA à chacun → nouvelle moyenne = \(109+8=\mathbf{117}\) mille FCFA. (Propriété : \(\overline{x+b}=\bar{x}+b\).)
c) Augmentation de 5 % : \(y=1{,}05x\). Nouvelle moyenne = \(1{,}05\times109=\mathbf{114{,}45}\) mille FCFA. (Propriété : \(\overline{ax}=a\bar{x}\).)
Au marché central de Ouagadougou, les prix (en FCFA) de 12 pagnes traditionnels sont :
2500, 3000, 2800, 4500, 2600, 3200, 15000, 2900, 3100, 2700, 3300, 2750
- a) Calculer la moyenne et la médiane.
- b) Le pagne à 15 000 FCFA est un article de luxe exceptionnel. Que se passe-t-il si on le retire ? Recalculer les deux mesures.
- c) Quelle mesure recommandez-vous pour indiquer le "prix typique" d'un pagne ?
\(\bar{x}=48350/12\approx\mathbf{4029}\) FCFA.
Série ordonnée : 2500,2600,2700,2750,2800,2900,3000,3100,3200,3300,4500,15000.
Me = \((2900+3000)/2=\mathbf{2950}\) FCFA.
b) Sans le pagne de luxe : somme = 48350-15000 = 33350, \(\bar{x}=33350/11\approx\mathbf{3032}\) FCFA.
Médiane : série ordonnée de 11 → 6ème valeur = 2900. Me = \(\mathbf{2900}\) FCFA.
La moyenne change de 4029 à 3032 (−25 %), la médiane change peu (2950→2900).
c) La médiane (≈ 2950 FCFA) est recommandée : elle est robuste à la valeur extrême de 15 000 FCFA et représente mieux le prix habituel.
Une étude nutritionnelle dans la ville de Dori (Sahel) analyse la consommation de céréales (en kg/personne/mois) dans 30 ménages :
| Classe [kg] | [5;10[ | [10;15[ | [15;20[ | [20;25[ | [25;30] |
|---|---|---|---|---|---|
| Effectif | 4 | 9 | 11 | 4 | 2 |
- a) Calculer la consommation moyenne par personne par mois.
- b) Calculer la médiane par interpolation et interpréter.
- c) Le seuil minimal recommandé est de 15 kg/personne/mois. Quel pourcentage de ménages n'atteint pas ce seuil ?
- d) Si la consommation de chaque ménage augmente de 20 % grâce à un programme alimentaire, quelle sera la nouvelle moyenne ?
\(\sum n_i c_i=4(7{,}5)+9(12{,}5)+11(17{,}5)+4(22{,}5)+2(27{,}5)=30+112{,}5+192{,}5+90+55=480\).
\(\bar{x}=480/30=\mathbf{16}\) kg/pers./mois.
b) f : 0,133 ; 0,300 ; 0,367 ; 0,133 ; 0,067. F : 0,133 ; 0,433 ; 0,800 ; 0,933 ; 1,000.
Classe médiane : [15;20[ (F de 0,433 à 0,800).
Me = \(15+\frac{0{,}5-0{,}433}{0{,}367}\times5=15+\frac{0{,}067}{0{,}367}\times5\approx15+0{,}91=\mathbf{15{,}9}\) kg/pers./mois.
La moitié des ménages consomment moins de 15,9 kg par mois.
c) Ménages sous 15 kg : classes [5;10[ et [10;15[ → \(4+9=13\) ménages sur 30 = 43,3 %.
d) Augmentation de 20 % : \(\bar{y}=1{,}20\times\bar{x}=1{,}20\times16=\mathbf{19{,}2}\) kg/pers./mois.
À retenir
- Moyenne : \(\bar{x}=\frac{\sum n_i x_i}{N}\) — centre de gravité, minimise \(\sum(x_i-c)^2\), sensible aux outliers.
- Médiane : valeur centrale de la série ordonnée — minimise \(\sum|x_i-c|\), robuste aux outliers.
- Mode : valeur ou classe la plus fréquente — peut être multiple ou absent.
- Distribution symétrique : Moyenne = Médiane = Mode. Asymétrique droite : Mode < Médiane < Moyenne.
- Linéarité : \(\overline{ax+b}=a\bar{x}+b\) — utiliser un pivot pour simplifier les calculs.
- Moyenne pondérée : \(\bar{x}=\frac{N_1\bar{x}_1+N_2\bar{x}_2}{N_1+N_2}\) — ne jamais faire la moyenne des moyennes sans pondérer par les effectifs !
- Données groupées : utiliser les centres de classes pour la moyenne.
- Choisir la bonne mesure : médiane pour revenus/prix (données asymétriques), moyenne pour notes/températures (données symétriques).