Exploration des statistiques et interpréter des caractéristiques
1. Introduction aux caractéristiques statistiques
Dans ce cours, nous allons explorer les différentes caractéristiques statistiques qui permettent de résumer et d'interpréter des données. Ces mesures nous aident à comprendre la distribution et la dispersion des données. Les principales caractéristiques que nous allons aborder sont :
1️⃣ La moyenne (tendance centrale)
2️⃣ La médiane (valeur centrale)
3️⃣ L'étendue (mesure de dispersion)
✅ Exemple concret : Ces mesures sont utilisées quotidiennement, par exemple pour analyser les notes d'une classe, les salaires dans une entreprise ou les températures mensuelles.
2. Moyenne
La moyenne est une mesure de tendance centrale qui représente la valeur moyenne d'une série de données. Elle est sensible aux valeurs extrêmes.
Formule :
\[ \text{Moyenne} = \frac{\sum x_i}{n} \]
où \( x_i \) représente chaque valeur et \( n \) le nombre total de valeurs.
✅ Exemple : Notes d'un étudiant sur 5 contrôles : 12, 14, 15, 11, 13
Moyenne = (12 + 14 + 15 + 11 + 13)/5 = 65/5 = 13
Cas particulier : Si un étudiant a 0 à un contrôle, cela fera baisser significativement sa moyenne, montrant la sensibilité de cette mesure aux valeurs extrêmes.
3. Médiane
La médiane est la valeur qui sépare une série de données en deux parties égales. Contrairement à la moyenne, elle est peu sensible aux valeurs extrêmes.
1️⃣ Si le nombre de valeurs est impair, la médiane est la valeur du milieu.
2️⃣ Si le nombre de valeurs est pair, la médiane est la moyenne des deux valeurs du milieu.
Cas particulier : Même avec une note extrême (par exemple 0), la médiane change peu : 0, 12, 13, 14, 15 → Médiane = 13
4. Étendue
L'étendue est une mesure simple de dispersion qui indique l'amplitude des données. Plus l'étendue est grande, plus les données sont dispersées.
Formule :
\[\text{Étendue} = \text{Valeur max} - \text{Valeur min} \]
✅ Exemple 2 : Salaires dans une entreprise : 1500€, 1600€, 1700€, 1800€, 5000€
Étendue = 5000 - 1500 = 3500€ (forte dispersion due au dernier salaire)
Limite : L'étendue ne tient compte que des valeurs extrêmes et ignore la distribution des autres valeurs.
5. Interpréter des caractéristiques d'une série
L'interprétation conjointe de ces mesures donne une vision complète des données :
1️⃣ Moyenne vs Médiane : Si moyenne > médiane, la distribution est étirée vers la droite (valeurs hautes). Si moyenne < médiane, elle est étirée vers la gauche.
2️⃣ Étendue : Une grande étendue indique des valeurs extrêmes ou une grande variabilité.
✅ Exemple concret :
Salaire moyen dans une entreprise = 2500€, Médiane = 2000€, Étendue = 4000€
→ Quelques salaires très élevés tirent la moyenne vers le haut alors que la majorité des employés gagnent autour de 2000€.
6. Comparer deux séries statistiques
La comparaison de séries nécessite d'examiner plusieurs indicateurs :
✅ Exemple : Comparaison de deux classes
Mesure
Classe A
Classe B
Moyenne
12/20
12/20
Médiane
12/20
13/20
Étendue
4 (10-14)
10 (5-15)
Interprétation :
1️⃣ Même moyenne mais classe B plus hétérogène (grande étendue)
2️⃣ Médiane plus élevée en B suggère que plus d'élèves ont des notes au-dessus de 12
7. Conclusion
Ces outils statistiques de base sont complémentaires :
1️⃣ La moyenne donne le centre de gravité
2️⃣ La médiane montre la valeur centrale
3️⃣ L'étendue indique la variabilité
Application : Dans une étude réelle, on les utilise ensemble pour avoir une vision complète. Par exemple, pour analyser des revenus, on regarde à la fois le salaire moyen (mais sensible aux très hauts revenus), le salaire médian (plus représentatif) et l'étendue (inégalités).
Exercice 1: ★ ★ ★ ☆ ☆
Calculez la moyenne des notes suivantes : 12, 15, 14, 10, 18.
Pour calculer la moyenne des notes, nous devons suivre ces étapes :
Étape 1 : Additionner toutes les notes
Nous commençons par ajouter toutes les notes ensemble :
12 + 15 + 14 + 10 + 18 = 69
Étape 2 : Compter le nombre de notes
Il y a 5 notes au total.
Étape 3 : Calculer la moyenne
Nous divisons la somme des notes par le nombre total de notes :
Moyenne = 69 / 5 = 13,8
Ainsi, la moyenne des notes est 13,8.
Exercice 2: ★ ★ ★ ★ ☆
Un élève a obtenu les notes suivantes en mathématiques : 8, 9, 10, 12, 15. Quelle est sa moyenne ?
Pour trouver la moyenne des notes, nous allons procéder comme suit :
Étape 1 : Additionner les notes
Calculons la somme des notes :
8 + 9 + 10 + 12 + 15 = 54
Étape 2 : Compter le nombre de notes
Le nombre de notes est 5.
Étape 3 : Calculer la moyenne
Divisons la somme par le nombre de notes :
Moyenne = 54 / 5 = 10,8
La moyenne des notes est donc 10,8.
Exercice 3: ★ ★ ★ ★ ★
Les températures en degrés Celsius pendant une semaine étaient les suivantes : 20, 22, 19, 21, 23, 24, 18. Calculez la moyenne des températures.
Pour calculer la moyenne des températures, nous suivons ces étapes :
Étape 1 : Additionner toutes les températures
Calculons la somme :
20 + 22 + 19 + 21 + 23 + 24 + 18 = 147
Étape 2 : Compter le nombre de jours
Il y a 7 jours.
Étape 3 : Calculer la moyenne
Divisons la somme par le nombre de jours :
Moyenne = 147 / 7 = 21
La moyenne des températures est de 21 °C.
Exercice 4: ★ ★ ★ ☆ ☆
Un professeur a noté un devoir de la manière suivante : 16, 14, 15, 13, 17, 12. Quelle est la moyenne des notes ?
Pour calculer la moyenne, nous exécutons les étapes suivantes :
Étape 1 : Additionner toutes les notes
Calculez la somme :
16 + 14 + 15 + 13 + 17 + 12 = 87
Étape 2 : Compter le nombre de notes
Il y a 6 notes.
Étape 3 : Calculer la moyenne
Divisons la somme par le nombre de notes :
Moyenne = 87 / 6 = 14,5
La moyenne des notes est donc 14,5.
Exercice 5: ★ ★ ★ ★ ☆
Les scores d'un jeu vidéo pour cinq parties sont : 250, 300, 350, 200, 400. Calculez la moyenne des scores.
Pour trouver la moyenne des scores, nous procédons comme suit :
Étape 1 : Additionner tous les scores
Calculons la somme :
250 + 300 + 350 + 200 + 400 = 1500
Étape 2 : Compter le nombre de parties
Il y a 5 parties.
Étape 3 : Calculer la moyenne
Divisons la somme par le nombre de parties :
Moyenne = 1500 / 5 = 300
La moyenne des scores est donc 300.
Exercice 1: ★ ★ ★ ☆ ☆
Déterminez la médiane des notes suivantes : 12, 15, 10, 18, 14.
Pour trouver la médiane, suivez ces étapes :
Étape 1 : Trier les données
Les notes triées par ordre croissant sont : 10, 12, 14, 15, 18.
Étape 2 : Identifier la position de la médiane
Le nombre de notes est impair (5). La médiane est donc la valeur du milieu, qui est la troisième note.
Ainsi, la médiane est 14.
Exercice 2: ★ ★ ★ ★ ☆
Calculez la médiane des valeurs suivantes : 8, 9, 10, 12, 15, 7.
Pour trouver la médiane, nous allons procéder ainsi :
Étape 1 : Trier les données
Les valeurs triées sont : 7, 8, 9, 10, 12, 15.
Étape 2 : Identifier la position de la médiane
Le nombre de valeurs est pair (6). La médiane est la moyenne des deux valeurs du milieu (9 et 10).
Calculons :
Médiane = (9 + 10) / 2 = 19 / 2 = 9,5
La médiane est donc 9,5.
Exercice 3: ★ ★ ★ ★ ★
Trouvez la médiane des âges suivants : 22, 25, 20, 30, 18, 24, 26.
Pour calculer la médiane :
Étape 1 : Trier les âges
Les âges triés sont : 18, 20, 22, 24, 25, 26, 30.
Étape 2 : Identifier la position de la médiane
Le nombre d'âges est impair (7). La médiane est la quatrième valeur.
Ainsi, la médiane est 24.
Exercice 4: ★ ★ ★ ☆ ☆
Calculez la médiane des prix suivants : 50, 20, 30, 40.
Pour trouver la médiane :
Étape 1 : Trier les prix
Les prix triés sont : 20, 30, 40, 50.
Étape 2 : Identifier la position de la médiane
Le nombre de prix est pair (4). La médiane est la moyenne des deux valeurs du milieu (30 et 40).
Calculons :
Médiane = (30 + 40) / 2 = 70 / 2 = 35
La médiane est donc 35.
Exercice 5: ★ ★ ★ ★ ☆
Déterminez la médiane des notes suivantes : 15, 17, 19, 20, 22, 18.
Pour calculer la médiane :
Étape 1 : Trier les notes
Les notes triées sont : 15, 17, 18, 19, 20, 22.
Étape 2 : Identifier la position de la médiane
Le nombre de notes est pair (6). La médiane est la moyenne des deux valeurs du milieu (18 et 19).
Calculons :
Un élève de Terminale a obtenu les notes suivantes en mathématiques ce trimestre : 12, 15, 14, 10, 18.
1. Calculez sa moyenne
2. Déterminez la médiane
3. Analysez la régularité de ses résultats
4. Si l'élève veut atteindre 15 de moyenne, quelle note minimale doit-il obtenir au prochain devoir ?
Analyse complète des résultats
1. Calcul de la moyenne
Somme des notes : 12 + 15 + 14 + 10 + 18 = 69
Nombre de notes : 5
Moyenne = 69 ÷ 5 = 13,8/20
2. Détermination de la médiane
Notes triées : 10, 12, 14, 15, 18
Médiane = 14 (valeur centrale)
3. Analyse de la régularité
Étendue : 18 - 10 = 8 points
Écart type (approximatif) : ≈2,8 points
Interprétation : Des résultats irréguliers avec une note faible (10) et une excellente note (18)
4. Objectif de moyenne 15
Nouvelle somme nécessaire pour 6 devoirs : 15 × 6 = 90
Note à obtenir : 90 - 69 = 21/20 → impossible
Solution : Il faudrait deux excellents résultats pour compenser
Conclusion : L'élève a des résultats corrects (13,8) mais irréguliers. Pour progresser, il devrait travailler sa constance et viser au moins 14 à chaque devoir.
Exercice 2: ★ ★ ★ ★ ☆
Une étude démographique donne les âges des participants à un festival : 22, 25, 19, 30, 28 ans.
1. Calculez la médiane et la moyenne
2. Déterminez l'étendue
3. Si on ajoute un participant de 65 ans, comment évoluent ces indicateurs ?
4. Quel indicateur est le plus représentatif ?
Analyse démographique
1. Calcul des indicateurs initiaux
Indicateur
Calcul
Valeur
Moyenne
(22+25+19+30+28)/5
24,8 ans
Médiane
19,22,25,28,30 → 25
25 ans
Étendue
30 - 19
11 ans
2. Impact d'un participant de 65 ans
Indicateur
Avant
Après
Moyenne
24,8
(124+65)/6≈31,5
Médiane
25
(25+28)/2=26,5
Étendue
11
65-19=46
3. Discussion sur la représentativité
La moyenne est très sensible aux valeurs extrêmes (+6,7 ans)
La médiane résiste mieux (+1,5 ans seulement)
Dans ce cas, la médiane est plus représentative de la majorité des participants
Conclusion : La population initiale est jeune (médiane 25 ans). L'ajout d'une personne âgée modifie significativement la moyenne mais peu la médiane, confirmant que cette dernière est plus robuste pour décrire le groupe majoritaire.
Exercice 3: ★ ★ ★ ★ ★
Une station météo enregistre ces températures quotidiennes : 18°C, 20°C, 22°C, 19°C, 21°C.
1. Calculez l'étendue et l'écart type
2. Comparez avec une autre semaine ayant même moyenne mais des valeurs : 15°C, 17°C, 25°C, 23°C, 20°C
3. Quelle semaine a le climat le plus stable ?
4. Calculez la médiane pour les deux semaines
Analyse climatique comparative
1. Semaine A (18,20,22,19,21)
Moyenne : 20°C
Étendue : 22-18=4°C
Écart type : ≈1,4°C
Médiane : 20°C
2. Semaine B (15,17,25,23,20)
Moyenne : 20°C (identique)
Étendue : 25-15=10°C
Écart type : ≈3,7°C
Médiane : 20°C
3. Comparaison de stabilité
Critère
Semaine A
Semaine B
Étendue
4°C
10°C
Écart type
1,4°C
3,7°C
Variation max/jour
2°C
8°C (entre J2-J3)
4. Interprétation des médianes
Même médiane (20°C) pour les deux semaines
Cela montre que malgré des extrêmes différents, le milieu de distribution est identique
Conclusion : La semaine A présente un climat beaucoup plus stable avec des variations journalières faibles (étendue 4°C vs 10°C). Bien que moyenne et médiane soient identiques, l'écart type révèle une nette différence de régularité thermique.
Exercice 4: ★ ★ ★ ☆ ☆
Les résultats (sur 20) à un test de mathématiques pour 6 élèves : 14, 16, 12, 18, 20, 15.
1. Calculez moyenne, médiane et étendue
2. Identifiez les quartiles Q1 et Q3
3. Quel pourcentage d'élèves a plus que la moyenne ?
4. Si le professeur arrondit les notes à l'entier supérieur, comment évolue la moyenne ?
Analyse pédagogique détaillée
1. Indicateurs de base
Notes triées : 12,14,15,16,18,20
Moyenne : 95/6≈15,83
Médiane : (15+16)/2=15,5
Étendue : 20-12=8
2. Calcul des quartiles
Q1 (25%) : 14
Q3 (75%) : 18
Intervalle interquartile : 18-14=4
3. Répartition par rapport à la moyenne
Notes >15,83 : 16,18,20 → 3 élèves
Pourcentage : 3/6=50%
Paradoxe apparent : la moyenne ne sépare pas exactement la moitié car non égale à la médiane
Nouvelle moyenne : (14+16+12+18+20+15)/6=95/6≈15,83 (inchangée)
Exception : si 15,83 était une note individuelle arrondie à 16
Conclusion : La classe montre une distribution équilibrée (médiane 15,5) avec une moyenne de 15,83. 50% des élèves dépassent la moyenne, ce qui suggère un bon niveau général mais avec des écarts modérés (étendue 8 points). L'intervalle interquartile de 4 points montre que 50% des notes sont concentrées entre 14 et 18.
Exercice 5: ★ ★ ★ ★ ☆
Un magasin enregistre ces ventes mensuelles (en unités) : 200, 250, 300, 150, 400.
1. Calculez médiane et moyenne
2. Déterminez l'étendue et l'écart interquartile
3. Si la marge est de 10€ par unité, quel chiffre d'affaires médian ?
4. Proposez des explications pour la valeur extrême
Analyse commerciale approfondie
1. Indicateurs de ventes
Ventes triées : 150,200,250,300,400
Moyenne : 1300/5=260 unités
Médiane : 250 unités
2. Mesures de dispersion
Étendue : 400-150=250
Q1 : 200 ; Q3 : 300
Écart interquartile : 300-200=100
3. Chiffre d'affaires médian
Ventes médianes : 250 unités
CA médian : 250×10€=2500€
Comparaison avec CA moyen : 260×10€=2600€
4. Analyse des valeurs extrêmes
Vente à 400 pourrait s'expliquer par :
Une promotion exceptionnelle
Une saisonnalité (Noël, soldes)
Un achat groupé
Une erreur de saisie
La vente à 150 pourrait correspondre à :
Une rupture de stock
Une période de fermeture
Une baisse de demande
Conclusion : L'activité montre une médiane de 250 ventes/mois, inférieure à la moyenne (260), signe d'une distribution étirée vers les hautes valeurs. L'écart interquartile de 100 unités indique une variabilité modérée hors valeurs extrêmes. Le pic à 400 unités mériterait une investigation pour en comprendre l'origine et éventuellement le reproduire.
Exercice 1: ★ ★ ★ ☆ ☆
Considérez les séries suivantes représentant les notes de deux classes différentes : Série A (Classe de français) : 12, 15, 14, 10, 18 Série B (Classe de mathématiques) : 14, 16, 15, 13, 17
1. Calculez et comparez les moyennes des deux séries
2. Quelle classe a globalement mieux réussi ? Justifiez
Étape 1 : Calcul des moyennes
Série A :
Somme des valeurs : 12 + 15 + 14 + 10 + 18 = 69
Nombre d'élèves : 5
Calcul : Moyenne = 69 ÷ 5 = 13,8
Série B :
Somme des valeurs : 14 + 16 + 15 + 13 + 17 = 75
Nombre d'élèves : 5
Calcul : Moyenne = 75 ÷ 5 = 15
Étape 2 : Comparaison et interprétation
Différence entre les moyennes : 15 - 13,8 = 1,2 points
La série B a une moyenne significativement plus élevée
En pourcentage : (15-13,8)/13,8 × 100 ≈ 8,7% d'écart
Conclusion : La classe de mathématiques (Série B) a globalement mieux réussi avec une moyenne de 15/20 contre 13,8/20 pour le français. L'écart de 1,2 points représente une différence notable de 8,7%.
Exercice 2: ★ ★ ★ ★ ☆
On mesure les températures quotidiennes dans deux villes différentes : Série C (Ville côtière) : 5°C, 7°C, 9°C, 8°C, 6°C Série D (Ville continentale) : 3°C, 4°C, 5°C, 6°C, 2°C
1. Déterminez les médianes des deux séries
2. Quelle ville a les températures généralement plus élevées ?
3. Calculez également l'étendue pour chaque série
1. Calcul des médianes
Série C :
Tri des valeurs : 5, 6, 7, 8, 9
Nombre impair de valeurs → médiane = valeur centrale
Médiane = 7°C
Série D :
Tri des valeurs : 2, 3, 4, 5, 6
Nombre impair de valeurs → médiane = valeur centrale
Médiane = 4°C
2. Comparaison des températures
La ville côtière (Série C) a une médiane plus élevée (7°C vs 4°C)
Cela signifie que 50% du temps, la température y est supérieure à 7°C contre seulement 4°C pour la ville continentale
3. Calcul des étendues (bonus)
Série C : 9 - 5 = 4°C
Série D : 6 - 2 = 4°C
Les deux villes ont la même amplitude thermique sur cette période
Conclusion : La ville côtière présente des températures généralement plus élevées (médiane +3°C) avec la même variabilité que la ville continentale.
Exercice 3: ★ ★ ★ ★ ★
Un laboratoire compare la durée de vie (en mois) de deux modèles d'ampoules : Série E (Modèle économique) : 22, 25, 20, 30, 18 Série F (Modèle premium) : 28, 35, 25, 32, 30
1. Calculez l'étendue pour chaque série
2. Quel modèle offre la meilleure garantie de durée de vie ?
3. Calculez aussi les moyennes pour une analyse complète
1. Calcul des étendues
Série E :
Valeur max = 30 mois, min = 18 mois
Étendue = 30 - 18 = 12 mois
Série F :
Valeur max = 35 mois, min = 25 mois
Étendue = 35 - 25 = 10 mois
2. Analyse comparative
Le modèle premium a une durée de vie minimale plus élevée (25 vs 18 mois)
L'étendue plus faible (10 vs 12 mois) indique une meilleure régularité
Le modèle premium a une durée maximale supérieure (35 vs 30 mois)
3. Calcul des moyennes (approfondissement)
Série E : (22+25+20+30+18)/5 = 115/5 = 23 mois
Série F : (28+35+25+32+30)/5 = 150/5 = 30 mois
Écart moyen : 7 mois en faveur du premium
Conclusion : Le modèle premium offre de meilleures performances avec une durée de vie moyenne plus longue (30 vs 23 mois), une durée minimale garantie plus élevée et une meilleure régularité (étendue plus faible).
Exercice 4: ★ ★ ★ ☆ ☆
Comparaison des salaires annuels (en k€) dans deux services d'une entreprise : Série G (Marketing) : 100, 90, 85, 95 Série H (Production) : 80, 85, 90, 75, 95
1. Comparez les moyennes salariales
2. Calculez les médianes
3. Quel service semble le plus avantageux ? Y a-t-il des limites à cette analyse ?
1. Comparaison des moyennes
Série G :
Somme : 100 + 90 + 85 + 95 = 370 k€
Nombre : 4 salariés
Moyenne = 370 ÷ 4 = 92,5 k€
Série H :
Somme : 80 + 85 + 90 + 75 + 95 = 425 k€
Nombre : 5 salariés
Moyenne = 425 ÷ 5 = 85 k€
2. Calcul des médianes
Série G (triée) : 85, 90, 95, 100 → médiane = (90+95)/2 = 92,5 k€
Série H (triée) : 75, 80, 85, 90, 95 → médiane = 85 k€
3. Analyse critique
Le service Marketing a des indicateurs supérieurs (moyenne et médiane plus élevées)
Mais l'effectif est différent (4 vs 5 personnes) et les données sont limitées
Pour une analyse complète, il faudrait connaître :
L'ancienneté des employés
Les postes exacts (cadres/non-cadres)
Les éventuels avantages en nature
Conclusion : Selon les données disponibles, le Marketing semble plus avantageux avec un salaire moyen de 92,5 k€ contre 85 k€ en Production. Cependant, cette analyse mériterait d'être approfondie avec des données complémentaires.
Exercice 5: ★ ★ ★ ★ ☆
Étude comparative du nombre de clients quotidiens dans deux magasins : Série I (Magasin centre-ville) : 5, 7, 9, 10, 12 (centaines) Série J (Magasin périphérie) : 6, 8, 10, 11, 9 (centaines)
1. Comparez les médianes
2. Calculez les moyennes et étendues
3. Quel magasin semble avoir la clientèle la plus stable ?
1. Comparaison des médianes
Série I (triée) : 5, 7, 9, 10, 12 → médiane = 9 (centaines)
Le magasin de périphérie a une étendue plus faible (5 vs 7)
Son minimum est plus élevé (6 vs 5) et son maximum plus bas (11 vs 12)
Ces indicateurs suggèrent une clientèle plus stable
Conclusion : Bien que les deux magasins aient la même médiane (900 clients/jour), le magasin de périphérie présente une clientèle plus stable avec des variations journalières moins importantes (étendue de 500 contre 700 clients).