Éducation nationale françaiseSpécialité SESTerminale générale18 min de lecture

Médiane, écart-type

Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.

Lecture

5 chapitres

Un parcours éditorialisé et navigable.

Pratique

12 questions

Quiz et cartes mémoire à ouvrir après la lecture.

Objectif

Terminale générale

Format rapide pour vérifier si le chapitre correspond.

Chapitre 1

Introduction aux Statistiques Descriptives

Qu'est-ce que la statistique descriptive ?

La statistique descriptive est une branche des statistiques qui a pour objectif de décrire, de synthétiser et de présenter les caractéristiques principales d'un ensemble de données. Elle ne cherche pas à faire des prédictions ou des inférences sur une population plus large (cela relève de la statistique inférentielle), mais plutôt à rendre les données plus compréhensibles et interprétables.

Objectifs de la statistique descriptive :

  • Résumer de grandes quantités d'informations.
  • Visualiser les tendances et les modèles.
  • Identifier les caractéristiques clés des données.

Types de données :

  • Données quantitatives : Mesurables numériquement.
    • Discrètes : Peuvent être comptées (ex: nombre d'enfants, nombre de voitures).
    • Continues : Peuvent prendre n'importe quelle valeur dans un intervalle (ex: taille, poids, revenu).
  • Données qualitatives : Décrivent des qualités ou des catégories, non mesurables numériquement (ex: couleur des yeux, catégorie socio-professionnelle).

Population, échantillon et variables

En statistique, il est essentiel de distinguer les concepts de population et d'échantillon.

  • La population statistique est l'ensemble de toutes les unités (individus, objets, événements) sur lesquelles porte l'étude. C'est le groupe entier que nous souhaitons comprendre. Ex: tous les lycéens de France.
  • Un échantillon représentatif est un sous-ensemble de la population, choisi de manière à refléter au mieux les caractéristiques de cette population. Il est étudié lorsque la population est trop grande pour être analysée en totalité. Ex: 1000 lycéens de France sélectionnés aléatoirement.

Une variable est une caractéristique ou un attribut que l'on mesure ou observe sur les unités de la population ou de l'échantillon.

  • Variables discrètes : Prennent un nombre fini ou dénombrable de valeurs. Ex: nombre de pièces dans un logement.
  • Variables continues : Peuvent prendre une infinité de valeurs dans un intervalle donné. Ex: temps de trajet pour aller au lycée.

Représentations graphiques des données

Les graphiques sont des outils puissants pour visualiser les données et en tirer des premières observations.

  • Histogrammes : Utilisés pour les variables quantitatives continues. Ils représentent la distribution de fréquences des données regroupées en classes. L'aire de chaque barre est proportionnelle à la fréquence de la classe.
  • Diagrammes en bâtons : Adaptés aux variables quantitatives discrètes ou qualitatives nominales/ordinales. Chaque bâton représente la fréquence ou l'effectif d'une modalité.
  • Boîtes à moustaches (boxplots) : Permettent de visualiser la distribution d'une variable quantitative, en montrant la médiane, les quartiles et les valeurs extrêmes. Très utiles pour la comparaison de distributions.

Chapitre 2

La Médiane : Mesure de Tendance Centrale Robuste

Définition et interprétation de la médiane

La médiane (MeMe) est une mesure de tendance centrale. C'est la valeur qui, une fois les données triées par ordre croissant (ou décroissant), partage la série statistique en deux parties égales. Cela signifie que 50% des observations sont inférieures ou égales à la médiane, et 50% sont supérieures ou égales à la médiane.

Interprétation :

  • C'est la "valeur du milieu".
  • Elle est insensible aux valeurs extrêmes (ou aberrantes), contrairement à la moyenne. Cela en fait un indicateur robuste pour les distributions asymétriques ou avec des valeurs très éloignées du reste des données.

Calcul de la médiane pour une série non groupée

Pour calculer la médiane d'une série de données non groupées, suivez ces étapes :

  1. Ordonner les données par ordre croissant.
  2. Identifier la position de la médiane :
    • Si le nombre d'observations (nn) est impair, la médiane est la valeur située à la position n+12\frac{n+1}{2}.
    • Si le nombre d'observations (nn) est pair, la médiane est la moyenne des deux valeurs centrales, situées aux positions n2\frac{n}{2} et n2+1\frac{n}{2} + 1.

Exemple 1 (n impair) : Série : 10, 12, 15, 18, 20 (n=5n=5)

  1. Ordonnée : 10, 12, 15, 18, 20
  2. Position : 5+12=3eˋme\frac{5+1}{2} = 3^{\text{ème}} position. Médiane = 15

Exemple 2 (n pair) : Série : 10, 12, 15, 18, 20, 22 (n=6n=6)

  1. Ordonnée : 10, 12, 15, 18, 20, 22
  2. Positions : 62=3eˋme\frac{6}{2} = 3^{\text{ème}} et 62+1=4eˋme\frac{6}{2} + 1 = 4^{\text{ème}}. Médiane = 15+182=16,5\frac{15+18}{2} = 16,5

Calcul de la médiane pour une série groupée (par classes)

Lorsque les données sont regroupées en classes, nous ne connaissons pas les valeurs exactes, seulement les intervalles. Le calcul de la médiane est alors une estimation.

  1. Calculer les fréquences cumulées croissantes (ou pourcentages cumulés).

  2. Identifier la classe médiane : C'est la première classe dont la fréquence cumulée (ou pourcentage cumulé) est supérieure ou égale à 50%.

  3. Utiliser la formule d'interpolation linéaire pour estimer la médiane au sein de cette classe :

    Me=Li+(n2Fi1fi)×aiMe = L_i + \left( \frac{\frac{n}{2} - F_{i-1}}{f_i} \right) \times a_i

    Où :

    • LiL_i = borne inférieure de la classe médiane
    • nn = effectif total
    • Fi1F_{i-1} = fréquence cumulée de la classe précédant la classe médiane
    • fif_i = fréquence (non cumulée) de la classe médiane
    • aia_i = amplitude de la classe médiane (Li+1LiL_{i+1} - L_i)

Exemple : Revenus mensuels (en euros)

Classe de revenusEffectif (nin_i)Fréquence cumulée (FiF_i)
[1000 ; 1500[2020
[1500 ; 2000[3050
[2000 ; 2500[4090
[2500 ; 3000[10100
Total100
  1. n=100n=100. La médiane est à la position 1002=50eˋme\frac{100}{2} = 50^{\text{ème}}.
  2. La 50ème observation est dans la classe [1500 ; 2000[. C'est notre classe médiane.
    • Li=1500L_i = 1500
    • Fi1=20F_{i-1} = 20 (fréquence cumulée de la classe précédente)
    • fi=30f_i = 30 (effectif de la classe médiane)
    • ai=20001500=500a_i = 2000 - 1500 = 500
  3. Me=1500+(10022030)×500=1500+(502030)×500=1500+(3030)×500=1500+1×500=2000Me = 1500 + \left( \frac{\frac{100}{2} - 20}{30} \right) \times 500 = 1500 + \left( \frac{50 - 20}{30} \right) \times 500 = 1500 + \left( \frac{30}{30} \right) \times 500 = 1500 + 1 \times 500 = 2000 La médiane estimée est de 2000 €.

Comparaison médiane et moyenne

La moyenne arithmétique (xˉ\bar{x}) est la somme de toutes les valeurs divisée par le nombre d'observations.

CaractéristiqueMoyenne (xˉ\bar{x})Médiane (MeMe)
CalculSomme des valeurs / Nombre de valeursValeur centrale après tri
Sensibilité aux extrêmesTrès sensible aux valeurs extrêmes (aberrantes). Elles peuvent la "tirer" vers elles.Insensible aux valeurs extrêmes. Elle reste stable même avec des valeurs très grandes ou très petites.
Utilisation typiqueDistributions symétriques, absence de valeurs aberrantes.Distributions asymétriques (ex: revenus), présence de valeurs aberrantes.
SignificationLe "centre de gravité" des données.La valeur qui partage la distribution en deux moitiés égales.

Choix de l'indicateur :

  • Si la distribution est symétrique (ex: taille des individus), moyenne et médiane sont souvent très proches. La moyenne est alors un bon indicateur.
  • Si la distribution est asymétrique (ex: revenus, où quelques personnes ont des revenus très élevés), la moyenne sera tirée vers le haut et ne sera pas représentative de la majorité. Dans ce cas, la médiane est un indicateur plus pertinent pour le revenu "typique".

Chapitre 3

L'Écart-type : Mesure de Dispersion Clé

Comprendre la dispersion des données

La dispersion (ou variabilité) des données mesure à quel point les observations sont étalées ou concentrées autour d'une mesure de tendance centrale (généralement la moyenne).

  • Une faible dispersion indique que les données sont très regroupées autour de la moyenne, la série est homogène.
  • Une forte dispersion indique que les données sont très étalées, la série est hétérogène.

Comprendre la dispersion est aussi important que de connaître la tendance centrale. Deux séries peuvent avoir la même moyenne mais des dispersions très différentes, ce qui implique des interprétations très différentes.

Définition et rôle de l'écart-type

L'écart-type (σ\sigma) est la mesure de dispersion la plus couramment utilisée. Il mesure l'écart moyen des observations par rapport à la moyenne arithmétique.

  • Il s'exprime dans la même unité de mesure que les données d'origine, ce qui facilite son interprétation.
  • Un faible écart-type signifie que les données sont proches de la moyenne.
  • Un grand écart-type signifie que les données sont très dispersées autour de la moyenne.

L'écart-type est la racine carrée de la variance (σ2\sigma^2), qui est elle-même la moyenne des carrés des écarts à la moyenne. L'élévation au carré des écarts permet de :

  1. Rendre tous les écarts positifs.
  2. Donner plus de poids aux écarts importants.

Calcul de la variance et de l'écart-type

Le calcul de l'écart-type se fait en plusieurs étapes :

  1. Calculer la moyenne (xˉ\bar{x}) de la série.
  2. Calculer l'écart de chaque observation par rapport à la moyenne (xixˉx_i - \bar{x}).
  3. Élever ces écarts au carré ((xixˉ)2(x_i - \bar{x})^2).
  4. Faire la somme de tous ces carrés des écarts ((xixˉ)2\sum (x_i - \bar{x})^2).
  5. Calculer la variance (σ2\sigma^2) en divisant cette somme par le nombre d'observations (nn) pour une population, ou par (n1n-1) pour un échantillon (pour un estimateur non biaisé). En SES, pour les exercices, on utilise généralement nn. σ2=i=1n(xixˉ)2n\sigma^2 = \frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n}
  6. Calculer l'écart-type (σ\sigma) en prenant la racine carrée de la variance. σ=i=1n(xixˉ)2n\sigma = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n}}

Exemple : Notes d'élèves (sur 20) : 10, 12, 15, 18, 20

  1. Moyenne : xˉ=10+12+15+18+205=755=15\bar{x} = \frac{10+12+15+18+20}{5} = \frac{75}{5} = 15
  2. Écarts à la moyenne :
    • 1015=510-15 = -5
    • 1215=312-15 = -3
    • 1515=015-15 = 0
    • 1815=318-15 = 3
    • 2015=520-15 = 5
  3. Carrés des écarts :
    • (5)2=25(-5)^2 = 25
    • (3)2=9(-3)^2 = 9
    • 02=00^2 = 0
    • 32=93^2 = 9
    • 52=255^2 = 25
  4. Somme des carrés des écarts : 25+9+0+9+25=6825+9+0+9+25 = 68
  5. Variance : σ2=685=13,6\sigma^2 = \frac{68}{5} = 13,6
  6. Écart-type : σ=13,63,69\sigma = \sqrt{13,6} \approx 3,69

Un écart-type de 3,69 signifie qu'en moyenne, les notes s'écartent de 3,69 points par rapport à la moyenne de 15.

Écart-type pour une série groupée

Pour une série groupée en classes avec des fréquences (njn_j), la formule de la variance et de l'écart-type est adaptée :

  1. Calculer le centre de chaque classe (cjc_j).
  2. Calculer la moyenne (xˉ\bar{x}) en utilisant les centres de classe : xˉ=j=1knjcjn\bar{x} = \frac{\sum_{j=1}^{k} n_j c_j}{n}
  3. Calculer la variance : σ2=j=1knj(cjxˉ)2n\sigma^2 = \frac{\sum_{j=1}^{k} n_j (c_j - \bar{x})^2}{n}
  4. Calculer l'écart-type : σ=σ2\sigma = \sqrt{\sigma^2}

Exemple : Reprenons l'exemple des revenus (en milliers d'euros)

Classe de revenusCentre de classe (cjc_j)Effectif (njn_j)njcjn_j c_j(cjxˉ)(c_j - \bar{x})(cjxˉ)2(c_j - \bar{x})^2nj(cjxˉ)2n_j (c_j - \bar{x})^2
[1000 ; 1500[12502025000-6504225008450000
[1500 ; 2000[17503052500-15022500675000
[2000 ; 2500[225040900003501225004900000
[2500 ; 3000[275010275008507225007225000
Total10019500021250000
  1. Moyenne : xˉ=195000100=1950\bar{x} = \frac{195000}{100} = 1950
  2. Variance : σ2=21250000100=212500\sigma^2 = \frac{21250000}{100} = 212500
  3. Écart-type : σ=212500460,98\sigma = \sqrt{212500} \approx 460,98 En moyenne, les revenus s'écartent de 460,98 € de la moyenne de 1950 €.

Chapitre 4

Interprétation et Utilisation Conjointe

Interprétation de l'écart-type

L'écart-type est une mesure de la variabilité absolue des données.

  • Un faible écart-type indique que les valeurs sont concentrées autour de la moyenne. La série est homogène. Les observations sont similaires les unes aux autres.
  • Un fort écart-type indique que les valeurs sont très dispersées autour de la moyenne. La série est hétérogène. Les observations sont très différentes les unes des autres.

Comparaison de séries : L'écart-type est particulièrement utile pour comparer la dispersion de deux ou plusieurs séries de données qui ont la même unité de mesure et des moyennes similaires.

  • Exemple : Deux classes ont la même moyenne de 12/20. La classe A a un écart-type de 2, la classe B un écart-type de 4. La classe A est plus homogène, les notes des élèves sont plus regroupées. La classe B est plus hétérogène, il y a de plus grands écarts entre les élèves (bons et mauvais).

Coefficient de variation

Lorsque l'on souhaite comparer la dispersion de séries ayant des moyennes très différentes ou des unités de mesure différentes, l'écart-type seul n'est pas suffisant. On utilise alors le coefficient de variation (CV).

Le CV est une mesure relative de dispersion. Il est exprimé en pourcentage et permet de comparer la variabilité par rapport à la moyenne.

CV=σxˉ×100CV = \frac{\sigma}{\bar{x}} \times 100

Interprétation :

  • Un CV faible indique une faible variabilité relative.
  • Un CV élevé indique une forte variabilité relative.

Exemple :

  • Salaire moyen d'un PDG : 10 000 €, écart-type : 2 000 €. CV=200010000×100=20%CV = \frac{2000}{10000} \times 100 = 20\%
  • Salaire moyen d'un employé : 2 000 €, écart-type : 500 €. CV=5002000×100=25%CV = \frac{500}{2000} \times 100 = 25\% Malgré un écart-type absolu plus faible, la dispersion relative des salaires des employés est plus grande que celle des PDG.

Médiane et écart-type : quand les utiliser ?

Le choix entre la médiane et la moyenne, et l'utilisation de l'écart-type, dépend fortement de la forme de la distribution des données.

  • Distributions symétriques (en cloche) : La moyenne et la médiane sont très proches. L'écart-type est une excellente mesure de dispersion. Ces distributions sont souvent bien décrites par la moyenne et l'écart-type.
  • Distributions asymétriques (skewed) :
    • Asymétrie positive (étalée vers la droite) : La moyenne est généralement supérieure à la médiane (ex: revenus). La médiane est alors un meilleur indicateur du "centre" de la distribution.
    • Asymétrie négative (étalée vers la gauche) : La moyenne est généralement inférieure à la médiane.
    • Dans ces cas, la médiane est préférée comme mesure de tendance centrale, car elle est moins influencée par les valeurs extrêmes. L'écart-type peut encore être calculé, mais son interprétation doit être prudente car il est très sensible aux valeurs extrêmes qui créent l'asymétrie.
  • Présence de valeurs aberrantes (outliers) : La médiane est robuste face aux valeurs aberrantes, tandis que la moyenne et l'écart-type sont fortement affectés.

En résumé, la médiane est à privilégier pour les données de revenus ou toute distribution asymétrique, tandis que la moyenne et l'écart-type sont plus adaptés aux distributions symétriques.

Applications en sciences économiques et sociales

Les concepts de médiane et d'écart-type sont omniprésents en SES :

  • Inégalités de revenus et de patrimoine : L'analyse des revenus utilise systématiquement la médiane (revenu médian) car la distribution des revenus est fortement asymétrique. L'écart-type, ou des mesures plus sophistiquées comme le coefficient de Gini (qui utilise aussi l'écart à la moyenne), aide à quantifier l'ampleur des inégalités.
  • Dispersion des salaires : Comparer l'écart-type des salaires entre différentes catégories socio-professionnelles permet de juger de l'homogénéité ou de l'hétérogénéité des rémunérations.
  • Analyse de données d'enquêtes : Que ce soit sur le temps de transport, le budget loisirs, le niveau de satisfaction, ces mesures permettent de résumer et de comparer les réponses des sondés.
  • Évolution du PIB par habitant : L'écart-type du PIB par habitant entre pays peut indiquer une convergence ou une divergence économique.

Chapitre 5

Exercices et Études de Cas

Calculs de médiane et d'écart-type sur données réelles

Exemple 1 : Séries non groupées (notes d'une classe) Notes : 8, 10, 12, 12, 14, 15, 16, 18, 19, 20

  1. Ordonner : Déjà fait.
  2. Médiane : n=10n=10 (pair). Positions 102=5\frac{10}{2}=5 et 102+1=6\frac{10}{2}+1=6. Les valeurs sont 14 et 15. Me=14+152=14,5Me = \frac{14+15}{2} = 14,5.
  3. Moyenne : xˉ=8+10+12+12+14+15+16+18+19+2010=14410=14,4\bar{x} = \frac{8+10+12+12+14+15+16+18+19+20}{10} = \frac{144}{10} = 14,4.
  4. Écart-type :
    • (xixˉ)2=(814.4)2+(1014.4)2+...+(2014.4)2=144.4\sum (x_i - \bar{x})^2 = (8-14.4)^2 + (10-14.4)^2 + ... + (20-14.4)^2 = 144.4
    • σ2=144.410=14.44\sigma^2 = \frac{144.4}{10} = 14.44
    • σ=14.44=3.8\sigma = \sqrt{14.44} = 3.8. La médiane (14,5) et la moyenne (14,4) sont très proches, suggérant une distribution relativement symétrique. L'écart-type de 3,8 indique une dispersion modérée des notes.

Exemple 2 : Séries groupées (temps de trajet domicile-travail en minutes)

Temps (min)EffectifFréquence cumuléeCentre de classe
[0 ; 10[15155
[10 ; 20[304515
[20 ; 30[408525
[30 ; 40[109535
[40 ; 50[510045
Total100
  1. Médiane : n=100n=100. n2=50\frac{n}{2}=50. La classe médiane est [20 ; 30[ (car 45 < 50 <= 85). Me=20+(504540)×10=20+(540)×10=20+1.25=21,25Me = 20 + \left( \frac{50 - 45}{40} \right) \times 10 = 20 + \left( \frac{5}{40} \right) \times 10 = 20 + 1.25 = 21,25 minutes.
  2. Moyenne : xˉ=(15×5)+(30×15)+(40×25)+(10×35)+(5×45)100=75+450+1000+350+225100=2100100=21\bar{x} = \frac{(15 \times 5) + (30 \times 15) + (40 \times 25) + (10 \times 35) + (5 \times 45)}{100} = \frac{75 + 450 + 1000 + 350 + 225}{100} = \frac{2100}{100} = 21 minutes.
  3. Écart-type : (Calcul long, utiliser une calculatrice ou un tableur).
    • nj(cjxˉ)2=15(521)2+30(1521)2+40(2521)2+10(3521)2+5(4521)2\sum n_j (c_j - \bar{x})^2 = 15(5-21)^2 + 30(15-21)^2 + 40(25-21)^2 + 10(35-21)^2 + 5(45-21)^2
    • =15(16)2+30(6)2+40(4)2+10(14)2+5(24)2= 15(-16)^2 + 30(-6)^2 + 40(4)^2 + 10(14)^2 + 5(24)^2
    • =15(256)+30(36)+40(16)+10(196)+5(576)= 15(256) + 30(36) + 40(16) + 10(196) + 5(576)
    • =3840+1080+640+1960+2880=10400= 3840 + 1080 + 640 + 1960 + 2880 = 10400
    • σ2=10400100=104\sigma^2 = \frac{10400}{100} = 104
    • σ=10410,2\sigma = \sqrt{104} \approx 10,2 minutes. La moyenne (21 min) et la médiane (21,25 min) sont très proches. L'écart-type de 10,2 min indique une dispersion significative autour de ce temps de trajet moyen.

Analyse comparative de distributions

Comparer deux populations avec des boîtes à moustaches est très efficace :

  • La médiane (ligne centrale de la boîte) permet de comparer les tendances centrales.
  • La longueur de la boîte (intervalle interquartile) donne une idée de la dispersion des 50% centraux des données.
  • Les moustaches et les points extrêmes (valeurs aberrantes) montrent l'étendue totale et la présence de valeurs inhabituelles.

Exemple : Comparaison des salaires entre hommes et femmes On pourrait observer que le salaire médian des hommes est supérieur à celui des femmes, même si les salaires moyens sont proches (à cause de quelques très hauts salaires masculins). L'écart-type pourrait montrer une plus grande dispersion des salaires masculins (plus d'écarts entre hauts et bas salaires).

Cas pratiques en SES

  • Évolution du PIB par habitant : La médiane du PIB par habitant dans l'UE peut être comparée à la moyenne pour voir si la richesse est concentrée ou mieux répartie. L'écart-type entre les pays membres indiquera si les niveaux de vie convergent ou divergent.
  • Répartition des diplômes : On peut calculer le niveau d'études médian et l'écart-type par région pour évaluer les disparités éducatives.
  • Analyse de sondages : Pour une question sur une échelle de Likert (ex: "êtes-vous satisfait de..."), la médiane peut indiquer le sentiment général, et l'écart-type la polarisation des opinions. Un faible écart-type signifie un consensus, un fort écart-type une division des opinions.

Après la lecture

Passe à la pratique avec deux blocs bien visibles

Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.

Quiz + Flashcards

Suite naturelle

Tu veux aller plus loin que l'article ?

Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.