Éducation nationale françaiseSpécialité SESTerminale générale18 min de lecture

Ecarts et rapports interquantiles

Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.

Lecture

5 chapitres

Un parcours éditorialisé et navigable.

Pratique

12 questions

Quiz et cartes mémoire à ouvrir après la lecture.

Objectif

Terminale générale

Format rapide pour vérifier si le chapitre correspond.

Chapitre 1

Introduction aux Mesures de Dispersion et de Concentration

Pourquoi mesurer la dispersion et la concentration ?

Imaginons deux entreprises où le salaire moyen est de 2 500 € par mois. À première vue, elles semblent identiques. Mais que se passerait-il si dans l'entreprise A, tout le monde gagnait entre 2 400 € et 2 600 €, tandis que dans l'entreprise B, certains gagnaient 1 200 € et d'autres 5 000 € ? La moyenne serait la même, mais la réalité des employés serait très différente.

C'est là que réside la limite de la moyenne : elle ne nous dit rien sur l'étalement des données.

  • Limites de la moyenne : La moyenne est une mesure de tendance centrale utile, mais elle peut masquer une grande hétérogénéité. Deux groupes peuvent avoir la même moyenne tout en étant très différents en termes de répartition.
  • Hétérogénéité des distributions : La dispersion mesure à quel point les valeurs d'une série statistique sont éloignées les unes des autres ou de la valeur centrale. Une faible dispersion indique des valeurs resserrées, une forte dispersion des valeurs étalées.
  • Analyse des inégalités : En SES, les mesures de dispersion et de concentration sont cruciales pour comprendre les inégalités économiques et sociales (revenus, patrimoines, accès à l'éducation, etc.). Elles nous aident à quantifier et à comparer ces inégalités.

Rappel sur les mesures de tendance centrale

Avant de parler de dispersion, rappelons brièvement les outils que nous utilisons pour décrire le "centre" d'une série de données :

  • Moyenne arithmétique : La somme de toutes les valeurs divisée par le nombre de valeurs. C'est la mesure la plus courante, mais elle est très sensible aux valeurs extrêmes.
    • Exemple : Salaire moyen, note moyenne.
  • Médiane : La valeur qui partage la série de données, une fois ordonnée, en deux parties égales. 50% des observations sont inférieures à la médiane et 50% sont supérieures. Elle est moins sensible aux valeurs extrêmes que la moyenne.
    • Exemple : Le salaire médian d'une population est souvent plus représentatif que le salaire moyen car il est moins influencé par les très hauts revenus.
  • Mode : La valeur ou la modalité qui apparaît le plus souvent dans une série statistique.
    • Exemple : La couleur de voiture la plus vendue, la pointure de chaussure la plus fréquente.

Premières approches de la dispersion : étendue et variance

Il existe des mesures de dispersion plus simples, mais souvent moins robustes :

  • Étendue (max - min) : C'est la différence entre la valeur maximale et la valeur minimale d'une série. Elle donne une idée rapide de l'ampleur de la variation.
    • Exemple : Si les notes d'une classe vont de 5 à 18, l'étendue est de 185=1318 - 5 = 13.
    • Inconvénient : Très sensible aux valeurs extrêmes (une seule note très basse ou très haute peut changer considérablement l'étendue).
  • Variance : C'est la moyenne des carrés des écarts à la moyenne. Elle mesure la dispersion de toutes les données autour de la moyenne. Plus la variance est élevée, plus les données sont dispersées.
    • Formule : σ2=1Ni=1N(xixˉ)2\sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \bar{x})^2xix_i sont les valeurs, xˉ\bar{x} la moyenne et NN le nombre de valeurs.
    • Inconvénient : L'unité de la variance est le carré de l'unité des données, ce qui la rend difficile à interpréter concrètement.
  • Écart-type : C'est la racine carrée de la variance (σ=σ2\sigma = \sqrt{\sigma^2}). Il est exprimé dans la même unité que les données d'origine, ce qui facilite son interprétation. Plus l'écart-type est grand, plus les données sont dispersées autour de la moyenne.
    • Exemple : Si le salaire moyen est de 2500€ avec un écart-type de 300€, cela signifie que la plupart des salaires se situent dans un intervalle de ±300\pm 300€ autour de la moyenne.

Bien que l'étendue, la variance et l'écart-type soient utiles, les quantiles offrent une perspective différente, souvent plus pertinente pour l'analyse des inégalités, car ils sont moins sensibles aux valeurs extrêmes.

Chapitre 2

Les Quantiles : Définition et Calcul

Qu'est-ce qu'un quantile ?

Un quantile est une valeur qui délimite un certain pourcentage d'observations dans une série de données ordonnée (du plus petit au plus grand).

  • Division d'une distribution : Les quantiles divisent une population (ou une série de données) en groupes de taille égale en fonction d'une variable donnée (ex: revenu, âge, etc.).
  • Position relative : Ils indiquent la position relative d'une observation par rapport à l'ensemble de la distribution. Par exemple, savoir qu'une personne se situe dans le 10ème décile des revenus signifie qu'elle fait partie des 10% les plus riches.
  • Pourcentages cumulés : Chaque quantile correspond à un certain pourcentage cumulé d'observations qui lui sont inférieures ou égales.

Les quartiles (Q1, Q2, Q3)

Les quartiles divisent une série de données ordonnée en quatre parties égales. Chaque partie contient 25% des observations.

  • Définition des quartiles :
    • Q1 (Premier quartile) : La valeur en dessous de laquelle se trouvent 25% des observations. C'est aussi le 25ème centile.
    • Q2 (Deuxième quartile) : La valeur en dessous de laquelle se trouvent 50% des observations. C'est la médiane (50ème centile).
    • Q3 (Troisième quartile) : La valeur en dessous de laquelle se trouvent 75% des observations. C'est aussi le 75ème centile.
  • Calcul des quartiles :
    1. Trier les données par ordre croissant.
    2. Calculer la position de Q1 : (N+1)×0.25(N+1) \times 0.25.
    3. Calculer la position de Q2 (Médiane) : (N+1)×0.50(N+1) \times 0.50.
    4. Calculer la position de Q3 : (N+1)×0.75(N+1) \times 0.75.
    • Si la position est un nombre entier, le quartile est la valeur à cette position.
    • Si la position est décimale, on interpole entre les deux valeurs les plus proches. (En Terminale, on peut souvent se contenter de prendre la valeur à la position arrondie ou la valeur suivante pour simplifier).
    • Exemple : Pour la série {10, 12, 15, 18, 20, 22, 25, 30, 35} (N=9)
      • Position Q1 : (9+1)×0.25=2.5(9+1) \times 0.25 = 2.5 \rightarrow entre la 2ème (12) et 3ème (15) valeur. Q1 = 13.5 (ou 15 selon la méthode d'interpolation simple).
      • Position Q2 : (9+1)×0.50=5(9+1) \times 0.50 = 5 \rightarrow 5ème valeur. Q2 = 20 (Médiane).
      • Position Q3 : (9+1)×0.75=7.5(9+1) \times 0.75 = 7.5 \rightarrow entre la 7ème (25) et 8ème (30) valeur. Q3 = 27.5 (ou 30).
  • Interprétation des quartiles :
    • Q1 = 13.5 signifie que 25% des observations sont inférieures ou égales à 13.5.
    • Q2 = 20 signifie que 50% des observations sont inférieures ou égales à 20.
    • Q3 = 27.5 signifie que 75% des observations sont inférieures ou égales à 27.5.
    • L'intervalle [Q1; Q3] contient les 50% des observations centrales.

Les déciles (D1 à D9)

Les déciles divisent une série de données ordonnée en dix parties égales. Chaque partie contient 10% des observations.

  • Définition des déciles :
    • D1 (Premier décile) : La valeur en dessous de laquelle se trouvent 10% des observations.
    • D2 (Deuxième décile) : La valeur en dessous de laquelle se trouvent 20% des observations.
    • ...
    • D5 (Cinquième décile) : La valeur en dessous de laquelle se trouvent 50% des observations (c'est la médiane, Q2).
    • ...
    • D9 (Neuvième décile) : La valeur en dessous de laquelle se trouvent 90% des observations.
  • Calcul des déciles : Le principe est le même que pour les quartiles, mais on multiplie par 0.10 pour D1, 0.20 pour D2, etc., jusqu'à 0.90 pour D9.
    • Position de Dk : (N+1)×k10(N+1) \times \frac{k}{10}.
  • Interprétation des déciles :
    • D1 = 12 000 € (revenu) signifie que 10% des personnes ont un revenu annuel inférieur ou égal à 12 000 €.
    • D9 = 60 000 € (revenu) signifie que 90% des personnes ont un revenu annuel inférieur ou égal à 60 000 €. Cela implique que les 10% les plus riches gagnent plus de 60 000 €.
    • Les déciles sont particulièrement utiles pour l'analyse des inégalités de revenus ou de patrimoine.

Les centiles (P1 à P99)

Les centiles (ou percentiles) divisent une série de données ordonnée en cent parties égales. Chaque partie contient 1% des observations.

  • Définition des centiles :
    • P1 (Premier centile) : La valeur en dessous de laquelle se trouve 1% des observations.
    • P50 (Cinquantième centile) : C'est la médiane, D5, Q2.
    • P99 (Quatre-vingt-dix-neuvième centile) : La valeur en dessous de laquelle se trouvent 99% des observations.
  • Utilisation pour les très grandes séries : Les centiles sont surtout utilisés pour des distributions très larges, où une analyse plus fine est nécessaire. Ils permettent de zoomer sur des fractions très spécifiques de la population (par exemple, les 1% les plus riches ou les 0,1% les plus riches).
  • Exemples d'application :
    • En pédiatrie pour suivre la croissance des enfants (courbes de poids/taille).
    • Dans l'analyse des très hauts revenus ou patrimoines pour étudier les super-riches.
    • Pour évaluer la performance scolaire (un élève au 90ème centile en mathématiques a mieux réussi que 90% des élèves).

Chapitre 3

L'Écart Interquartile et l'Écart Interdécile

L'écart interquartile (EIQ)

L'écart interquartile (EIQ) est la différence entre le troisième quartile (Q3) et le premier quartile (Q1).

  • Définition (Q3 - Q1) : EIQ=Q3Q1EIQ = Q3 - Q1.
  • Mesure de la dispersion centrale : L'EIQ représente l'intervalle dans lequel se situent les 50% des observations centrales de la série. C'est une mesure de la dispersion au centre de la distribution.
  • Robustesse aux valeurs extrêmes : Contrairement à l'étendue, l'EIQ n'est pas affecté par les valeurs minimales et maximales, ce qui le rend beaucoup plus fiable pour décrire la dispersion d'une série qui pourrait contenir des "outliers" (valeurs aberrantes). Il est une mesure de dispersion plus stable.

Calcul et interprétation de l'EIQ

  • Méthode de calcul :
    1. Trier les données par ordre croissant.
    2. Calculer Q1 et Q3 (comme vu précédemment).
    3. Soustraire Q1 de Q3 : EIQ=Q3Q1EIQ = Q3 - Q1.
    • Exemple : Pour la série de notes {10, 12, 15, 18, 20, 22, 25, 30, 35}
      • Q1 = 13.5
      • Q3 = 27.5
      • EIQ=27.513.5=14EIQ = 27.5 - 13.5 = 14.
  • Signification de l'EIQ : Un EIQ de 14 signifie que les 50% d'élèves "du milieu" ont des notes qui s'étendent sur 14 points. Plus l'EIQ est faible, plus les 50% centraux des données sont regroupés ; plus il est élevé, plus ils sont dispersés.
  • Comparaison de distributions : L'EIQ est excellent pour comparer la dispersion de plusieurs distributions.
    • Exemple : Si l'EIQ des salaires dans l'entreprise A est de 500€ et dans l'entreprise B de 2000€, cela indique que la dispersion des salaires est beaucoup plus forte dans l'entreprise B, même si les salaires moyens sont identiques.

L'écart interdécile (EID)

L'écart interdécile (EID) est la différence entre le neuvième décile (D9) et le premier décile (D1).

  • Définition (D9 - D1) : EID=D9D1EID = D9 - D1.
  • Mesure de dispersion plus large : L'EID couvre les 80% des observations centrales de la série. Il est donc une mesure de dispersion plus large que l'EIQ.
  • Sensibilité aux extrêmes : Bien qu'il soit plus robuste que l'étendue, l'EID est légèrement plus sensible aux valeurs extrêmes que l'EIQ, car il s'étend sur 80% des données plutôt que 50%. Cependant, il reste moins sensible que l'étendue totale.

Calcul et interprétation de l'EID

  • Méthode de calcul :
    1. Trier les données par ordre croissant.
    2. Calculer D1 et D9.
    3. Soustraire D1 de D9 : EID=D9D1EID = D9 - D1.
    • Exemple : Pour une distribution de revenus où D1 = 15 000 € et D9 = 70 000 €
      • EID=7000015000=55000EID = 70 000 - 15 000 = 55 000 €.
  • Signification de l'EID : Un EID de 55 000 € signifie que les 80% des personnes au milieu de la distribution des revenus ont des revenus qui s'étendent sur 55 000 €.
  • Analyse des 80% centraux : L'EID est très utile pour analyser la dispersion de la masse principale de la population, en ignorant les 10% les plus pauvres et les 10% les plus riches. Il donne une bonne idée de l'étendue des revenus pour la majorité de la population.

Chapitre 4

Les Rapports Interquantiles comme Mesures d'Inégalité

Le rapport interdécile (D9/D1)

Le rapport interdécile, souvent noté D9/D1, est le rapport entre le neuvième décile (D9) et le premier décile (D1).

  • Définition du rapport D9/D1 : Rapport D9/D1=D9D1Rapport~D9/D1 = \frac{D9}{D1}.
  • Mesure des inégalités de revenus/patrimoine : C'est l'une des mesures les plus courantes et les plus parlantes des inégalités de revenus ou de patrimoine. Il indique combien de fois les 10% les plus riches (ceux qui sont au-dessus de D9) gagnent ou possèdent plus que les 10% les plus pauvres (ceux qui sont en dessous de D1).
  • Interprétation du rapport :
    • Exemple : Si D9 = 60 000 € et D1 = 12 000 €, alors D9/D1=6000012000=5D9/D1 = \frac{60 000}{12 000} = 5.
    • Cela signifie que les 10% des personnes les plus riches ont un revenu au moins 5 fois supérieur à celui des 10% des personnes les plus pauvres.
    • Plus le rapport est élevé, plus les inégalités sont fortes. Un rapport de 1 signifierait une égalité parfaite (mais irréaliste) entre ces deux groupes.
    • Ce rapport est crucial pour les comparaisons internationales et l'évolution des inégalités dans le temps.

Autres rapports interquantiles (D9/D5, D5/D1)

Pour une analyse plus fine, on peut calculer d'autres rapports interquantiles :

  • Rapport D9/D5 (haut de la distribution) : D9D5\frac{D9}{D5}. Ce rapport compare le revenu (ou patrimoine) du seuil des 10% les plus riches à celui de la médiane (D5). Il nous renseigne sur les inégalités dans la moitié supérieure de la distribution.
    • Exemple : Si D9/D5 est élevé, cela signifie que les plus aisés s'éloignent fortement de la "classe moyenne".
  • Rapport D5/D1 (bas de la distribution) : D5D1\frac{D5}{D1}. Ce rapport compare le revenu médian à celui du seuil des 10% les plus pauvres. Il nous renseigne sur les inégalités dans la moitié inférieure de la distribution.
    • Exemple : Si D5/D1 est élevé, cela suggère que les personnes modestes sont très éloignées du revenu médian.
  • Analyse fine des inégalités : Combiner ces rapports permet de décomposer l'analyse des inégalités : sont-elles plus prononcées en haut de l'échelle des revenus, en bas, ou sur l'ensemble de la distribution ?

Limites et avantages des rapports interquantiles

  • Avantages :
    • Facilité d'interprétation : Les rapports sont intuitifs et parlants ("X fois plus").
    • Insensibilité aux extrêmes : Comme les écarts interquantiles, ils sont peu sensibles aux valeurs extrêmes (les 1% les plus riches ou les plus pauvres ne sont pas directement pris en compte dans D9/D1). Cela les rend plus robustes que des mesures qui incluraient le minimum ou le maximum.
    • Comparaison internationale : Ils sont largement utilisés pour comparer le niveau d'inégalité entre différents pays ou différentes périodes, permettant de voir si les inégalités augmentent ou diminuent.
  • Limites :
    • Ils ne donnent aucune information sur ce qui se passe à l'intérieur des groupes extrêmes (par exemple, ce qui se passe pour les 0,1% les plus riches, ou les 1% les plus pauvres).
    • Ils peuvent masquer des situations où les revenus de tous les groupes augmentent ou diminuent en même temps, mais à des rythmes différents.
    • Ils ne sont qu'une des nombreuses mesures d'inégalités (d'autres incluent l'indice de Gini, la courbe de Lorenz).

Chapitre 5

Application et Interprétation des Écarts et Rapports Interquantiles

Utilisation dans l'analyse des revenus et patrimoines

Les écarts et rapports interquantiles sont des outils fondamentaux pour les économistes et les sociologues qui étudient la répartition des richesses.

  • Mesure des inégalités économiques : Ils permettent de quantifier précisément l'étendue des inégalités de revenus (salaires, revenus disponibles) et de patrimoine (biens immobiliers, actifs financiers) au sein d'une population.
    • Exemple : Le rapport D9/D1 du revenu disponible en France est souvent autour de 3.5 à 4, ce qui signifie que les 10% des plus riches ont un revenu au moins 3.5 à 4 fois supérieur à celui des 10% des plus pauvres.
  • Évolution des inégalités dans le temps : En calculant ces indicateurs sur différentes périodes, on peut observer si les inégalités s'accentuent, se réduisent ou stagnent.
    • En France, les rapports interquantiles ont montré une relative stabilité des inégalités de revenus sur les dernières décennies, mais une forte augmentation des inégalités de patrimoine.
  • Comparaisons entre pays : Ces indicateurs facilitent les comparaisons internationales. On peut ainsi voir si la France est plus ou moins égalitaire que l'Allemagne, les États-Unis ou la Suède en termes de répartition des revenus.
    • Les pays scandinaves ont généralement des rapports D9/D1 plus faibles que les pays anglo-saxons.

Représentations graphiques : boîtes à moustaches

La boîte à moustaches (ou diagramme en boîte et moustaches, ou boxplot) est une représentation graphique particulièrement efficace pour visualiser les quartiles et l'écart interquartile, et pour comparer plusieurs distributions.

  • Construction d'une boîte à moustaches :
    1. Dessiner une boîte dont les bords sont Q1 et Q3. La longueur de la boîte est l'EIQ.
    2. Tracer une ligne à l'intérieur de la boîte pour la médiane (Q2).
    3. Prolonger des "moustaches" de la boîte jusqu'aux valeurs minimale et maximale de la série (en général, ou jusqu'à des limites spécifiques pour identifier les valeurs extrêmes).
    4. Les valeurs extrêmes (outliers) sont parfois représentées par des points individuels au-delà des moustaches.
  • Lecture des informations (médiane, quartiles, extrêmes) :
    • La ligne centrale indique la médiane (Q2).
    • Les bords de la boîte indiquent Q1 et Q3.
    • La longueur de la boîte représente l'écart interquartile (EIQ).
    • Les moustaches donnent une idée de l'étendue des données (hors valeurs extrêmes).
    • La position de la médiane dans la boîte et la longueur des moustaches permettent de juger de la symétrie de la distribution (si la médiane est proche de Q1, la distribution est asymétrique vers le bas ; si elle est proche de Q3, asymétrique vers le haut).
  • Comparaison visuelle de distributions : Mettre côte à côte plusieurs boîtes à moustaches permet de comparer rapidement :
    • Leurs médianes (tendances centrales).
    • Leurs EIQ (dispersions centrales).
    • Leurs étendues (dispersions globales).
    • Leurs asymétries.
    • Exemple : Comparer les boîtes à moustaches des salaires des hommes et des femmes pour visualiser les écarts de salaires.

Exercices pratiques et études de cas

Pour maîtriser ces concepts, il est essentiel de s'exercer.

  • Calcul sur données réelles : Entraînez-vous à calculer les quartiles, déciles, EIQ et rapports D9/D1 sur des séries de données concrètes (par exemple, des données de revenus d'un pays, des notes d'une classe, des temps de parcours).
  • Interprétation de résultats : Face à un tableau de données ou un graphique (comme une boîte à moustaches), soyez capable d'expliquer ce que signifient les valeurs des quantiles, des écarts et des rapports.
    • "Le rapport D9/D1 est de 6. Cela signifie que les 10% des personnes les plus aisées ont un revenu au moins six fois supérieur à celui des 10% les plus modestes."
  • Analyse critique des indicateurs : Réfléchissez aux forces et faiblesses de chaque indicateur. Quand est-il préférable d'utiliser la médiane plutôt que la moyenne ? L'EIQ plutôt que l'étendue ? Le rapport D9/D1 plutôt que le coefficient de Gini (que vous étudierez plus tard) ?
    • Les quantiles sont particulièrement pertinents quand on s'intéresse à la répartition des richesses et aux inégalités, car ils sont robustes aux valeurs extrêmes et permettent de se concentrer sur des segments spécifiques de la population.

Après la lecture

Passe à la pratique avec deux blocs bien visibles

Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.

Quiz + Flashcards

Suite naturelle

Tu veux aller plus loin que l'article ?

Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.