Éducation nationale françaiseSciences économiques et socialesSeconde générale et technologique20 min de lecture

Comment calculer des moyennes et des médianes ?

Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.

Lecture

5 chapitres

Un parcours éditorialisé et navigable.

Pratique

12 questions

Quiz et cartes mémoire à ouvrir après la lecture.

Objectif

Seconde générale et technologique

Format rapide pour vérifier si le chapitre correspond.

Chapitre 1

Introduction aux indicateurs de tendance centrale

Pourquoi utiliser des indicateurs de tendance centrale ?

En Sciences Économiques et Sociales (SES), nous sommes souvent confrontés à une grande quantité de données. Imaginez que vous étudiez les salaires de tous les habitants d'une ville ou les notes de tous les élèves d'un lycée. Il est impossible d'analyser chaque donnée individuellement. C'est là qu'interviennent les indicateurs de tendance centrale.

Leur objectif principal est de synthétiser l'information. Ils permettent de résumer une série de données par une seule valeur représentative, qui donne une idée de ce qui est "typique" ou "moyen" dans cette série.

Ces indicateurs sont essentiels pour :

  • Synthétiser l'information : Réduire un grand ensemble de données à une valeur clé facile à comprendre.
  • Comparer des groupes : Par exemple, comparer le niveau de vie moyen entre deux pays ou la réussite scolaire moyenne entre deux classes.
  • Identifier des caractéristiques typiques : Comprendre ce qui caractérise le mieux une population ou un phénomène étudié.

Sans ces outils, l'analyse de données complexes serait fastidieuse et peu informative. Ils nous aident à dégager les grandes tendances.

Présentation des principaux indicateurs

Il existe plusieurs indicateurs de tendance centrale, chacun ayant ses spécificités et ses cas d'utilisation privilégiés :

  • La moyenne arithmétique : C'est l'indicateur le plus connu et le plus utilisé. Elle représente la somme de toutes les valeurs divisée par le nombre de valeurs. Elle est souvent appelée simplement "moyenne".
  • La médiane : C'est la valeur qui partage une série de données ordonnée en deux parties égales. La moitié des observations sont inférieures ou égales à la médiane, et l'autre moitié supérieures ou égales.
  • Le mode (rappel) : C'est la valeur qui apparaît le plus fréquemment dans une série de données. Bien que moins utilisé en SES que la moyenne ou la médiane pour les données quantitatives continues, il reste pertinent pour les données qualitatives ou discrètes. Par exemple, la couleur de voiture la plus vendue est un mode.

Chacun de ces indicateurs nous donne une information différente sur la "valeur typique" d'une série. Le choix de l'indicateur dépendra de la nature des données et de l'objectif de l'analyse.

Distinction entre données quantitatives et qualitatives

Avant de choisir un indicateur, il est crucial de comprendre la nature des données que l'on manipule.

  • Les données quantitatives (ou variables numériques) sont des données qui peuvent être mesurées numériquement. Elles peuvent être :

    • Discrètes : Elles ne peuvent prendre que des valeurs entières (ex: nombre d'enfants, nombre de voitures).
    • Continues : Elles peuvent prendre n'importe quelle valeur dans un intervalle donné (ex: taille, poids, revenu, température). Les moyennes et médianes sont principalement utilisées pour ces types de données.
  • Les données qualitatives (ou variables catégorielles) décrivent des qualités ou des catégories et ne sont pas mesurables numériquement. Elles peuvent être :

    • Nominales : Pas d'ordre naturel (ex: couleur des yeux, profession, nationalité).
    • Ordinales : Il y a un ordre, mais pas de mesure de distance entre les catégories (ex: niveau d'étude : primaire, collège, lycée, supérieur ; appréciation : faible, moyen, bon). Pour les données qualitatives, le mode est souvent l'indicateur de tendance centrale le plus pertinent, car on ne peut pas calculer une moyenne ou une médiane avec des catégories.

La pertinence des indicateurs dépend donc directement de la nature de la variable étudiée. On ne calcule pas une moyenne pour des couleurs de cheveux !

Chapitre 2

La moyenne arithmétique : calcul et interprétation

Calcul de la moyenne simple

La moyenne arithmétique est l'indicateur de tendance centrale le plus intuitif et le plus couramment utilisé. Elle est calculée en additionnant toutes les valeurs d'une série de données et en divisant cette somme par le nombre total d'observations.

La formule de base est la suivante : Moyenne=Somme de toutes les valeursNombre total de valeurs\text{Moyenne} = \frac{\text{Somme de toutes les valeurs}}{\text{Nombre total de valeurs}}

En notation mathématique, si nous avons une série de nn valeurs x1,x2,...,xnx_1, x_2, ..., x_n, la moyenne (souvent notée xˉ\bar{x}) est : xˉ=x1+x2+...+xnn=i=1nxin\bar{x} = \frac{x_1 + x_2 + ... + x_n}{n} = \frac{\sum_{i=1}^{n} x_i}{n}\sum (sigma) signifie "somme de".

Exemple concret : Un élève a eu les notes suivantes en SES au cours du trimestre : 12, 15, 10, 13. La somme des valeurs est 12+15+10+13=5012 + 15 + 10 + 13 = 50. Le nombre d'observations est 44. La moyenne est 504=12,5\frac{50}{4} = 12,5. La moyenne de ses notes en SES est de 12,5.

Calcul de la moyenne pondérée

Parfois, certaines valeurs dans une série de données ont plus d'importance ou apparaissent plus fréquemment que d'autres. C'est là qu'intervient la moyenne pondérée. Chaque valeur est affectée d'un coefficient de pondération (ou "poids") qui reflète son importance ou sa fréquence.

La formule de la moyenne pondérée est : Moyenne pondeˊreˊe=(valeur×poids)poids\text{Moyenne pondérée} = \frac{\sum (\text{valeur} \times \text{poids})}{\sum \text{poids}} Si les poids sont des fréquences, la somme des poids correspond au nombre total d'observations.

Exemples concrets :

  1. Notes scolaires avec coefficients : Un élève a les notes suivantes avec leurs coefficients :

    • Mathématiques : 14 (coeff 3)
    • Français : 11 (coeff 2)
    • Histoire-Géographie : 16 (coeff 2)
    • Anglais : 10 (coeff 1)

    Calcul :

    • Somme des produits (valeur x poids) : (14×3)+(11×2)+(16×2)+(10×1)=42+22+32+10=106(14 \times 3) + (11 \times 2) + (16 \times 2) + (10 \times 1) = 42 + 22 + 32 + 10 = 106
    • Somme des poids : 3+2+2+1=83 + 2 + 2 + 1 = 8
    • Moyenne pondérée : 1068=13,25\frac{106}{8} = 13,25 La moyenne générale de l'élève est de 13,25.
  2. Salaires dans une entreprise (séries statistiques groupées) :

    Catégorie de salaire (en €)Nombre d'employés (effectif)
    1 50010
    2 0005
    3 0002
    5 0001

    Ici, le "poids" de chaque salaire est le nombre d'employés qui le perçoivent.

    • Somme des produits : (1500×10)+(2000×5)+(3000×2)+(5000×1)=15000+10000+6000+5000=36000(1500 \times 10) + (2000 \times 5) + (3000 \times 2) + (5000 \times 1) = 15000 + 10000 + 6000 + 5000 = 36000
    • Somme des poids (effectif total) : 10+5+2+1=1810 + 5 + 2 + 1 = 18
    • Moyenne pondérée : 3600018=2000\frac{36000}{18} = 2000 Le salaire moyen dans cette entreprise est de 2000 €.

Interprétation et limites de la moyenne

La moyenne est une valeur typique qui représente le centre de gravité d'une série de données. Elle est facile à calculer et à comprendre.

Cependant, la moyenne a une limite majeure : elle est très sensible aux valeurs extrêmes (ou "valeurs aberrantes"). Une seule valeur très élevée ou très basse peut fortement influencer la moyenne et la rendre moins représentative de la majorité des données.

Exemple : Reprenons les salaires. Si un nouveau dirigeant est embauché avec un salaire de 20 000 €, la série devient : 1500 (10x), 2000 (5x), 3000 (2x), 5000 (1x), 20000 (1x) Somme des produits : 36000+(20000×1)=5600036000 + (20000 \times 1) = 56000 Effectif total : 18+1=1918 + 1 = 19 Nouvelle moyenne : 56000192947,37\frac{56000}{19} \approx 2947,37 €. La moyenne a fortement augmenté (+947,37+947,37 €) alors que 18 des 19 employés n'ont pas vu leur salaire changer. La moyenne ne reflète plus le salaire "typique" de la majorité des employés.

La moyenne est plus pertinente lorsque la distribution des données est symétrique, c'est-à-dire que les valeurs sont réparties de manière équilibrée autour de la moyenne. Si la distribution est fortement asymétrique (beaucoup de valeurs d'un côté et quelques valeurs extrêmes de l'autre), la moyenne peut être trompeuse.

Exercices pratiques de calcul de moyenne

Exercice 1 : Série de données brutes Calculez la moyenne des âges suivants d'un groupe d'amis : 16, 17, 16, 18, 19, 17, 16, 20.

  • Correction : Somme des âges : 16+17+16+18+19+17+16+20=13916 + 17 + 16 + 18 + 19 + 17 + 16 + 20 = 139 Nombre d'amis : 8 Moyenne : 1398=17,375\frac{139}{8} = 17,375 ans.

Exercice 2 : Tableau de fréquences Calculez le nombre moyen de livres lus par mois par les élèves d'une classe, à partir du tableau suivant :

Nombre de livres lusNombre d'élèves
05
110
28
34
42
51
  • Correction : Somme des produits (nombre de livres x nombre d'élèves) : (0×5)+(1×10)+(2×8)+(3×4)+(4×2)+(5×1)(0 \times 5) + (1 \times 10) + (2 \times 8) + (3 \times 4) + (4 \times 2) + (5 \times 1) =0+10+16+12+8+5=51= 0 + 10 + 16 + 12 + 8 + 5 = 51 Nombre total d'élèves : 5+10+8+4+2+1=305 + 10 + 8 + 4 + 2 + 1 = 30 Moyenne : 5130=1,7\frac{51}{30} = 1,7 livres. En moyenne, les élèves de cette classe lisent 1,7 livre par mois.

Utilisation de la calculatrice : La plupart des calculatrices scientifiques et graphiques possèdent des fonctions statistiques pour calculer la moyenne. Apprenez à les utiliser pour gagner du temps et réduire les erreurs de calcul.

Chapitre 3

La médiane : calcul et interprétation

Définition et rôle de la médiane

La médiane est une autre mesure de tendance centrale très importante, surtout dans des contextes où la moyenne peut être trompeuse. Sa définition est simple : c'est la valeur qui se trouve au milieu d'une série de données une fois que celle-ci a été ordonnée (du plus petit au plus grand, ou inversement).

Son rôle est de partager la série en deux parties égales. Cela signifie que :

  • Au moins 50% (la moitié) des observations sont inférieures ou égales à la médiane.
  • Au moins 50% (la moitié) des observations sont supérieures ou égales à la médiane.

La médiane est donc la valeur "centrale" en termes de position, non de valeur arithmétique.

Calcul de la médiane pour une série impaire

Lorsque le nombre total d'observations (nn) est impair, le calcul de la médiane est direct.

Étapes :

  1. Ordonner les données : Arrangez toutes les valeurs de la série dans l'ordre croissant (ou décroissant).
  2. Identifier la position de la médiane : La médiane est la valeur située à la position n+12\frac{n+1}{2}.
  3. Identifier la valeur médiane : C'est la valeur qui se trouve à cette position.

Exemple : Soit la série de notes suivante : 10, 15, 8, 12, 17.

  1. Ordonner les données : 8, 10, 12, 15, 17
  2. Nombre d'observations (nn) = 5 (impair).
  3. Position de la médiane : 5+12=62=3eˋme\frac{5+1}{2} = \frac{6}{2} = 3^{\text{ème}} position.
  4. La valeur à la 3ème position est 12. La médiane de cette série est 12.

Calcul de la médiane pour une série paire

Lorsque le nombre total d'observations (nn) est pair, il n'y a pas une seule valeur centrale. La médiane est alors la moyenne des deux valeurs centrales.

Étapes :

  1. Ordonner les données : Arrangez toutes les valeurs de la série dans l'ordre croissant.
  2. Identifier les deux positions centrales : Ce sont les positions n2\frac{n}{2} et n2+1\frac{n}{2} + 1.
  3. Calculer la moyenne des deux valeurs centrales : La médiane est la moyenne arithmétique de ces deux valeurs.

Exemple : Soit la série de notes suivante : 10, 15, 8, 12, 17, 11.

  1. Ordonner les données : 8, 10, 11, 12, 15, 17
  2. Nombre d'observations (nn) = 6 (pair).
  3. Positions centrales : 62=3eˋme\frac{6}{2} = 3^{\text{ème}} position et 62+1=4eˋme\frac{6}{2} + 1 = 4^{\text{ème}} position.
  4. Les valeurs aux 3ème et 4ème positions sont 11 et 12.
  5. Moyenne de ces deux valeurs : 11+122=232=11,5\frac{11 + 12}{2} = \frac{23}{2} = 11,5. La médiane de cette série est 11,5.

Interprétation et avantages de la médiane

La médiane est un indicateur de position très utile. Son principal avantage est sa robustesse aux valeurs extrêmes. Contrairement à la moyenne, une ou plusieurs valeurs très éloignées du reste de la série n'affecteront pas significativement la médiane.

Exemple : Reprenons la série de salaires avec le nouveau dirigeant (8, 10, 11, 12, 15, 17 pour les notes, imaginons que 17 est un salaire très élevé). Série des salaires ordonnée (avec l'exemple précédent) : 1500, 1500, ..., 1500 (10 fois), 2000, ..., 2000 (5 fois), 3000, 3000, 5000, 20000. Il y a 19 observations. Position de la médiane : 19+12=10eˋme\frac{19+1}{2} = 10^{\text{ème}} position. La 10ème valeur est 1500. La médiane est 1500 €. Même avec un salaire de 20 000 €, la médiane reste 1500 €, ce qui est beaucoup plus représentatif du salaire de la majorité des employés que la moyenne de 2947,37 €. La médiane est donc préférable pour les distributions asymétriques, notamment pour les revenus ou patrimoines.

La médiane est un excellent indicateur de partage : elle divise la population en deux groupes de taille égale. Cela la rend très utile pour comprendre les inégalités, par exemple en termes de revenus ou de patrimoine.

Chapitre 4

Comparaison et choix entre moyenne et médiane

Quand privilégier la moyenne ?

La moyenne est à privilégier dans les situations suivantes :

  • Distributions symétriques : Lorsque les données sont réparties de manière équilibrée autour d'une valeur centrale (par exemple, une "courbe en cloche" ou distribution normale). Dans ce cas, la moyenne et la médiane sont souvent très proches.
  • Absence de valeurs aberrantes : Si la série de données ne contient pas de valeurs extrêmes qui pourraient fausser le résultat.
  • Calculs ultérieurs : La moyenne est plus adaptée pour des calculs statistiques plus complexes (comme l'écart-type ou les tests statistiques) qui nécessitent une mesure basée sur toutes les valeurs.
  • Quand on cherche à obtenir une valeur qui reflète le "total" ou la "somme" des données (par exemple, le PIB moyen par habitant est calculé à partir du PIB total).

Exemple : La taille moyenne des élèves d'une classe est généralement bien représentée par la moyenne, car il y a rarement des valeurs extrêmes.

Quand privilégier la médiane ?

La médiane est plus appropriée dans les cas suivants :

  • Distributions asymétriques : Lorsque les données sont fortement concentrées d'un côté et s'étendent avec quelques valeurs extrêmes de l'autre. C'est très courant pour les données économiques et sociales.
  • Présence de valeurs extrêmes : Si la série contient des valeurs très élevées ou très basses qui pourraient "tirer" la moyenne et la rendre non représentative.
  • Pour les données comme les revenus, patrimoines, prix immobiliers : Ces données sont souvent très asymétriques, avec une majorité de personnes ayant des revenus/patrimoines faibles à modérés et une petite minorité ayant des revenus/patrimoines très élevés. Dans ces cas, la médiane est un bien meilleur indicateur du "revenu typique" de la population.

Exemple : Le salaire médian est souvent plus significatif que le salaire moyen pour décrire le niveau de rémunération d'une population, car les très hauts salaires peuvent gonfler artificiellement la moyenne.

Exemples concrets de choix d'indicateur

  • Salaires moyens vs. salaires médians :

    • Le salaire moyen en France est souvent plus élevé que le salaire médian. Pourquoi ? Parce que les très hauts salaires d'une petite minorité "tirent" la moyenne vers le haut. Le salaire médian, lui, indique que la moitié des salariés gagne moins que cette valeur, et l'autre moitié plus. Il est généralement considéré comme plus représentatif du niveau de vie de la majorité de la population.
    • Si l'on veut montrer la richesse globale produite, la moyenne est pertinente. Si l'on veut montrer ce que gagne la personne "au milieu" de la distribution, la médiane est plus juste.
  • Prix immobiliers :

    • Dans une ville, le prix moyen du mètre carré pour un appartement peut être fortement influencé par quelques résidences de luxe. Le prix médian donnera une meilleure idée du prix que la moitié des acheteurs paient au maximum.
  • Notes scolaires :

    • Si une classe a une distribution de notes très homogène, la moyenne sera pertinente. Cependant, si un élève a eu une note de 0 ou 20 alors que le reste de la classe est autour de 10, la médiane sera moins affectée par ces notes extrêmes et pourra mieux refléter le niveau général de la classe.

En SES, il est fréquent d'utiliser les deux indicateurs (moyenne et médiane) pour avoir une vision complète et nuancée de la réalité. Leur comparaison permet de déceler des inégalités ou des asymétries dans la distribution des données.

Exercices de comparaison et de justification

Exercice : Deux entreprises, A et B, emploient chacune 10 salariés. Voici leurs salaires mensuels (en €) :

  • Entreprise A : 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400
  • Entreprise B : 1500, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 10000
  1. Calculez la moyenne et la médiane pour chaque entreprise.
  2. Interprétez les résultats.
  3. Quel indicateur vous semble le plus pertinent pour décrire le salaire "typique" dans chaque entreprise ? Justifiez votre choix.
  • Correction :

    Entreprise A :

    • Moyenne : Somme = 19500. n=10n = 10. Moyenne = 1950010=1950\frac{19500}{10} = 1950
    • Médiane : Série ordonnée. n=10n = 10 (pair). Positions centrales : 5ème (1900) et 6ème (2000). Médiane = 1900+20002=1950\frac{1900+2000}{2} = 1950
    • Interprétation : Moyenne et médiane sont identiques. La distribution est symétrique, il n'y a pas de valeurs extrêmes.
    • Pertinence : Les deux indicateurs sont pertinents. La moyenne est un bon reflet du salaire typique.

    Entreprise B :

    • Moyenne : Somme = 26300. n=10n = 10. Moyenne = 2630010=2630\frac{26300}{10} = 2630
    • Médiane : Série ordonnée. n=10n = 10 (pair). Positions centrales : 5ème (1800) et 6ème (1900). Médiane = 1800+19002=1850\frac{1800+1900}{2} = 1850
    • Interprétation : La moyenne (2630 €) est nettement supérieure à la médiane (1850 €). Cela est dû à la valeur extrême (10000 €).
    • Pertinence : La médiane (1850 €) est plus pertinente pour décrire le salaire typique de la majorité des employés, car la moyenne est fortement influencée par le salaire très élevé d'un seul individu.

Cet exercice illustre parfaitement l'importance de ne pas se contenter d'un seul indicateur et d'analyser la distribution des données.

Chapitre 5

Applications en Sciences Économiques et Sociales

Utilisation des moyennes et médianes en économie

En économie, ces indicateurs permettent de quantifier et de comparer des situations économiques.

  • Revenu par habitant : Souvent calculé comme un revenu moyen (PIB par habitant divisé par la population). Il donne une idée générale du niveau de richesse d'un pays, mais ne dit rien sur sa répartition.
  • Taux de croissance moyen : Utilisé pour lisser les fluctuations annuelles et donner une tendance à long terme de la croissance économique.
  • Inégalités de revenus : La comparaison entre le revenu moyen et le revenu médian est un indicateur clé des inégalités. Si le revenu moyen est nettement supérieur au revenu médian, cela suggère une concentration des richesses au sommet de la distribution. Les économistes utilisent souvent la médiane pour mieux comprendre ce que vit la "personne moyenne" dans une économie.

Utilisation des moyennes et médianes en sociologie

En sociologie, ces indicateurs aident à comprendre les comportements sociaux, les structures démographiques et les inégalités.

  • Âge moyen de mariage / de premier enfant : Donne une idée des évolutions démographiques et des normes sociales.
  • Niveau d'études médian : Plus pertinent que le niveau d'études moyen si la distribution est asymétrique (par exemple, beaucoup de personnes sans diplôme et quelques-unes avec de très hauts diplômes).
  • Répartition des diplômes : La médiane peut aider à identifier le niveau de diplôme "le plus courant" ou "central" dans une population, ce qui est crucial pour les analyses sur la mobilité sociale ou l'accès à l'emploi.

Analyse de documents statistiques

En SES, vous serez fréquemment confronté à des documents statistiques (tableaux, graphiques) qui utilisent des moyennes et des médianes.

  • Lecture de tableaux : Soyez attentif aux titres, aux unités et aux sources. Identifiez si les chiffres présentés sont des moyennes ou des médianes.
  • Interprétation de graphiques : Les histogrammes ou les courbes de distribution permettent de visualiser l'asymétrie éventuelle des données. Une distribution "étalée" vers les hautes valeurs indique que la moyenne sera probablement supérieure à la médiane.
  • Esprit critique : Ne vous contentez jamais d'un seul chiffre. Si un document ne présente que la moyenne, demandez-vous pourquoi la médiane n'est pas mentionnée, et vice-versa. Est-ce pour masquer des inégalités ou, au contraire, pour simplifier un message ? Le choix de l'indicateur a une influence directe sur le message véhiculé.

Rédaction de synthèses à partir d'indicateurs

Lors de la rédaction de synthèses ou de commentaires de documents en SES, il est essentiel de :

  • Structurer votre analyse : Présentez clairement les indicateurs que vous utilisez et leurs valeurs.
  • Utiliser un vocabulaire adapté : Parlez de "moyenne arithmétique", de "médiane", de "valeurs extrêmes", de "distribution asymétrique".
  • Assurer la clarté de l'explication : Expliquez pourquoi tel indicateur est plus pertinent que tel autre dans un contexte donné. Comparez les indicateurs si cela enrichit l'analyse.
  • Toujours contextualiser les chiffres : Que nous disent-ils sur la société, l'économie ? Quels sont les enjeux sous-jacents ?

En maîtrisant le calcul et l'interprétation des moyennes et des médianes, vous développerez une compétence essentielle pour l'analyse critique des données en SES.

Après la lecture

Passe à la pratique avec deux blocs bien visibles

Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.

Quiz + Flashcards

Suite naturelle

Tu veux aller plus loin que l'article ?

Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.