Éducation nationale françaiseSpécialité SESPremière générale15 min de lecture

Comment calculer des moyennes et des médianes ?

Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.

Lecture

5 chapitres

Un parcours éditorialisé et navigable.

Pratique

12 questions

Quiz et cartes mémoire à ouvrir après la lecture.

Objectif

Première générale

Format rapide pour vérifier si le chapitre correspond.

Chapitre 1

Introduction aux Indicateurs de Tendance Centrale

Pourquoi utiliser des indicateurs de tendance centrale ?

En Sciences Économiques et Sociales (SES), nous sommes souvent confrontés à une grande quantité de données chiffrées (salaires, notes, prix, etc.). Pour comprendre ces informations complexes, il est essentiel de les synthétiser et de les rendre plus accessibles. C'est là qu'interviennent les indicateurs de tendance centrale.

Ces indicateurs nous permettent de :

  • Synthétiser l'information : Au lieu d'avoir une longue liste de chiffres, nous obtenons une seule valeur qui représente "le centre" de la série de données.
  • Comparer des groupes : Ils facilitent la comparaison entre différentes populations ou échantillons (ex: le revenu moyen des hommes vs celui des femmes).
  • Prendre des décisions éclairées : En offrant une vue d'ensemble rapide, ils aident à l'analyse et à la prise de décision en politique économique, sociale, ou même dans la vie quotidienne.

Présentation des principaux indicateurs

Il existe plusieurs indicateurs de tendance centrale, chacun ayant ses spécificités et ses usages privilégiés. Les trois principaux que nous étudierons sont :

  • La Moyenne arithmétique : C'est l'indicateur le plus connu et le plus utilisé. Elle correspond à la somme de toutes les valeurs divisée par le nombre de valeurs.
  • La Médiane : C'est la valeur qui partage une série de données ordonnée en deux parties égales. 50% des valeurs sont inférieures à la médiane, et 50% sont supérieures.
  • Le Mode : C'est la valeur qui apparaît le plus fréquemment dans une série de données.

Chacun de ces indicateurs fournit une information différente sur la "valeur typique" ou "centrale" d'une distribution. Il est crucial de savoir quand utiliser l'un plutôt que l'autre.

Distinction entre population et échantillon

Avant de calculer ces indicateurs, il est important de comprendre la différence entre une population et un échantillon, car les méthodes de collecte et d'analyse peuvent en dépendre.

  • Définition de la population : En statistique, la population désigne l'ensemble de tous les individus ou éléments qui partagent une caractéristique commune et sur lesquels porte l'étude. Par exemple, tous les lycéens de Première générale en France. Il est souvent impossible d'étudier chaque membre d'une population entière.
  • Définition de l'échantillon : Un échantillon est un sous-ensemble de la population, choisi pour représenter cette population. Par exemple, un groupe de 1000 lycéens de Première générale choisis dans différentes académies.
  • Représentativité : Pour que les conclusions tirées d'un échantillon soient valides pour la population entière, l'échantillon doit être représentatif. Cela signifie qu'il doit avoir les mêmes caractéristiques (âge, sexe, catégorie socio-professionnelle, etc.) que la population dont il est issu, mais à une échelle réduite.

Les indicateurs que nous allons étudier peuvent être calculés aussi bien sur une population que sur un échantillon.

Chapitre 2

La Moyenne Arithmétique : Calcul et Interprétation

Calcul de la moyenne pour une série simple

Une série simple est une liste de valeurs individuelles (non regroupées).

Pour calculer la moyenne arithmétique d'une série simple :

  1. Somme des valeurs : Additionnez toutes les valeurs de la série.
  2. Nombre de valeurs : Comptez le nombre total de valeurs dans la série.
  3. Formule de calcul : Divisez la somme des valeurs par le nombre de valeurs.

La formule est la suivante : Xˉ=i=1nxin\bar{X} = \frac{\sum_{i=1}^{n} x_i}{n} Où :

  • Xˉ\bar{X} (prononcé "X barre") est la moyenne arithmétique.
  • \sum (sigma majuscule) signifie "somme de".
  • xix_i représente chaque valeur individuelle dans la série.
  • nn est le nombre total de valeurs dans la série.

Exemple : Notes obtenues par un élève : 12, 15, 10, 18, 5.

  • Somme des valeurs : 12+15+10+18+5=6012 + 15 + 10 + 18 + 5 = 60
  • Nombre de valeurs : n=5n = 5
  • Moyenne : Xˉ=605=12\bar{X} = \frac{60}{5} = 12

Calcul de la moyenne pour une série pondérée

Une série pondérée est une série où chaque valeur est associée à un coefficient de pondération (ou une fréquence/effectif). Cela arrive souvent quand certaines valeurs se répètent ou ont une importance différente.

Pour calculer une moyenne pondérée :

  1. Produit valeur x poids : Multipliez chaque valeur par son coefficient de pondération (ou sa fréquence/effectif).
  2. Somme des produits : Additionnez tous ces produits.
  3. Somme des poids : Additionnez tous les coefficients de pondération (ou fréquences/effectifs).
  4. Moyenne pondérée : Divisez la somme des produits par la somme des poids.

La formule est : Xˉ=i=1kxi×pii=1kpi\bar{X} = \frac{\sum_{i=1}^{k} x_i \times p_i}{\sum_{i=1}^{k} p_i} Où :

  • xix_i est chaque valeur distincte.
  • pip_i est le poids (ou la fréquence/effectif) associé à chaque valeur xix_i.
  • kk est le nombre de valeurs distinctes.

Exemple : Notes d'un élève avec leurs coefficients :

  • Maths : 12 (coeff 3)

  • SES : 15 (coeff 4)

  • Histoire-Géo : 10 (coeff 2)

  • Anglais : 18 (coeff 1)

  • Produits valeur x poids :

    • 12×3=3612 \times 3 = 36
    • 15×4=6015 \times 4 = 60
    • 10×2=2010 \times 2 = 20
    • 18×1=1818 \times 1 = 18
  • Somme des produits : 36+60+20+18=13436 + 60 + 20 + 18 = 134

  • Somme des poids : 3+4+2+1=103 + 4 + 2 + 1 = 10

  • Moyenne pondérée : Xˉ=13410=13,4\bar{X} = \frac{134}{10} = 13,4

Interprétation de la moyenne

  • Valeur centrale : La moyenne est souvent perçue comme la "valeur typique" ou le "centre de gravité" d'une série de données. C'est le point d'équilibre de la distribution.
  • Sensibilité aux valeurs extrêmes : C'est une caractéristique cruciale de la moyenne. Elle est très sensible aux valeurs aberrantes (ou outliers), c'est-à-dire des valeurs beaucoup plus grandes ou beaucoup plus petites que les autres. Une seule valeur extrême peut tirer la moyenne fortement vers le haut ou vers le bas, la rendant moins représentative de l'ensemble des données.
  • Limites de la moyenne : En raison de sa sensibilité aux valeurs extrêmes, la moyenne peut parfois être trompeuse. Par exemple, le revenu moyen d'un pays peut être très élevé si quelques milliardaires y résident, même si la majorité de la population est pauvre. Dans ce cas, la moyenne ne reflète pas la réalité de la majorité.

Exemples d'application en SES

La moyenne est largement utilisée en SES pour analyser diverses situations :

  • Revenu moyen : Le revenu total d'un groupe divisé par le nombre d'individus. Utile pour des comparaisons globales mais à manipuler avec prudence à cause des inégalités.
  • Taux de croissance moyen : La moyenne des taux de croissance annuels d'une économie sur une période donnée.
  • Notes moyennes : La moyenne des notes des élèves dans une classe ou un établissement.
  • Prix moyen : Le prix moyen d'un produit ou d'un service.

Chapitre 3

La Médiane : Calcul et Interprétation

Définition et rôle de la médiane

  • Valeur centrale : La médiane est la valeur qui divise une série de données ordonnée en deux parties égales.
  • Partage la série en deux : Une fois les données classées par ordre croissant (ou décroissant), la médiane est la valeur telle que 50% des observations lui sont inférieures ou égales, et 50% lui sont supérieures ou égales.
  • Insensibilité aux valeurs extrêmes : Contrairement à la moyenne, la médiane est très peu affectée par la présence de valeurs extrêmes. C'est pourquoi elle est souvent préférée pour des données comme les revenus ou les patrimoines, où les inégalités peuvent être très importantes.

Calcul de la médiane pour une série impaire

Quand le nombre de valeurs (nn) dans la série est impair :

  1. Ordonner la série : Classez toutes les valeurs par ordre croissant (ou décroissant). C'est une étape CRUCIALE.
  2. Position de la médiane : La médiane est la valeur située à la position n+12\frac{n+1}{2}.
  3. Valeur médiane : Identifiez la valeur à cette position.

Exemple : Notes d'un élève : 12, 15, 10, 18, 5 (n=5n=5)

  1. Série ordonnée : 5, 10, 12, 15, 18
  2. Position de la médiane : 5+12=3\frac{5+1}{2} = 3. La médiane est la 3ème valeur.
  3. Médiane : 12

Calcul de la médiane pour une série paire

Quand le nombre de valeurs (nn) dans la série est pair :

  1. Ordonner la série : Classez toutes les valeurs par ordre croissant (ou décroissant).
  2. Deux valeurs centrales : Il n'y a pas une seule valeur centrale. La médiane se situe entre les deux valeurs centrales. Leurs positions sont n2\frac{n}{2} et n2+1\frac{n}{2} + 1.
  3. Moyenne des deux valeurs centrales : La médiane est la moyenne arithmétique de ces deux valeurs centrales.

Exemple : Salaires annuels (en milliers d'euros) de 6 employés : 25, 30, 40, 35, 20, 50 (n=6n=6)

  1. Série ordonnée : 20, 25, 30, 35, 40, 50
  2. Positions des valeurs centrales : 62=3\frac{6}{2} = 3 (3ème valeur) et 62+1=4\frac{6}{2} + 1 = 4 (4ème valeur). Les valeurs centrales sont 30 et 35.
  3. Médiane : 30+352=652=32,5\frac{30 + 35}{2} = \frac{65}{2} = 32,5. La médiane est de 32,5 milliers d'euros.

Interprétation de la médiane

  • 50% des valeurs inférieures, 50% des valeurs supérieures : L'interprétation est directe : la moitié des observations sont inférieures ou égales à la médiane, et l'autre moitié sont supérieures ou égales.
  • Indicateur de répartition : La médiane est un excellent indicateur pour comprendre la répartition des données, surtout en présence d'asymétrie. Elle donne une idée de la "valeur typique" pour la majorité de la population, sans être tirée par les extrêmes.
  • Par exemple, un revenu médian de 2 000€ par mois signifie que la moitié de la population gagne moins de 2 000€ et l'autre moitié gagne plus. Cela donne une image plus juste de la situation de la "personne moyenne" que le revenu moyen si des très hauts revenus sont présents.

Chapitre 4

Comparaison et Choix entre Moyenne et Médiane

Quand utiliser la moyenne ?

La moyenne est à privilégier dans les situations suivantes :

  • Distribution symétrique : Lorsque les données sont réparties de manière relativement uniforme autour d'un centre, sans asymétrie marquée. Dans ce cas, la moyenne et la médiane sont souvent très proches.
  • Absence de valeurs aberrantes : Si la série de données ne contient pas de valeurs extrêmes qui pourraient fausser la moyenne.
  • Calculs ultérieurs : La moyenne est souvent utilisée comme base pour d'autres calculs statistiques plus avancés (comme l'écart-type, les tests statistiques).

Quand utiliser la médiane ?

La médiane est préférable dans les cas suivants :

  • Distribution asymétrique : Lorsque les données sont fortement concentrées d'un côté et s'étendent loin de l'autre (ex: salaires, patrimoines où quelques individus ont des valeurs très élevées).
  • Présence de valeurs extrêmes : Si votre série de données contient des valeurs exceptionnellement hautes ou basses qui ne représentent pas la majorité. La médiane offre alors une meilleure représentation de la "valeur typique".
  • Revenus, patrimoines : Ce sont des domaines classiques en SES où la médiane est plus pertinente que la moyenne pour décrire le niveau de vie de la population, car les inégalités sont souvent importantes.

Exemples concrets de comparaison

  • Revenu moyen vs revenu médian : En France, le revenu moyen par ménage est souvent supérieur au revenu médian. Cela indique que les revenus les plus élevés tirent la moyenne vers le haut, masquant le fait que plus de la moitié des ménages ont un revenu inférieur à cette moyenne. Le revenu médian est donc un indicateur plus fidèle du niveau de vie de la "majorité" de la population.
  • Impact des inégalités : L'écart entre la moyenne et la médiane est un indicateur indirect des inégalités. Plus l'écart est grand (avec la moyenne supérieure à la médiane), plus les inégalités sont importantes, souvent dues à la présence de hauts revenus ou patrimoines.
  • Analyse des distributions : En comparant moyenne et médiane, on peut avoir une idée de la forme de la distribution des données.
    • Si Moyenne \approx Médiane : la distribution est probablement symétrique.
    • Si Moyenne >> Médiane : la distribution est asymétrique positive (ou étalée vers la droite), avec des valeurs élevées tirant la moyenne vers le haut.
    • Si Moyenne << Médiane : la distribution est asymétrique négative (ou étalée vers la gauche), avec des valeurs faibles tirant la moyenne vers le bas.

Le rôle du mode (rappel)

Bien que moins utilisé que la moyenne et la médiane pour les données quantitatives continues, le mode a aussi son utilité :

  • Valeur la plus fréquente : Le mode est la valeur qui apparaît le plus souvent dans une série de données. Une distribution peut avoir un mode (unimodale), deux modes (bimodale) ou plus (multimodale).
  • Données qualitatives : C'est le seul indicateur de tendance centrale qui peut être utilisé pour les données qualitatives non ordinales (ex: couleur préférée, catégorie socioprofessionnelle la plus fréquente).
  • Limites du mode : Pour les données quantitatives, le mode peut ne pas être unique, ou il peut y avoir de nombreux modes s'il y a beaucoup de répétitions. Il est moins stable que la moyenne ou la médiane et peut être peu représentatif si les fréquences sont très proches.

Chapitre 5

Application et Exercices Pratiques

Exercices de calcul de moyennes

Séries simples :

  1. Calculez la moyenne des âges suivants : 18, 22, 19, 20, 21, 18, 23.
  2. Un panier de légumes coûte 2,5€ un jour, 3€ le lendemain, 2,8€ le troisième jour et 3,2€ le quatrième jour. Quel est le prix moyen du panier sur ces quatre jours ?

Séries pondérées :

  1. Un étudiant a les notes suivantes avec leurs coefficients : Français (14, coeff 3), Mathématiques (11, coeff 4), Philosophie (16, coeff 2), Histoire-Géographie (13, coeff 3). Calculez sa moyenne générale.
  2. Dans une usine, le salaire horaire de 10 ouvriers est de 12€, celui de 5 techniciens est de 18€, et celui de 2 cadres est de 30€. Calculez le salaire horaire moyen de l'ensemble du personnel.

Exercices de calcul de médianes

Séries impaires :

  1. Déterminez la médiane des âges suivants : 18, 22, 19, 20, 21, 18, 23.
  2. Voici les notes obtenues par 9 élèves à un contrôle : 8, 12, 15, 7, 10, 13, 9, 14, 11. Quelle est la note médiane ?

Séries paires :

  1. Déterminez la médiane des salaires suivants (en €) : 1500, 2000, 1200, 1800, 2500, 1600.
  2. Une entreprise a enregistré les chiffres d'affaires suivants (en milliers d'€) sur 8 mois : 120, 150, 110, 130, 200, 140, 160, 100. Calculez le chiffre d'affaires médian.

Interprétation des résultats : Pour chaque exercice, comparez la moyenne et la médiane si vous avez calculé les deux. Qu'est-ce que cet écart (ou cette similarité) vous apprend sur la distribution des données ?

Analyse de cas pratiques en SES

  • Inégalités de revenus : On vous donne des données sur les revenus de 10 ménages dans une petite ville. Calculez le revenu moyen et le revenu médian. Si un milliardaire s'installe dans cette ville, comment cela affecte-t-il la moyenne et la médiane ? Qu'en concluez-vous sur l'indicateur le plus pertinent pour décrire le niveau de vie "typique" ?
  • Niveau de vie : Comparez le PIB par habitant (qui est une forme de moyenne) de deux pays. Puis, trouvez des données sur le revenu médian dans ces mêmes pays. Quelle image plus nuancée obtenez-vous du niveau de vie réel des habitants en combinant ces deux indicateurs ?
  • Répartition des richesses : Imaginez un pays où 1% de la population possède 50% de la richesse. Comment la moyenne et la médiane de la richesse par habitant refléteraient-elles cette situation ?

Utilisation d'outils numériques (tableur)

Les tableurs comme Excel, Google Sheets ou LibreOffice Calc sont des outils précieux pour calculer rapidement ces indicateurs, surtout avec de grandes séries de données.

  • Fonctions MOYENNE() : Pour calculer la moyenne d'une plage de cellules, utilisez la fonction =MOYENNE(plage_de_cellules).
    • Exemple : =MOYENNE(A1:A100) calculera la moyenne des valeurs de la cellule A1 à la cellule A100.
  • Fonctions MEDIANE() : Pour calculer la médiane, utilisez la fonction =MEDIANE(plage_de_cellules).
    • Exemple : =MEDIANE(B1:B50) calculera la médiane des valeurs de la cellule B1 à la cellule B50.
  • Automatisation des calculs : L'utilisation de ces fonctions permet de gagner un temps considérable et de réduire les erreurs de calcul manuel, vous permettant de vous concentrer davantage sur l'interprétation des résultats.

Maîtriser ces outils et concepts est fondamental pour analyser de manière critique les données économiques et sociales.

Après la lecture

Passe à la pratique avec deux blocs bien visibles

Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.

Quiz + Flashcards

Suite naturelle

Tu veux aller plus loin que l'article ?

Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.