Les representations graphiques des series statistiques
Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.
Lecture
5 chapitres
Un parcours éditorialisé et navigable.
Pratique
12 questions
Quiz et cartes mémoire à ouvrir après la lecture.
Objectif
Première générale
Format rapide pour vérifier si le chapitre correspond.
Chapitre 1
Introduction aux Séries Statistiques et Vocabulaire
Définition et Types de Séries Statistiques
Pour commencer, il est essentiel de maîtriser le vocabulaire de base :
- Population : C'est l'ensemble de tous les individus ou éléments que l'on étudie. Par exemple, si on étudie la taille des lycéens en France, la population est l'ensemble de tous les lycéens de France.
- Individu (ou unité statistique) : C'est un élément de la population. Dans l'exemple précédent, un lycéen est un individu.
- Échantillon : C'est une partie (un sous-ensemble) de la population sur laquelle on réalise l'étude. On utilise un échantillon quand la population est trop grande pour être étudiée entièrement.
- Caractère statistique : C'est la propriété ou la caractéristique que l'on étudie chez les individus de la population. Le caractère peut être de deux types :
- Caractère qualitatif : Il s'exprime par des qualités, des catégories, des modalités qui ne sont pas mesurables par un nombre. Exemples : couleur des yeux, catégorie socio-professionnelle, marque de téléphone préférée.
- Caractère quantitatif : Il s'exprime par des nombres, des valeurs mesurables. Exemples : taille, poids, nombre d'enfants, notes à un examen.
- Caractère quantitatif discret : Il ne peut prendre qu'un nombre fini ou dénombrable de valeurs isolées. Généralement, ce sont des nombres entiers. Exemples : nombre de frères et sœurs (0, 1, 2, ...), nombre de voitures par foyer.
- Caractère quantitatif continu : Il peut prendre n'importe quelle valeur dans un intervalle donné. Exemples : taille (1,72 m, 1,725 m, ...), poids, durée de vie d'une ampoule.
Une série statistique est l'ensemble des données recueillies pour un caractère donné sur une population ou un échantillon.
Effectifs et Fréquences
Une fois les données collectées, on les organise souvent dans un tableau. Pour cela, on utilise les notions d'effectifs et de fréquences.
- Effectif absolu () : C'est le nombre de fois qu'une valeur (ou une modalité) du caractère apparaît dans la série statistique. On le note souvent pour la -ème valeur.
- La somme de tous les effectifs absolus est égale à l'effectif total () de la population ou de l'échantillon : .
- Effectif cumulé () : C'est la somme des effectifs absolus des valeurs inférieures ou égales à une certaine valeur du caractère. On les utilise principalement pour les caractères quantitatifs.
- Effectifs cumulés croissants (ECC) : On additionne les effectifs en allant de la plus petite valeur à la plus grande. .
- Fréquence absolue () : C'est la proportion d'une valeur (ou modalité) par rapport à l'effectif total. Elle se calcule en divisant l'effectif absolu de la valeur par l'effectif total : .
- La fréquence est un nombre compris entre 0 et 1. On peut l'exprimer en pourcentage en la multipliant par 100.
- La somme de toutes les fréquences absolues est toujours égale à 1 (ou 100 %).
- Fréquence cumulée () : C'est la somme des fréquences absolues des valeurs inférieures ou égales à une certaine valeur.
- Fréquences cumulées croissantes (FCC) : On additionne les fréquences en allant de la plus petite valeur à la plus grande. . La dernière fréquence cumulée croissante est égale à 1 (ou 100 %).
Exemple : Notes sur 20 d'une classe de 30 élèves :
| Note () | Effectif () | Effectif cumulé croissant () | Fréquence () | Fréquence cumulée croissante () |
|---|---|---|---|---|
| 8 | 3 | 3 | 0,10 | 0,10 |
| 10 | 6 | 9 | 0,20 | 0,30 |
| 12 | 9 | 18 | 0,30 | 0,60 |
| 14 | 7 | 25 | 0,23 | 0,83 |
| 16 | 5 | 30 | 0,17 | 1,00 |
| Total | 30 | 1,00 |
Regroupement en Classes
Pour les caractères quantitatifs continus, ou même pour les caractères discrets qui prennent un grand nombre de valeurs différentes, il est souvent plus simple de regrouper les données en classes.
- Intérêt du regroupement : Il permet de simplifier la présentation des données, de rendre le tableau plus lisible et de faciliter la création de représentations graphiques. Cela permet de dégager des tendances générales.
- Définition des classes : Une classe est un intervalle de valeurs. Par exemple, ou . Les classes doivent être contiguës (se suivre sans interruption) et sans chevauchement.
- Lorsque l'intervalle est , cela signifie que les valeurs sont telles que . La borne inférieure est incluse, la borne supérieure est exclue.
- Amplitude de classe () : C'est la largeur de l'intervalle. Pour une classe , l'amplitude est .
- Centre de classe () : C'est le milieu de l'intervalle. Pour une classe , le centre est . On utilise le centre de classe pour calculer certaines caractéristiques statistiques ou pour construire des polygones de fréquences.
Attention : Le choix du nombre et de l'amplitude des classes peut influencer l'apparence des représentations graphiques. Il faut trouver un bon équilibre pour ne pas perdre trop d'information tout en simplifiant la lecture.
Chapitre 2
Représentations Graphiques pour Caractères Discrets
Diagramme en Bâtons
Le diagramme en bâtons est utilisé pour représenter des caractères quantitatifs discrets.
- Construction :
- Tracez deux axes :
- L'axe horizontal (abscisses) représente les valeurs du caractère discret. Chaque valeur est un point sur cet axe.
- L'axe vertical (ordonnées) représente les effectifs ou les fréquences.
- Pour chaque valeur du caractère, tracez un "bâton" vertical dont la hauteur est proportionnelle à l'effectif ou à la fréquence correspondante. Les bâtons sont fins et espacés, car les valeurs du caractère sont discrètes.
- Tracez deux axes :
- Interprétation : Il permet de voir rapidement quelles sont les valeurs les plus fréquentes (le mode), et la répartition générale des données. Plus un bâton est haut, plus la valeur correspondante est fréquente.
- Utilisation pour effectifs/fréquences : On peut l'utiliser indifféremment avec les effectifs ou les fréquences, l'allure générale du graphique reste la même.
Diagramme Circulaire (Secteurs)
Le diagramme circulaire, aussi appelé "camembert", est idéal pour représenter des caractères qualitatifs ou des caractères quantitatifs discrets avec peu de modalités, et surtout pour montrer la proportion de chaque modalité par rapport au total.
- Calcul des angles : Chaque modalité est représentée par un secteur circulaire dont l'angle est proportionnel à son effectif ou sa fréquence.
- Angle du secteur () = (où est la fréquence de la modalité).
- Alternativement, .
- Construction :
- Dessinez un cercle.
- Calculez l'angle de chaque secteur.
- À l'aide d'un rapporteur, dessinez chaque secteur.
- Indiquez la modalité et le pourcentage correspondant sur ou à côté de chaque secteur.
- Interprétation des proportions : Il permet de visualiser la part de chaque catégorie par rapport à l'ensemble. Une grande part du camembert indique une modalité très représentée.
Diagramme en Barres
Le diagramme en barres est souvent utilisé pour les caractères qualitatifs.
- Différence avec diagramme en bâtons : Bien qu'ils se ressemblent, les barres d'un diagramme en barres sont généralement plus larges que les bâtons et peuvent être espacées de manière arbitraire, car il n'y a pas d'ordre numérique entre les catégories qualitatives.
- Construction :
- L'axe horizontal représente les différentes modalités du caractère qualitatif.
- L'axe vertical représente les effectifs ou les fréquences.
- Pour chaque modalité, dessinez une barre verticale dont la hauteur est proportionnelle à l'effectif ou la fréquence.
- Cas des caractères qualitatifs : C'est sa principale utilisation. Il est facile de comparer les effectifs ou fréquences des différentes catégories.
Chapitre 3
Représentations Graphiques pour Caractères Continus
Histogramme
L'histogramme est la représentation graphique privilégiée pour les caractères quantitatifs continus ou les caractères discrets regroupés en classes.
- Construction avec classes d'égale amplitude :
- L'axe horizontal représente les classes du caractère. Chaque classe est un intervalle.
- Pour chaque classe, on dessine un rectangle dont la base correspond à l'amplitude de la classe.
- La hauteur du rectangle est proportionnelle à l'effectif ou à la fréquence de la classe. Si les amplitudes sont égales, la hauteur est directement l'effectif/fréquence.
- Les rectangles sont contigus (ils se touchent), car le caractère est continu.
- Construction avec classes d'amplitude différente : C'est le cas le plus délicat. Si les amplitudes des classes sont différentes, la hauteur du rectangle ne doit pas être directement l'effectif ou la fréquence, mais la densité d'effectif ou la densité de fréquence.
- Densité d'effectif () : .
- Densité de fréquence () : .
- Dans ce cas, c'est l'aire du rectangle qui est proportionnelle à l'effectif ou à la fréquence de la classe. L'aire de chaque rectangle représente l'effectif ou la fréquence de la classe correspondante.
- Interprétation de l'aire : L'histogramme permet de visualiser la répartition des données. Les zones où les rectangles sont hauts et larges indiquent une forte concentration de données. L'aire totale de l'histogramme est proportionnelle à l'effectif total ou à la somme des fréquences (1).
Polygone des Effectifs/Fréquences
Le polygone des effectifs (ou des fréquences) est une autre façon de visualiser la distribution d'un caractère quantitatif, souvent superposé à un histogramme.
- Construction à partir de l'histogramme :
- Identifiez le point milieu (centre de classe) du sommet de chaque rectangle de l'histogramme.
- Ajoutez deux points supplémentaires sur l'axe des abscisses : les centres de deux classes fictives d'effectif nul, une avant la première classe et une après la dernière classe. Cela permet de "fermer" le polygone.
- Reliez ces points par des segments de droite.
- Utilisation des centres de classe : Ce sont les points pour le polygone des effectifs, ou pour le polygone des fréquences.
- Lissage de la distribution : Le polygone des effectifs donne une idée de la "forme" de la distribution des données. Il permet de voir les pics (modes) et la symétrie. Il est particulièrement utile pour comparer plusieurs distributions sur un même graphique.
Chapitre 4
Courbes des Effectifs et Fréquences Cumulés
Courbe des Effectifs Cumulés Croissants (ECC)
Cette courbe montre comment les effectifs s'accumulent au fur et à mesure que l'on considère des valeurs plus grandes du caractère.
- Construction (points, segments) :
- Pour un caractère discret : Placez un point pour chaque valeur du caractère . Reliez ces points par des segments horizontaux et verticaux (en "escalier") ou par des segments de droite.
- Pour un caractère regroupé en classes : Placez un point à l'extrémité supérieure de chaque classe , où est la borne supérieure de la -ème classe et est l'effectif cumulé croissant de cette classe. Ajoutez un point où est la borne inférieure de la première classe. Reliez ces points par des segments de droite.
- Lecture des valeurs : Pour une valeur donnée sur l'axe des abscisses, on peut lire sur l'axe des ordonnées le nombre d'individus ayant une valeur inférieure ou égale à cette valeur.
- Utilisation pour les quantiles : Elle est cruciale pour déterminer graphiquement la médiane, les quartiles, les déciles, etc. Par exemple, pour la médiane, on cherche la valeur du caractère correspondant à sur l'axe des effectifs cumulés.
Courbe des Fréquences Cumulées Croissantes (FCC)
La courbe des fréquences cumulées croissantes est très similaire à la courbe des ECC, mais elle utilise les fréquences (ou pourcentages) au lieu des effectifs.
- Construction similaire à l'ECC :
- Pour un caractère discret : Placez un point pour chaque valeur du caractère .
- Pour un caractère regroupé en classes : Placez un point à l'extrémité supérieure de chaque classe . Ajoutez un point . Reliez les points par des segments de droite.
- L'axe des ordonnées va de 0 à 1 (ou de 0 % à 100 %).
- Lecture des pourcentages : Pour une valeur donnée du caractère, on peut lire le pourcentage d'individus ayant une valeur inférieure ou égale à cette valeur.
- Détermination graphique de la médiane et des quartiles :
- Médiane () : C'est la valeur du caractère pour laquelle la fréquence cumulée est de 0,5 (ou 50 %). On trace une ligne horizontale à 0,5 sur l'axe des fréquences cumulées, puis on descend verticalement jusqu'à l'axe des abscisses pour lire la médiane.
- Premier quartile () : C'est la valeur du caractère pour laquelle la fréquence cumulée est de 0,25 (ou 25 %).
- Troisième quartile () : C'est la valeur du caractère pour laquelle la fréquence cumulée est de 0,75 (ou 75 %). Ces courbes sont fondamentales pour l'analyse des positions des données dans la distribution.
Chapitre 5
Choix et Interprétation des Représentations Graphiques
Critères de Choix d'un Graphique
- Type de caractère (discret, continu, qualitatif) :
- Qualitatif : Diagramme en barres, diagramme circulaire.
- Quantitatif discret : Diagramme en bâtons, diagramme circulaire (si peu de valeurs).
- Quantitatif continu ou regroupé en classes : Histogramme, polygone des fréquences, courbes de fréquences cumulées.
- Objectif de la représentation (comparaison, distribution, évolution) :
- Comparer des proportions : Diagramme circulaire.
- Comparer des effectifs/fréquences de catégories : Diagramme en barres, diagramme en bâtons.
- Visualiser la forme d'une distribution : Histogramme, polygone des fréquences.
- Déterminer des quantiles : Courbes des fréquences cumulées.
- Clarté et lisibilité : Le graphique doit être facile à comprendre, bien légendé, avec des titres clairs et des unités sur les axes. Il ne doit pas être surchargé d'informations.
Analyse et Interprétation
Une fois le graphique construit, l'étape suivante est de l'analyser pour en tirer des conclusions.
- Forme de la distribution (symétrique, asymétrique) :
- Une distribution est symétrique si le graphique est à peu près le même des deux côtés d'un axe central (souvent autour du mode ou de la médiane).
- Une distribution est asymétrique (ou "oblique") si elle est étirée d'un côté. On parle d'asymétrie à droite (queue étirée vers les grandes valeurs) ou à gauche (queue étirée vers les petites valeurs).
- Identification des modes : Le mode est la valeur (ou la classe) qui a l'effectif (ou la fréquence) le plus élevé. Sur un graphique, c'est le "pic" le plus haut. Une distribution peut être unimodale (un seul pic), bimodale (deux pics), etc.
- Détection de valeurs aberrantes (outliers) : Ce sont des valeurs très éloignées de la majorité des autres données. Elles peuvent apparaître comme des points isolés ou des barres très courtes et très éloignées des autres sur certains graphiques. Elles nécessitent souvent une investigation particulière car elles peuvent indiquer une erreur de mesure ou un phénomène exceptionnel.
Limites et Précautions
Les représentations graphiques sont puissantes, mais elles peuvent aussi être trompeuses si elles sont mal utilisées.
- Effet d'échelle : La modification des échelles des axes peut radicalement changer l'apparence d'un graphique, rendant une petite différence significative ou une grande différence minime. Soyez toujours attentifs aux échelles des axes.
- Manipulation des données : Le choix des classes, le début des axes (ne pas commencer à zéro peut être trompeur), ou la suppression de certaines données peuvent altérer la perception de la réalité.
- Représentations trompeuses : Certains graphiques peuvent être intentionnellement conçus pour induire en erreur (par exemple, des diagrammes en 3D où la perspective fausse la perception des proportions). Il est important d'avoir un esprit critique face à tout graphique.
- Vérifiez toujours les sources, les légendes, les unités et la cohérence de l'information présentée.
En résumé, les représentations graphiques sont des outils puissants pour comprendre les séries statistiques, mais leur efficacité repose sur une construction rigoureuse et une interprétation critique.
Après la lecture
Passe à la pratique avec deux blocs bien visibles
Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.
Suite naturelle
Tu veux aller plus loin que l'article ?
Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.