Éducation nationale françaiseMathématiquesSeconde générale et technologique22 min de lecture

Statistiques et probabilités

Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.

Lecture

5 chapitres

Un parcours éditorialisé et navigable.

Pratique

12 questions

Quiz et cartes mémoire à ouvrir après la lecture.

Objectif

Seconde générale et technologique

Format rapide pour vérifier si le chapitre correspond.

Chapitre 1

I. Rappels sur les séries statistiques

1. Vocabulaire de base et types de caractères

Pour bien comprendre les statistiques, il est essentiel de maîtriser le vocabulaire.

  • Population : C'est l'ensemble de tous les éléments que l'on étudie. Par exemple, tous les élèves d'un lycée, tous les habitants d'une ville, toutes les voitures produites par une usine.
  • Individu (ou unité statistique) : C'est un élément de la population. Si la population est les élèves d'un lycée, un élève est un individu.
  • Échantillon : C'est une partie (un sous-ensemble) de la population étudiée. On étudie souvent un échantillon quand la population est trop grande pour être étudiée entièrement.
  • Caractère (ou variable statistique) : C'est la propriété que l'on étudie sur les individus de la population. Par exemple, la taille des élèves, la couleur des yeux, le nombre de frères et sœurs.

Il existe deux grands types de caractères :

  • Caractère qualitatif : Il décrit une qualité, une catégorie. Ses valeurs ne peuvent pas être mesurées numériquement.

    • Exemples : couleur des yeux (bleu, vert, marron), catégorie socio-professionnelle (ouvrier, cadre), marque de téléphone.
  • Caractère quantitatif : Il décrit une quantité, une valeur numérique. Ses valeurs peuvent être mesurées.

    • Exemples : taille (en cm), âge (en années), nombre d'enfants, note à un examen.
    • On distingue parfois les caractères quantitatifs discrets (qui prennent des valeurs isolées, souvent des entiers, comme le nombre d'enfants) et continus (qui peuvent prendre n'importe quelle valeur dans un intervalle, comme la taille ou le poids).
  • Série statistique : C'est l'ensemble des données brutes recueillies pour un caractère donné sur une population ou un échantillon.

  • Effectif (d'une valeur ou d'une modalité) : C'est le nombre de fois qu'une valeur ou une modalité du caractère apparaît dans la série statistique.

  • Effectif total : C'est le nombre total d'individus dans l'étude (somme de tous les effectifs).

  • Fréquence (d'une valeur ou d'une modalité) : C'est la proportion de fois où une valeur ou une modalité apparaît. Elle se calcule par la formule : Freˊquence=Effectif de la valeurEffectif total\text{Fréquence} = \frac{\text{Effectif de la valeur}}{\text{Effectif total}} La fréquence est un nombre compris entre 0 et 1. On peut aussi l'exprimer en pourcentage en la multipliant par 100. La somme de toutes les fréquences (ou de tous les pourcentages) doit toujours être égale à 1 (ou 100%).

2. Représentations graphiques

Les graphiques permettent de visualiser rapidement les données d'une série statistique et d'en dégager des tendances.

  • Diagramme en bâtons : Utilisé pour les caractères qualitatifs ou quantitatifs discrets. Chaque bâton représente l'effectif ou la fréquence d'une modalité. La hauteur du bâton est proportionnelle à l'effectif ou à la fréquence.
    • Exemple : Nombre d'élèves par sport pratiqué.
  • Histogramme : Utilisé pour les caractères quantitatifs continus regroupés en classes. Les données sont représentées par des rectangles contigus. L'aire de chaque rectangle est proportionnelle à l'effectif de la classe.
    • Exemple : Répartition des tailles des élèves.
    • Attention : si les classes n'ont pas la même amplitude, la hauteur du rectangle doit être ajustée pour que l'aire soit proportionnelle à l'effectif.
  • Diagramme circulaire (ou "camembert") / semi-circulaire : Utilisé pour représenter la répartition d'un caractère qualitatif ou quantitatif discret. Chaque secteur (ou tranche) représente une modalité, et son angle est proportionnel à l'effectif ou à la fréquence.
    • L'angle pour une modalité est calculé par : Angle=Freˊquence×360\text{Angle} = \text{Fréquence} \times 360^\circ (pour un cercle complet).
    • Exemple : Répartition des votes pour différents candidats.

Interprétation des graphiques : Un bon graphique doit être clair et permettre de :

  • Identifier rapidement les valeurs les plus fréquentes (le mode).
  • Comparer les proportions entre les différentes catégories.
  • Saisir la "forme" de la distribution (symétrique, asymétrique, étalée, concentrée...).

3. Indicateurs de position

Les indicateurs de position nous donnent une idée de la "valeur centrale" ou typique d'une série statistique.

  • Moyenne arithmétique (xˉ\bar{x} ou MM) : C'est la somme de toutes les valeurs divisée par l'effectif total.
    • Pour une série de valeurs x1,x2,...,xNx_1, x_2, ..., x_N : xˉ=x1+x2+...+xNN\bar{x} = \frac{x_1 + x_2 + ... + x_N}{N}
    • Pour une série avec effectifs (nin_i pour la valeur xix_i) : xˉ=n1x1+n2x2+...+npxpN=i=1pnixiN\bar{x} = \frac{n_1 x_1 + n_2 x_2 + ... + n_p x_p}{N} = \frac{\sum_{i=1}^{p} n_i x_i}{N}
    • La moyenne est sensible aux valeurs extrêmes (valeurs très grandes ou très petites).
  • Médiane (MeMe) : C'est la valeur qui partage la série statistique (ordonnée !) en deux groupes de même effectif. Il y a autant de valeurs inférieures ou égales à la médiane qu'il y a de valeurs supérieures ou égales.
    • Méthode de calcul :
      1. Ordonner la série par ordre croissant.
      2. Si l'effectif total (NN) est impair, la médiane est la valeur de rang N+12\frac{N+1}{2}.
      3. Si l'effectif total (NN) est pair, la médiane est n'importe quelle valeur entre les deux valeurs centrales de rang N2\frac{N}{2} et N2+1\frac{N}{2} + 1. Par convention, on prend souvent la moyenne de ces deux valeurs.
    • Exemple : Série (ordonnée) : 1, 3, 5, 7, 9. N=5N=5. Médiane = 5 (valeur de rang 3).
    • Exemple : Série (ordonnée) : 1, 3, 5, 7, 9, 11. N=6N=6. Médiane = n'importe quelle valeur entre 5 et 7. On prend souvent 5+72=6\frac{5+7}{2} = 6.
    • La médiane est moins sensible aux valeurs extrêmes que la moyenne.
  • Mode : C'est la valeur (ou la modalité) qui a le plus grand effectif (ou la plus grande fréquence). C'est la valeur la plus fréquente de la série.
    • Une série peut avoir un mode, plusieurs modes, ou pas de mode du tout si toutes les valeurs ont le même effectif.

4. Indicateurs de dispersion

Les indicateurs de dispersion nous renseignent sur l'étalement ou la concentration des données autour d'une valeur centrale.

  • Étendue : C'est la différence entre la valeur maximale et la valeur minimale de la série. Eˊtendue=Valeur maximaleValeur minimale\text{Étendue} = \text{Valeur maximale} - \text{Valeur minimale} L'étendue est facile à calculer mais très sensible aux valeurs extrêmes.
  • Quartiles (Q1,Q3Q_1, Q_3) :
    • Pour calculer les quartiles, il faut d'abord ordonner la série.
    • Le premier quartile (Q1Q_1) est la plus petite valeur telle qu'au moins 25% des données lui sont inférieures ou égales. C'est la médiane de la première moitié de la série.
    • Le troisième quartile (Q3Q_3) est la plus petite valeur telle qu'au moins 75% des données lui sont inférieures ou égales. C'est la médiane de la seconde moitié de la série.
    • Méthode de calcul (simplifiée en Seconde) :
      1. Calculer N4\frac{N}{4}.
      2. Si N4\frac{N}{4} est un entier, Q1Q_1 est la moyenne de la valeur de rang N4\frac{N}{4} et de la valeur de rang N4+1\frac{N}{4} + 1.
      3. Si N4\frac{N}{4} n'est pas un entier, Q1Q_1 est la valeur de rang E(N4)+1\text{E}(\frac{N}{4}) + 1 (où E est la fonction partie entière).
      4. Même principe pour Q3Q_3 avec 3N4\frac{3N}{4}.
  • Écart interquartile (IQRIQR) : C'est la différence entre le troisième quartile et le premier quartile. IQR=Q3Q1IQR = Q_3 - Q_1 L'écart interquartile représente l'étendue des 50% des valeurs centrales de la série. Il est moins sensible aux valeurs extrêmes que l'étendue.
  • Variance (VV) et écart-type (σ\sigma) (introduction) : Ces indicateurs mesurent la dispersion des données autour de la moyenne.
    • La variance est la moyenne des carrés des écarts à la moyenne. Elle est donnée par la formule : V=i=1pni(xixˉ)2NV = \frac{\sum_{i=1}^{p} n_i (x_i - \bar{x})^2}{N} C'est un indicateur très utilisé mais son unité est le carré de l'unité des données, ce qui la rend difficile à interpréter directement.
    • L'écart-type est la racine carrée de la variance. σ=V\sigma = \sqrt{V} L'écart-type s'exprime dans la même unité que les données, ce qui le rend plus facile à interpréter. Un petit écart-type indique que les données sont proches de la moyenne, tandis qu'un grand écart-type indique qu'elles sont plus dispersées. Ces deux indicateurs sont très importants en statistiques, mais leur calcul détaillé et leur interprétation approfondie seront vus dans les classes supérieures.

Chapitre 2

II. Introduction aux probabilités

1. Expérience aléatoire et vocabulaire

  • Expérience aléatoire : C'est une expérience dont on ne peut pas prédire le résultat avec certitude, mais dont on connaît tous les résultats possibles.
    • Exemples : Lancer un dé, tirer une carte d'un jeu, lancer une pièce de monnaie.
  • Univers des possibles (Ω\Omega) : C'est l'ensemble de tous les résultats possibles d'une expérience aléatoire. On l'appelle aussi l'ensemble des éventualités.
    • Exemple : Pour le lancer d'un dé à six faces, Ω={1,2,3,4,5,6}\Omega = \{1, 2, 3, 4, 5, 6\}.
    • Exemple : Pour le lancer d'une pièce, Ω={Pile, Face}\Omega = \{\text{Pile, Face}\}.
  • Événement : C'est un sous-ensemble de l'univers des possibles. C'est une réalisation particulière de l'expérience aléatoire.
    • Exemple : "Obtenir un nombre pair" au lancer de dé. Cet événement est {2,4,6}\{2, 4, 6\}.
  • Événement élémentaire : C'est un événement qui ne contient qu'un seul résultat possible de l'expérience aléatoire.
    • Exemple : "Obtenir 3" au lancer de dé. Cet événement est {3}\{3\}.
  • Événement impossible : C'est un événement qui ne peut jamais se produire. Sa probabilité est 0.
    • Exemple : "Obtenir 7" au lancer de dé.
  • Événement certain : C'est un événement qui se produit toujours. Il est égal à l'univers des possibles. Sa probabilité est 1.
    • Exemple : "Obtenir un nombre inférieur à 7" au lancer de dé.

2. Fréquence et probabilité

  • Fréquence d'un événement : Si on répète une expérience aléatoire un grand nombre de fois, la fréquence d'un événement est le rapport entre le nombre de fois où l'événement s'est produit et le nombre total de répétitions. Freˊquence (F)=Nombre de reˊalisations de l’eˊveˊnementNombre total de reˊpeˊtitions\text{Fréquence (F)} = \frac{\text{Nombre de réalisations de l'événement}}{\text{Nombre total de répétitions}}
  • Loi des grands nombres : C'est un principe fondamental des probabilités. Il dit que lorsque l'on répète une expérience aléatoire un très grand nombre de fois, la fréquence d'un événement a tendance à se stabiliser autour d'une valeur fixe. Cette valeur est la probabilité de l'événement.
    • Plus le nombre de répétitions est grand, plus la fréquence observée est proche de la probabilité théorique.
  • Définition de la probabilité : La probabilité d'un événement AA, notée P(A)P(A), est un nombre qui mesure sa "chance" de se produire.
    • Une probabilité est toujours un nombre compris entre 0 et 1 (inclus).
    • P(A)=0P(A) = 0 signifie que l'événement AA est impossible.
    • P(A)=1P(A) = 1 signifie que l'événement AA est certain.
    • La somme des probabilités de tous les événements élémentaires de l'univers est égale à 1.

3. Calcul de probabilités

  • Cas d'équiprobabilité : Une situation est dite en équiprobabilité lorsque tous les événements élémentaires ont la même probabilité de se réaliser.
    • Exemples : Lancer un dé équilibré, tirer une carte d'un jeu bien mélangé, tirer une boule d'une urne où toutes les boules sont identiques sauf la couleur.
    • Dans ce cas, la probabilité de chaque événement élémentaire est 1Nombre total d’eˊveˊnements eˊleˊmentaires\frac{1}{\text{Nombre total d'événements élémentaires}}.
  • Formule P(A)=nombre de cas favorablesnombre de cas possiblesP(A) = \frac{\text{nombre de cas favorables}}{\text{nombre de cas possibles}} : C'est la formule clé pour calculer les probabilités en situation d'équiprobabilité.
    • Cas favorables : Le nombre de résultats de l'expérience qui réalisent l'événement AA.
    • Cas possibles : Le nombre total de résultats possibles de l'expérience (soit le nombre d'éléments dans Ω\Omega).
    • Exemple : Au lancer d'un dé équilibré, quelle est la probabilité d'obtenir un nombre pair ?
      • Cas possibles : {1,2,3,4,5,6}\{1, 2, 3, 4, 5, 6\}, soit 6 cas.
      • Cas favorables à "obtenir un nombre pair" : {2,4,6}\{2, 4, 6\}, soit 3 cas.
      • P(obtenir pair)=36=12=0,5P(\text{obtenir pair}) = \frac{3}{6} = \frac{1}{2} = 0,5.
  • Probabilités et pourcentages : Une probabilité peut être exprimée sous forme de fraction, de nombre décimal ou de pourcentage.
    • P(A)=0,5P(A) = 0,5 est équivalent à P(A)=12P(A) = \frac{1}{2} ou P(A)=50%P(A) = 50\%.

Chapitre 3

III. Événements et opérations sur les événements

1. Événement contraire

  • Définition de l'événement contraire (Aˉ\bar{A} ou AcA^c) : L'événement contraire de AA, noté Aˉ\bar{A}, est l'événement qui se réalise si et seulement si AA ne se réalise pas.
    • Aˉ\bar{A} contient tous les événements élémentaires de Ω\Omega qui ne sont pas dans AA.
    • Exemple : Si AA est "obtenir un nombre pair" au lancer de dé, alors Aˉ\bar{A} est "obtenir un nombre impair".
  • Propriété P(Aˉ)=1P(A)P(\bar{A}) = 1 - P(A) : C'est une propriété très utile pour calculer des probabilités. Si on connaît la probabilité d'un événement, on peut facilement trouver celle de son contraire.
    • Exemple : Si la probabilité de gagner à un jeu est P(G)=0,2P(G) = 0,2, alors la probabilité de ne pas gagner est P(Gˉ)=10,2=0,8P(\bar{G}) = 1 - 0,2 = 0,8.
  • Application au calcul de probabilités : Cette formule est souvent utilisée quand il est plus simple de calculer la probabilité de Aˉ\bar{A} que celle de AA directement.
    • Exemple : Quelle est la probabilité d'obtenir "au moins un 6" en lançant deux dés ? C'est plus facile de calculer la probabilité de son contraire ("aucun 6") puis de faire 1P(aucun 6)1 - P(\text{aucun 6}).

2. Union et intersection d'événements

  • Événement "A et B" (ABA \cap B) : C'est l'événement qui se réalise si et seulement si les deux événements AA et BB se réalisent simultanément.
    • Il correspond à l'intersection des ensembles AA et BB.
    • Exemple : AA = "obtenir un nombre pair", BB = "obtenir un multiple de 3". ABA \cap B = "obtenir un nombre pair ET un multiple de 3" = "obtenir 6".
  • Événement "A ou B" (ABA \cup B) : C'est l'événement qui se réalise si et seulement si l'événement AA se réalise ou l'événement BB se réalise (ou les deux).
    • Il correspond à l'union des ensembles AA et BB.
    • Exemple : AA = "obtenir un nombre pair", BB = "obtenir un multiple de 3". ABA \cup B = "obtenir un nombre pair OU un multiple de 3" = {2,3,4,6}\{2, 3, 4, 6\}.
  • Événements incompatibles : Deux événements AA et BB sont dits incompatibles (ou disjoints) s'ils ne peuvent pas se réaliser en même temps.
    • Leur intersection est l'ensemble vide : AB=A \cap B = \emptyset.
    • Si AA et BB sont incompatibles, alors P(AB)=0P(A \cap B) = 0.
    • Exemple : "Obtenir un nombre pair" et "obtenir 1" au lancer de dé sont incompatibles.

3. Formule d'addition des probabilités

  • P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B) : C'est la formule générale pour calculer la probabilité de l'union de deux événements.
    • On soustrait P(AB)P(A \cap B) car les éléments communs à AA et BB seraient comptés deux fois si l'on faisait simplement P(A)+P(B)P(A) + P(B).
    • Exemple : Dans une classe, 60% des élèves aiment les maths (M), 40% aiment le français (F), et 20% aiment les deux (M et F). Quelle est la probabilité qu'un élève aime les maths ou le français ? P(MF)=P(M)+P(F)P(MF)=0,60+0,400,20=0,80P(M \cup F) = P(M) + P(F) - P(M \cap F) = 0,60 + 0,40 - 0,20 = 0,80.
  • Cas des événements incompatibles : P(AB)=P(A)+P(B)P(A \cup B) = P(A) + P(B) : Si AA et BB sont incompatibles, alors P(AB)=0P(A \cap B) = 0, et la formule se simplifie.
    • Exemple : La probabilité de tirer un roi est P(R)=4/52P(R) = 4/52. La probabilité de tirer une dame est P(D)=4/52P(D) = 4/52. Les événements "tirer un roi" et "tirer une dame" sont incompatibles. Donc P(RD)=P(R)+P(D)=4/52+4/52=8/52=2/13P(R \cup D) = P(R) + P(D) = 4/52 + 4/52 = 8/52 = 2/13.
  • Utilisation dans des problèmes concrets : Ces formules sont très importantes pour résoudre des problèmes de probabilités où plusieurs événements sont impliqués. Bien identifier ce que sont AA, BB, ABA \cap B, ABA \cup B et Aˉ\bar{A} est la clé pour bien appliquer les formules.

Chapitre 4

IV. Représentation des situations probabilistes

1. Tableaux à double entrée

Les tableaux à double entrée (ou tableaux de contingence) sont très utiles pour organiser des données lorsqu'on étudie deux caractères simultanément.

  • Construction d'un tableau à double entrée : On place les modalités d'un caractère en lignes et celles de l'autre caractère en colonnes. Les cellules contiennent les effectifs (ou les fréquences) des combinaisons des modalités. Les totaux en marge donnent les effectifs (ou fréquences) de chaque modalité prise isolément.

    Caractère B1Caractère B2Total (A)
    Caractère A1n1n_1n2n_2N1N_1
    Caractère A2n3n_3n4n_4N2N_2
    Total (B)M1M_1M2M_2NN

    NN est l'effectif total.

  • Lecture des effectifs et fréquences :

    • Les nombres à l'intérieur du tableau sont les effectifs (ou fréquences) d'événements conjoints (ex: A1B1A1 \cap B1).
    • Les totaux en marge sont les effectifs (ou fréquences) d'événements simples (ex: A1A1).
  • Calcul de probabilités à partir du tableau : En divisant les effectifs par l'effectif total, on obtient les fréquences, qui sont souvent utilisées comme probabilités.

    • P(A1)=N1/NP(A1) = N_1 / N
    • P(B2)=M2/NP(B2) = M_2 / N
    • P(A1B1)=n1/NP(A1 \cap B1) = n_1 / N
    • P(A1B2)P(A1 \cup B2) peut être calculé avec la formule d'addition.

2. Arbres de probabilités

Les arbres de probabilités (ou arbres pondérés) sont particulièrement adaptés pour représenter des expériences successives ou des situations où les événements dépendent les uns des autres.

  • Construction d'un arbre pondéré :

    1. Chaque "nœud" représente un événement possible.
    2. Les "branches" partant d'un nœud représentent les résultats possibles de l'étape suivante de l'expérience.
    3. Chaque branche est "pondérée" par la probabilité de l'événement qu'elle représente, sachant que l'on est arrivé au nœud précédent.
    4. La somme des probabilités des branches partant d'un même nœud doit toujours être égale à 1.
  • Chemins et probabilités des événements :

    • Un "chemin" de la racine de l'arbre jusqu'à une feuille représente une séquence d'événements.
    • La probabilité d'un chemin est le produit des probabilités des branches qui le composent.
    • La probabilité d'un événement qui peut être réalisé par plusieurs chemins est la somme des probabilités de ces chemins.
  • Utilisation pour des expériences successives : Très utile pour modéliser des tirages successifs avec ou sans remise, ou des choix en plusieurs étapes.

    Exemple : Tirage de 2 boules d'une urne contenant 3 rouges (R) et 2 bleues (B), sans remise.

    Départ
    |
    |--- P(R1) = 3/5 --- R1 --- P(R2|R1) = 2/4 --- R2  (P = 3/5 * 2/4 = 6/20)
    |               |
    |               |--- P(B2|R1) = 2/4 --- B2  (P = 3/5 * 2/4 = 6/20)
    |
    |--- P(B1) = 2/5 --- B1 --- P(R2|B1) = 3/4 --- R2  (P = 2/5 * 3/4 = 6/20)
                    |
                    |--- P(B2|B1) = 1/4 --- B2  (P = 2/5 * 1/4 = 2/20)
    

    Probabilité d'avoir deux boules de même couleur : P(R1R2)+P(B1B2)=6/20+2/20=8/20=2/5P(R1 \cap R2) + P(B1 \cap B2) = 6/20 + 2/20 = 8/20 = 2/5.

3. Diagrammes de Venn

Les diagrammes de Venn sont des représentations visuelles des ensembles et de leurs relations, très utiles pour comprendre les opérations sur les événements.

  • Représentation visuelle des événements :
    • L'univers des possibles Ω\Omega est représenté par un rectangle.
    • Les événements sont représentés par des cercles (ou d'autres formes) à l'intérieur du rectangle.
  • Intersection et union d'événements :
    • L'intersection ABA \cap B est la zone où les cercles de AA et BB se chevauchent.
    • L'union ABA \cup B est la zone couverte par les deux cercles (la partie hachurée dans AA, la partie hachurée dans BB, et leur chevauchement).
    • L'événement contraire Aˉ\bar{A} est la zone du rectangle en dehors du cercle AA.
  • Compréhension des relations entre événements : Les diagrammes de Venn aident à visualiser si des événements sont incompatibles (cercles séparés), si l'un est inclus dans l'autre, etc. Ils sont particulièrement efficaces pour illustrer la formule P(AB)=P(A)+P(B)P(AB)P(A \cup B) = P(A) + P(B) - P(A \cap B).

Chapitre 5

V. Simulation et prise de décision

1. Simulation d'expériences aléatoires

  • Utilisation de dés, pièces, urnes : Ce sont des outils physiques simples pour simuler des expériences aléatoires de base.
    • Lancer un dé : simule un choix parmi 6 possibilités équiprobables.
    • Lancer une pièce : simule un choix binaire (Pile/Face) équiprobable.
    • Tirer des boules d'une urne : simule des tirages avec des probabilités spécifiques.
  • Simulation avec un tableur ou une calculatrice : Pour répéter un grand nombre de fois une expérience, on utilise des outils numériques.
    • Les fonctions ALEA() ou RAND() génèrent des nombres aléatoires entre 0 et 1. On peut les adapter pour simuler des lancers de dés (ex: ENT(ALEA()*6)+1) ou des tirages avec des probabilités données.
    • Les calculatrices scientifiques ont souvent des fonctions de génération de nombres aléatoires entiers ou décimaux.
  • Rôle de la répétition des expériences : La simulation est basée sur la loi des grands nombres. Plus on répète l'expérience, plus les fréquences observées se rapprochent des probabilités théoriques. Cela permet d'estimer des probabilités dans des situations complexes où le calcul direct est difficile.

2. Prise de décision à partir de résultats statistiques

  • Interprétation des fréquences observées : Après une simulation ou une collecte de données, on obtient des fréquences. Ces fréquences sont des estimations des probabilités réelles.
  • Comparaison avec les probabilités théoriques : Si on connaît la probabilité théorique d'un événement, on peut comparer les fréquences observées avec cette probabilité.
    • Si les fréquences sont très proches des probabilités théoriques, cela renforce la confiance dans le modèle théorique (ex: le dé est bien équilibré).
    • Si les fréquences s'éloignent significativement des probabilités théoriques, cela peut suggérer que le modèle théorique est incorrect (ex: le dé est truqué) ou que l'échantillon est trop petit.
  • Notion de fluctuation d'échantillonnage : Même si une pièce est parfaitement équilibrée (P(Pile)=0,5P(\text{Pile})=0,5), il est peu probable d'obtenir exactement 50 Pile sur 100 lancers. Les fréquences observées varient d'un échantillon à l'autre. C'est la fluctuation d'échantillonnage.
    • Plus la taille de l'échantillon est grande, moins cette fluctuation est importante et plus la fréquence observée est proche de la probabilité réelle.
    • La prise de décision doit tenir compte de cette fluctuation : une petite différence entre fréquence observée et probabilité théorique n'est pas forcément significative.

3. Biais et erreurs d'interprétation

  • Importance de la taille de l'échantillon : Un échantillon trop petit ne permet pas de tirer des conclusions fiables. Les fréquences observées peuvent être très éloignées des probabilités réelles.
    • Exemple : Observer 3 Pile sur 5 lancers ne permet pas de conclure que la pièce est truquée, car la fluctuation est forte sur un petit nombre de tirages.
  • Erreurs courantes d'interprétation des statistiques :
    • Corrélation n'implique pas causalité : Ce n'est pas parce que deux phénomènes varient ensemble qu'ils sont liés par une relation de cause à effet.
    • Biais de sélection : L'échantillon n'est pas représentatif de la population. Si on interroge uniquement des personnes âgées sur l'utilisation des réseaux sociaux, les résultats seront biaisés.
    • Biais de confirmation : Tendance à ne retenir que les informations qui confirment nos idées préconçues.
    • Confusion entre probabilité et certitude : Une probabilité de 90% ne signifie pas que l'événement se produira à coup sûr.
  • Esprit critique face aux données : Il est essentiel de toujours se poser des questions face aux statistiques et aux probabilités présentées :
    • Qui a collecté les données ? Comment ? Quel était l'objectif ?
    • Quelle est la taille de l'échantillon ? Est-il représentatif ?
    • Comment les résultats sont-ils présentés ? Y a-t-il un risque de manipulation ?
    • Développer un esprit critique est crucial pour ne pas être trompé par des statistiques mal utilisées ou mal interprétées.

Après la lecture

Passe à la pratique avec deux blocs bien visibles

Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.

Quiz + Flashcards

Suite naturelle

Tu veux aller plus loin que l'article ?

Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.