Éducation nationale françaiseSpécialité MathématiquesTerminale générale15 min de lecture

Estimation et tests d'hypothèses

Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.

Lecture

4 chapitres

Un parcours éditorialisé et navigable.

Pratique

12 questions

Quiz et cartes mémoire à ouvrir après la lecture.

Objectif

Terminale générale

Format rapide pour vérifier si le chapitre correspond.

Chapitre 1

Introduction à l'échantillonnage et à l'estimation

Population, échantillon et fluctuation d'échantillonnage

En statistiques, une population désigne l'ensemble de tous les individus ou objets que nous souhaitons étudier. Par exemple, tous les lycéens de France, toutes les ampoules produites par une usine, ou tous les électeurs d'un pays. Il est souvent impossible d'observer la totalité de cette population.

Un échantillon est un sous-ensemble de cette population, sélectionné de manière à être représentatif. Par exemple, 1000 lycéens tirés au sort parmi tous les lycéens de France. La manière dont l'échantillon est choisi est cruciale pour la validité des conclusions. Un échantillon doit être aléatoire et de taille suffisante.

La taille d'échantillon (nn) est le nombre d'individus ou d'observations dans l'échantillon. Une taille d'échantillon plus grande tend à donner des résultats plus fiables.

La fluctuation d'échantillonnage est un concept clé : si nous prélevons plusieurs échantillons de même taille dans la même population, les caractéristiques observées dans chacun de ces échantillons (par exemple, la proportion d'une certaine propriété) ne seront pas exactement les mêmes. Il y aura une certaine variabilité. Cette variabilité est naturelle et attendue ; elle n'est pas due à une erreur de mesure, mais au simple fait que l'on travaille avec un sous-ensemble de la population. C'est cette fluctuation qui nous empêche de tirer des conclusions avec une certitude absolue, mais nous permet de le faire avec une certaine probabilité.

Fréquence observée et proportion théorique

Lorsque nous étudions une caractéristique dans un échantillon, nous parlons de fréquence observée. C'est le rapport entre le nombre d'individus de l'échantillon présentant cette caractéristique et la taille totale de l'échantillon. Par exemple, si sur 1000 lycéens interrogés, 600 déclarent aimer les mathématiques, la fréquence observée est f=6001000=0,6f = \frac{600}{1000} = 0,6.

La proportion théorique (ou proportion réelle, notée pp) est la vraie proportion de cette caractéristique dans l'ensemble de la population. C'est une valeur inconnue que nous cherchons souvent à estimer. Dans notre exemple, c'est la proportion réelle de tous les lycéens de France qui aiment les mathématiques.

La fréquence observée ff est une estimation de la proportion théorique pp. Plus l'échantillon est grand et bien choisi, plus la fréquence observée sera proche de la proportion théorique. La fréquence observée est une variable aléatoire, tandis que la proportion théorique est une constante (inconnue).

Le lien avec la probabilité est direct : si on tire un individu au hasard de la population, la probabilité qu'il présente la caractéristique étudiée est égale à la proportion théorique pp.

Intervalle de fluctuation asymptotique (IFA)

L'intervalle de fluctuation asymptotique (IFA) pour une proportion est un intervalle qui donne une idée de la variabilité attendue de la fréquence observée dans un échantillon, si la proportion théorique pp de la population est connue. Il est utilisé pour déterminer si une fréquence observée dans un échantillon est "normale" ou "exceptionnelle" par rapport à une proportion théorique donnée.

L'utilité principale de l'IFA est de servir de base aux tests d'hypothèses. Il permet de dire si un échantillon est compatible avec une certaine proportion pp supposée pour la population.

La formule de l'IFA au seuil de 95% pour la fréquence observée ff d'un échantillon de taille nn, connaissant la proportion pp de la population, est : IFA=[p1.96p(1p)n;p+1.96p(1p)n]IFA = \left[p - 1.96 \sqrt{\frac{p(1-p)}{n}} ; p + 1.96 \sqrt{\frac{p(1-p)}{n}}\right] Ce 1.961.96 provient de la loi normale centrée réduite et correspond à l'intervalle centré qui contient 95% des valeurs.

Les conditions d'application de cet IFA sont cruciales :

  1. L'échantillon doit être aléatoire et indépendant.
  2. La taille de l'échantillon nn doit être suffisamment grande. On exige généralement :
    • n30n \ge 30
    • np5np \ge 5
    • n(1p)5n(1-p) \ge 5 Si ces conditions sont remplies, on peut considérer que la distribution de la fréquence observée est approximativement normale.

Si la fréquence observée ff de l'échantillon tombe en dehors de cet intervalle, il est peu probable (moins de 5% de chance) que l'échantillon provienne d'une population ayant la proportion pp supposée.

Chapitre 2

Estimation par intervalle de confiance

Principe de l'estimation ponctuelle et par intervalle

L'estimation ponctuelle d'un paramètre (comme la proportion pp de la population) consiste à donner une seule valeur comme meilleure estimation. Pour la proportion, l'estimateur ponctuel le plus naturel est la fréquence observée ff dans l'échantillon. Par exemple, si f=0,6f=0,6, on estime que p0,6p \approx 0,6. Le problème est que cette estimation est rarement exactement juste et ne donne aucune information sur sa précision.

L'estimation par intervalle fournit une plage de valeurs, appelée intervalle de confiance, dans laquelle le paramètre inconnu (ici pp) est susceptible de se trouver, avec un certain degré de confiance. C'est beaucoup plus informatif car cela donne une idée de la précision de l'estimation.

Le niveau de confiance est la probabilité que l'intervalle de confiance contienne la vraie valeur du paramètre. Il est souvent fixé à 90%, 95% ou 99%. Un niveau de confiance de 95% signifie que si l'on répétait l'expérience un grand nombre de fois, 95% des intervalles construits contiendraient la vraie proportion pp. Il ne signifie PAS qu'il y a 95% de chances que pp soit dans l'intervalle CALCULÉ.

Un estimateur est une statistique (une fonction des données de l'échantillon) utilisée pour estimer un paramètre de la population. La fréquence ff est un estimateur de la proportion pp.

Construction d'un intervalle de confiance pour une proportion

L'intervalle de confiance pour une proportion pp (au niveau de confiance de 95%) est construit à partir de la fréquence observée ff dans l'échantillon de taille nn. La formule est : IC=[f1.96f(1f)n;f+1.96f(1f)n]IC = \left[f - 1.96 \sqrt{\frac{f(1-f)}{n}} ; f + 1.96 \sqrt{\frac{f(1-f)}{n}}\right] Les conditions d'application sont similaires à celles de l'IFA :

  • n30n \ge 30
  • nf5nf \ge 5
  • n(1f)5n(1-f) \ge 5

L'interprétation du niveau de confiance est délicate. Si nous construisons un intervalle de confiance à 95% pour pp, cela signifie que si nous devions répéter le processus d'échantillonnage et de calcul de l'intervalle un très grand nombre de fois, environ 95% de ces intervalles contiendraient la vraie proportion pp de la population.

L'influence de la taille de l'échantillon est primordiale :

  • Plus la taille de l'échantillon nn est grande, plus l'intervalle de confiance est étroit (plus précis). La largeur de l'intervalle diminue en 1n\frac{1}{\sqrt{n}}. Pour diviser la largeur par 2, il faut multiplier nn par 4.
  • Plus le niveau de confiance est élevé (par exemple, 99% au lieu de 95%), plus l'intervalle est large (moins précis), car on veut être plus sûr de "capturer" la vraie valeur de pp.

Utilisation et interprétation des intervalles de confiance

La lecture d'un intervalle de confiance est directe : l'intervalle [a;b][a;b] signifie que nous sommes X% confiants que la vraie proportion pp de la population se situe entre aa et bb.

La prise de décision basée sur l'intervalle est une application courante. Par exemple, si un sondage donne un intervalle de confiance pour la proportion d'électeurs favorables à un candidat, et que cet intervalle est entièrement au-dessus de 50%, on peut conclure avec un certain niveau de confiance que le candidat est majoritaire. Si l'intervalle contient 50%, on ne peut pas conclure de manière significative.

Les limites de l'estimation par intervalle sont importantes à connaître :

  • L'intervalle ne donne pas une certitude absolue, mais une probabilité. Il y a toujours un risque (par exemple 5% pour un IC à 95%) que la vraie proportion ne soit pas dans l'intervalle.
  • La qualité de l'échantillon est fondamentale. Un échantillon biaisé, même grand, produira un intervalle de confiance inutile.
  • L'intervalle de confiance ne prédit pas le futur, il estime une caractéristique présente de la population.

Chapitre 3

Introduction aux tests d'hypothèses

Définition et objectif d'un test d'hypothèse

Un test d'hypothèse est une procédure statistique qui permet de décider si les données observées dans un échantillon sont compatibles avec une certaine hypothèse concernant la population.

L'objectif est de prendre une décision statistique : soit rejeter une hypothèse initiale (appelée hypothèse nulle), soit ne pas la rejeter.

On formule deux hypothèses :

  • L'hypothèse nulle (H0H_0) : C'est l'hypothèse de base, celle que l'on suppose vraie par défaut. Elle exprime généralement l'absence d'effet, l'absence de différence, ou qu'un paramètre est égal à une certaine valeur (ex: p=p0p = p_0). C'est l'hypothèse que l'on cherche à "réfuter" ou à "ne pas réfuter".
  • L'hypothèse alternative (H1H_1) : C'est l'hypothèse que l'on cherche à prouver. Elle contredit H0H_0 (ex: pp0p \ne p_0, p>p0p > p_0, ou p<p0p < p_0).

Le principe est de partir du principe que H0H_0 est vraie, puis de calculer la probabilité d'obtenir les observations de l'échantillon (ou des observations plus extrêmes) sous cette condition. Si cette probabilité est très faible, on rejette H0H_0 en faveur de H1H_1.

Test d'adéquation à une proportion (test de conformité)

Ce type de test est utilisé pour vérifier si la proportion observée dans un échantillon est conforme à une proportion théorique p0p_0 supposée pour la population.

La formulation des hypothèses pour un test bilatéral (on ne sait pas si pp est plus grand ou plus petit que p0p_0) est :

  • H0:p=p0H_0: p = p_0 (La proportion de la population est égale à p0p_0)
  • H1:pp0H_1: p \ne p_0 (La proportion de la population est différente de p0p_0)

La règle de décision est basée sur l'Intervalle de Fluctuation Asymptotique (IFA) au seuil de 95% (ou 5% de risque d'erreur).

  1. On calcule l'IFA pour la proportion p0p_0 sous H0H_0 : IFA=[p01.96p0(1p0)n;p0+1.96p0(1p0)n]IFA = \left[p_0 - 1.96 \sqrt{\frac{p_0(1-p_0)}{n}} ; p_0 + 1.96 \sqrt{\frac{p_0(1-p_0)}{n}}\right]
  2. On compare la fréquence observée ff de l'échantillon avec cet IFA :
    • Si fIFAf \in IFA, on ne rejette pas H0H_0. Cela signifie que la fréquence observée est compatible avec l'hypothèse que la vraie proportion est p0p_0.
    • Si fIFAf \notin IFA, on rejette H0H_0 en faveur de H1H_1. Cela signifie que la fréquence observée est trop "extrême" pour être compatible avec l'hypothèse que la vraie proportion est p0p_0.

La conclusion du test doit toujours être formulée en fonction du contexte de l'exercice et en précisant le niveau de risque. Par exemple, "Au risque de 5%, nous ne pouvons pas rejeter l'hypothèse que la proportion est de p0p_0."

Risques d'erreur de première et deuxième espèce

Lorsqu'on prend une décision basée sur un test d'hypothèse, il y a toujours un risque de se tromper. Il existe deux types d'erreurs :

  1. Erreur de première espèce (Type I) : Rejeter H0H_0 alors que H0H_0 est vraie.

    • Le risque de commettre cette erreur est noté α\alpha (alpha), et est appelé le seuil de signification du test.
    • Le plus souvent, on fixe α=0,05\alpha = 0,05 (ou 5%). Cela signifie que, si H0H_0 est vraie, il y a 5% de chances de la rejeter à tort.
    • Ce risque est contrôlé par le chercheur et est défini avant le test.
  2. Erreur de deuxième espèce (Type II) : Ne pas rejeter H0H_0 alors que H1H_1 est vraie (c'est-à-dire que H0H_0 est fausse).

    • Le risque de commettre cette erreur est noté β\beta (bêta).
    • Il est plus difficile à calculer et dépend de la vraie valeur du paramètre sous H1H_1.
    • La puissance du test est 1β1 - \beta. C'est la probabilité de rejeter H0H_0 quand H0H_0 est fausse (c'est-à-dire de prendre la bonne décision).

Il existe un compromis entre les deux types d'erreurs :

  • Diminuer α\alpha (par exemple, passer de 5% à 1%) pour être plus strict sur le rejet de H0H_0 augmente généralement β\beta.
  • Augmenter la taille de l'échantillon nn permet de diminuer simultanément α\alpha et β\beta (et donc d'augmenter la puissance du test).

Chapitre 4

Application des tests d'hypothèses

Mise en œuvre d'un test de conformité

Voici les étapes d'un test statistique pour une proportion :

  1. Formuler les hypothèses H0H_0 et H1H_1 :

    • H0:p=p0H_0: p = p_0 (valeur de référence)
    • H1:pp0H_1: p \ne p_0 (ou p<p0p < p_0 ou p>p0p > p_0 pour un test unilatéral, mais en Terminale, on se concentre sur le bilatéral \ne)
  2. Choisir le seuil de signification α\alpha : En général, α=0,05\alpha = 0,05 (soit un risque de 5%).

  3. Vérifier les conditions d'application de l'IFA : n30n \ge 30, np05np_0 \ge 5, n(1p0)5n(1-p_0) \ge 5. Si ces conditions ne sont pas respectées, le test n'est pas valide.

  4. Calculer l'intervalle de fluctuation asymptotique (IFA) au seuil de 1α1-\alpha (par exemple 95%) : IFA=[p0zα/2p0(1p0)n;p0+zα/2p0(1p0)n]IFA = \left[p_0 - z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{n}} ; p_0 + z_{\alpha/2} \sqrt{\frac{p_0(1-p_0)}{n}}\right] Pour un seuil de 5%, zα/2=1.96z_{\alpha/2} = 1.96.

  5. Calculer la statistique de test : Ici, la statistique de test est la fréquence observée f=knf = \frac{k}{n} dans l'échantillon.

  6. Prendre la décision en comparant la statistique de test avec la zone de rejet :

    • Si fIFAf \in IFA, on ne rejette pas H0H_0. L'échantillon est compatible avec l'hypothèse p=p0p=p_0.
    • Si fIFAf \notin IFA (c'est-à-dire ff est dans la zone de rejet), on rejette H0H_0 en faveur de H1H_1. L'échantillon n'est pas compatible avec l'hypothèse p=p0p=p_0.

Interprétation des résultats d'un test

La signification statistique ne signifie pas forcément une importance pratique. Un résultat peut être statistiquement significatif (on rejette H0H_0) sans avoir de grande implication dans le monde réel, surtout avec de très grands échantillons. Inversement, un petit effet important peut ne pas être détecté avec un petit échantillon.

Il est crucial de comprendre la nuance entre non-rejet de H0H_0 et acceptation de H0H_0 :

  • Ne pas rejeter H0H_0 signifie que les données de l'échantillon ne fournissent pas suffisamment de preuves pour contredire H0H_0. Cela ne signifie PAS que H0H_0 est vraie. C'est un peu comme un procès : "non coupable" ne veut pas dire "innocent", mais "non prouvé coupable".
  • Rejeter H0H_0 signifie que les données de l'échantillon sont suffisamment éloignées de ce que H0H_0 prédit pour que l'on conclue que H0H_0 est probablement fausse.

La contextualisation des conclusions est essentielle. Il faut traduire les résultats statistiques en langage clair, en fonction du problème initial. Par exemple, au lieu de dire "nous rejetons H0H_0", on dira "Au seuil de 5%, les données suggèrent que la proportion d'ampoules défectueuses n'est pas de 2%".

Exemples concrets de tests d'hypothèses

  1. Contrôle qualité : Une usine fabrique des pièces et affirme que seulement 2% d'entre elles sont défectueuses (p0=0,02p_0 = 0,02). Un contrôleur prélève un échantillon de 500 pièces et en trouve 15 défectueuses (f=15500=0,03f = \frac{15}{500} = 0,03).

    • H0:p=0,02H_0: p = 0,02
    • H1:p0,02H_1: p \ne 0,02
    • Il calcule l'IFA pour p0=0,02p_0=0,02 et n=500n=500. Si f=0,03f=0,03 est en dehors de cet IFA, il rejettera H0H_0 et conclura que la proportion de pièces défectueuses est probablement supérieure à 2%.
  2. Sondages d'opinion : Avant une élection, un candidat affirme avoir 30% d'intentions de vote (p0=0,30p_0 = 0,30). Un institut de sondage interroge 1000 personnes et trouve 270 intentions de vote pour ce candidat (f=2701000=0,27f = \frac{270}{1000} = 0,27).

    • H0:p=0,30H_0: p = 0,30
    • H1:p0,30H_1: p \ne 0,30
    • L'IFA est calculé pour p0=0,30p_0=0,30 et n=1000n=1000. Si f=0,27f=0,27 est dans l'IFA, l'institut ne peut pas rejeter l'affirmation du candidat. Si f=0,27f=0,27 est en dehors, il pourra affirmer que le score du candidat est significativement différent de 30%.
  3. Études médicales : Un nouveau traitement est testé, et on affirme qu'il est efficace dans 70% des cas (p0=0,70p_0 = 0,70). Sur un échantillon de 120 patients traités, 78 guérissent (f=78120=0,65f = \frac{78}{120} = 0,65).

    • H0:p=0,70H_0: p = 0,70
    • H1:p0,70H_1: p \ne 0,70 (ou p<0,70p < 0,70 si on s'attend à un effet moins bon)
    • En comparant f=0,65f=0,65 à l'IFA de p0=0,70p_0=0,70, les médecins pourront décider si le nouveau traitement est aussi efficace que prévu, ou si son efficacité est significativement différente.

Ces exemples montrent comment les tests d'hypothèses sont des outils puissants pour prendre des décisions basées sur des données empiriques, en quantifiant le risque d'erreur.

Après la lecture

Passe à la pratique avec deux blocs bien visibles

Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.

Quiz + Flashcards

Suite naturelle

Tu veux aller plus loin que l'article ?

Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.