Éducation nationale françaiseSpécialité SESTerminale générale14 min de lecture

Corrélation et causalité

Une version article du chapitre pour comprendre l'essentiel rapidement, vérifier si le niveau correspond, puis basculer vers Wilo pour la pratique guidée et le suivi.

Lecture

4 chapitres

Un parcours éditorialisé et navigable.

Pratique

12 questions

Quiz et cartes mémoire à ouvrir après la lecture.

Objectif

Terminale générale

Format rapide pour vérifier si le chapitre correspond.

Essayer Wilo pour réviser Aller aux quiz et flashcards Ouvrir l'app

Chapitre 1

Introduction aux Concepts de Corrélation et Causalité

Qu'est-ce que la corrélation ?

La corrélation décrit une relation statistique entre deux ou plusieurs variables, indiquant qu'elles tendent à varier ensemble. Autrement dit, si l'une change, l'autre tend à changer aussi, mais pas nécessairement à cause de l'autre.

Définition de la corrélation : Une corrélation est une mesure de la force et de la direction d'une relation linéaire entre deux variables. Elle ne dit rien sur la cause de cette relation.
Mesure de la corrélation (coefficient) : Le degré de corrélation est souvent mesuré par un coefficient, le plus connu étant le coefficient de corrélation de Pearson (noté $r$ ).
- Ce coefficient est toujours compris entre -1 et +1.
- $r = 1$ : Corrélation positive parfaite. Les deux variables augmentent ou diminuent toujours ensemble de manière proportionnelle.
- $r = -1$ : Corrélation négative parfaite. Quand l'une augmente, l'autre diminue toujours de manière proportionnelle.
- $r = 0$ : Absence de corrélation linéaire. Les variables n'ont pas de relation linéaire évidente, mais il pourrait exister une autre forme de relation.
Corrélation positive, négative, nulle :
- Corrélation positive : Les deux variables évoluent dans la même direction. Par exemple, plus on étudie, plus les chances d'avoir de bonnes notes augmentent.
- Corrélation négative : Les deux variables évoluent dans des directions opposées. Par exemple, plus le prix d'un produit augmente, moins les quantités demandées sont élevées.
- Corrélation nulle : Il n'y a pas de lien linéaire évident entre les variables. Par exemple, la taille des chaussures et le quotient intellectuel.

Une corrélation indique une tendance, pas forcément une explication.

Qu'est-ce que la causalité ?

La causalité est une relation beaucoup plus forte : elle implique qu'un événement (la cause) en produit un autre (l'effet). C'est le lien de cause à effet.

Définition de la causalité : Une relation causale existe lorsque la variation d'une variable (la cause) entraîne la variation d'une autre variable (l'effet), toutes choses égales par ailleurs.
Relation de cause à effet : Pour affirmer une causalité, il faut pouvoir montrer que sans la cause, l'effet ne se produirait pas (ou serait différent).
Antécédence, contiguïté, conjonction constante : Ce sont des critères historiques (notamment de David Hume) pour penser la causalité :
- Antécédence temporelle : La cause doit toujours précéder l'effet dans le temps. On ne peut pas être malade avant d'être exposé à un virus.
- Contiguïté : La cause et l'effet doivent être proches dans l'espace et le temps (bien que ce critère soit plus flexible dans les sciences modernes).
- Conjonction constante : Chaque fois que la cause se produit, l'effet doit se produire aussi (ou du moins, avec une forte probabilité).

Distinction fondamentale entre corrélation et causalité

C'est LE point crucial de ce chapitre. La corrélation est une simple observation statistique, tandis que la causalité est une explication du "pourquoi".

Corrélation n'implique pas causalité : Ce n'est pas parce que deux phénomènes sont liés statistiquement que l'un est la cause de l'autre. C'est l'erreur la plus fréquente en sciences sociales. Retenez cette phrase : "Corrélation n'est pas causalité."
Exemples illustratifs :
- Il y a une forte corrélation positive entre la consommation de glaces et le nombre de noyades. Est-ce que manger des glaces provoque la noyade ? Non. Les deux sont causées par une troisième variable : la chaleur estivale.
- Corrélation entre le nombre de cigognes et le nombre de naissances dans une région. Les cigognes apportent-elles les bébés ? Non, il s'agit d'une corrélation fallacieuse, souvent due à des facteurs géographiques ou ruraux.
Importance de la distinction en SES : Pour élaborer des politiques publiques efficaces, il est essentiel de comprendre les vraies causes des problèmes. Si l'on agit sur une simple corrélation sans comprendre la causalité sous-jacente, la politique risque d'être inefficace, voire contre-productive. Par exemple, si l'on pense que la pauvreté est causée par un manque de travail (corrélation), on pourrait mettre en place des mesures pour forcer les gens à travailler, alors que la vraie cause (par exemple, le manque d'opportunités ou de formation) n'est pas adressée.

Chapitre 2

Les Pièges de l'Interprétation des Corrélations

La corrélation fallacieuse (spurious correlation)

Définition : Une corrélation fallacieuse (ou corrélation illusoire, ou encore "artefact statistique") est une corrélation statistique entre deux variables qui n'ont pas de lien causal direct, mais qui semblent liées en raison d'une coïncidence ou de l'influence d'une troisième variable non identifiée.
Exemples de corrélations sans lien logique :
- La consommation de fromage et le nombre de personnes qui meurent en s'emmêlant dans leurs draps. Il existe une corrélation statistique étonnamment élevée, mais aucun lien logique.
- Le nombre de films avec Nicolas Cage et le nombre de noyades dans les piscines. Pure coïncidence statistique.
Risques d'interprétation hâtive : Tirer des conclusions causales de ces corrélations peut mener à des décisions absurdes ou inefficaces. C'est pourquoi il est essentiel de toujours chercher une explication logique et théorique derrière une corrélation observée.

Le rôle des variables cachées (variables omises)

Définition d'une variable cachée : Une variable cachée (ou variable confondante, ou variable de confusion, ou variable tierce) est une variable qui influence à la fois la variable indépendante (la cause supposée) et la variable dépendante (l'effet supposé), créant ainsi une corrélation apparente entre elles, alors qu'il n'y a pas de lien causal direct ou que le lien est indirect.
Explication de corrélations apparentes :
- Reprenons l'exemple des glaces et des noyades : la chaleur est la variable cachée. La chaleur augmente la consommation de glaces ET la fréquentation des lieux de baignade (et donc le risque de noyade).
- Corrélation positive entre le nombre de pompiers sur un incendie et l'ampleur des dégâts. Cela ne veut pas dire que les pompiers causent plus de dégâts ! La variable cachée est la taille de l'incendie : un grand incendie nécessite plus de pompiers ET cause plus de dégâts.
Nécessité de contrôler les variables : En sciences sociales, pour essayer d'établir une causalité, il est crucial de "contrôler" les variables cachées potentielles. Cela signifie les identifier et les prendre en compte dans l'analyse statistique pour isoler l'effet propre de la variable étudiée.

La causalité inverse

Définition : La causalité inverse se produit lorsque l'on pense que la variable A cause la variable B, alors qu'en réalité, c'est la variable B qui cause la variable A (ou qu'elles s'influencent mutuellement dans un cercle vicieux).
Inversion du sens de la causalité : C'est une erreur fréquente d'interprétation du sens de la relation.
Exemples en sciences sociales :
- On observe une corrélation négative entre le nombre de policiers dans une ville et le taux de criminalité. On pourrait penser que plus de policiers réduisent la criminalité. Mais il est aussi possible que les villes ayant un taux de criminalité élevé décident d'affecter plus de policiers. La causalité pourrait donc être inverse ou bidirectionnelle (plus de crimes $\rightarrow$ plus de policiers ; plus de policiers $\rightarrow$ moins de crimes).
- Corrélation entre la santé et le revenu : Est-ce que être riche rend en meilleure santé (accès aux soins, meilleure alimentation) ou est-ce que être en bonne santé permet d'avoir un meilleur revenu (plus d'énergie, moins d'absences au travail) ? Les deux sens de la causalité sont plausibles et probablement interdépendants.

Chapitre 3

Identifier et Établir des Relations de Causalité

Les critères de causalité de Hume et Mill

Ces philosophes ont posé les bases de la réflexion sur la causalité.

Antécédence temporelle : La cause doit précéder l'effet. C'est le critère le plus fondamental. Si A est la cause de B, A doit se produire avant B.
Covariation (ou conjonction constante) : Lorsque la cause est présente, l'effet est présent ; lorsque la cause est absente, l'effet est absent. Ou encore, les variations de la cause doivent être associées aux variations de l'effet. Si A varie, B doit varier en conséquence.
Absence de causes alternatives : C'est le critère le plus difficile à satisfaire en sciences sociales. Il faut pouvoir exclure que l'effet soit dû à une autre cause (une variable cachée par exemple). Si on ne peut pas isoler l'effet de la cause supposée de toutes les autres influences, on ne peut pas affirmer la causalité avec certitude.

Le défi majeur est d'éliminer toutes les autres explications possibles.

Les méthodes d'établissement de la causalité en SES

Puisqu'il est difficile de reproduire des conditions de laboratoire en sciences sociales, des méthodes spécifiques ont été développées.

Expériences contrôlées (idéal type) : C'est la méthode la plus fiable pour établir la causalité.
- On constitue deux groupes de manière aléatoire : un groupe expérimental (qui reçoit le traitement/l'intervention) et un groupe de contrôle (qui ne reçoit pas le traitement).
- Grâce à l'aléatorisation, on s'assure que les deux groupes sont, en moyenne, identiques sur toutes les caractéristiques avant l'intervention. Ainsi, toute différence observée après l'intervention peut être attribuée à l'intervention elle-même.
- Exemple : tester l'efficacité d'un nouveau programme pédagogique. On sélectionne aléatoirement des élèves pour le programme (groupe expérimental) et d'autres pour suivre le cursus habituel (groupe de contrôle).
- Limites : Souvent impossibles ou non éthiques à réaliser en sciences sociales (ex: priver un groupe de soins).
Quasi-expériences : Elles ressemblent aux expériences contrôlées mais sans l'aléatorisation complète. Elles exploitent des situations où un "traitement" est appliqué à un groupe mais pas à un autre, sans que les chercheurs n'aient le contrôle de l'assignation.
- Exemple : Comparer les résultats scolaires dans des écoles qui ont mis en place une réforme et d'autres qui ne l'ont pas fait, en essayant de contrôler statistiquement les différences initiales entre les écoles.
Méthodes statistiques avancées : Elles visent à "purifier" les corrélations des effets des variables cachées.
- Régressions multiples : Permet d'estimer l'effet d'une variable sur une autre en contrôlant simultanément l'influence de plusieurs autres variables.
- Variables instrumentales : Technique pour corriger le problème de la causalité inverse ou des variables omises.
- Appariement (matching) : Créer des groupes de comparaison "artificiels" en appariant des individus ayant des caractéristiques similaires, sauf pour la variable d'intérêt.

Le rôle de la théorie dans l'établissement de la causalité

L'analyse statistique ne suffit pas. Une bonne théorie est indispensable.

Justification théorique : Avant même de chercher une corrélation, il faut avoir une théorie, une idée logique, qui explique pourquoi on s'attend à ce qu'il y ait un lien causal. La théorie donne du sens aux observations.
Construction d'hypothèses causales : La théorie permet de formuler des hypothèses claires sur la direction et la nature du lien causal.
Modélisation des relations : Les théories aident à construire des modèles (conceptuels ou mathématiques) qui représentent les mécanismes par lesquels la cause est censée produire l'effet, et à identifier les variables pertinentes à inclure dans l'analyse.

Chapitre 4

Applications et Enjeux en Sciences Économiques et Sociales

Exemples de corrélations et causalités en économie

Inflation et chômage (courbe de Phillips) : La courbe de Phillips suggère une corrélation inverse entre l'inflation et le chômage (quand l'un baisse, l'autre monte). Pendant longtemps, on a pensé qu'il s'agissait d'une relation causale stable, permettant aux gouvernements de "choisir" entre plus d'inflation et moins de chômage. Cependant, des événements comme la stagflation (inflation + chômage élevés) ont montré que cette causalité n'était pas toujours directe ou stable, et dépendait d'autres facteurs (anticipations, chocs d'offre).
Éducation et revenu : Il existe une forte corrélation positive entre le niveau d'éducation et le niveau de revenu. Est-ce que faire de longues études cause un revenu plus élevé ? Oui, en partie (compétences, diplôme signalant des capacités). Mais il y a aussi des variables cachées (milieu social d'origine, compétences innées, motivation) qui peuvent influencer à la fois le niveau d'étude et le revenu. Les études cherchent à isoler l'effet "pur" de l'éducation.
Politiques économiques et leurs effets : Une augmentation des taux d'intérêt par la Banque Centrale cause-t-elle une réduction de l'inflation ? C'est l'hypothèse causale. L'évaluation de cette politique implique de s'assurer que la baisse de l'inflation n'est pas due à d'autres facteurs (baisse du prix du pétrole par exemple).

Exemples de corrélations et causalités en sociologie

Milieu social et réussite scolaire : Forte corrélation négative entre le fait d'être issu d'un milieu défavorisé et la réussite scolaire. Le milieu social cause-t-il la faible réussite ? Oui, via de multiples mécanismes (accès aux ressources culturelles, soutien parental, conditions de vie, etc.). Mais il faut être précis sur les mécanismes causaux et éviter les généralisations hâtives.
Délinquance et facteurs sociaux : On observe des corrélations entre la délinquance et des facteurs comme le chômage, la pauvreté, le faible niveau d'éducation. Est-ce une causalité ? Souvent oui, car ces facteurs peuvent réduire les opportunités légitimes et augmenter la frustration. Mais la relation est complexe, et d'autres variables (réseaux sociaux, environnement familial) jouent aussi un rôle.
Genre et inégalités professionnelles : Corrélation entre le fait d'être une femme et une rémunération inférieure pour un travail équivalent. S'agit-il d'une causalité directe (discrimination) ou d'effets de variables cachées (choix de carrière différents, interruptions de carrière) ? Les études cherchent à démêler ces liens complexes pour identifier les causes réelles de l'inégalité.

L'importance de la distinction pour l'action publique

Comprendre la différence entre corrélation et causalité est vital pour l'efficacité de l'action publique.

Évaluation des politiques publiques : Pour savoir si une politique fonctionne, il faut pouvoir affirmer qu'elle est la cause des changements observés. Si une politique est mise en place pour réduire le chômage et que le chômage diminue, est-ce grâce à la politique ou à une conjoncture économique favorable ? Il faut des méthodes rigoureuses pour l'évaluer.
Éviter les erreurs d'orientation : Agir sur une corrélation sans comprendre la causalité peut mener à des politiques inefficaces ou coûteuses. Si on pense que les quartiers défavorisés ont des problèmes de délinquance parce qu'ils sont "mal éclairés" (corrélation), et qu'on installe plus de lampadaires, cela ne résoudra pas les problèmes sous-jacents de pauvreté ou de manque d'opportunités.
Prise de décision éclairée : Les décideurs publics doivent s'appuyer sur des preuves solides de causalité pour justifier l'allocation de ressources et l'orientation des interventions. Les politiques publiques efficaces sont celles qui agissent sur les causes réelles des problèmes, et non sur de simples coïncidences statistiques.

Les limites de l'établissement de la causalité en SES

Malgré les avancées méthodologiques, établir la causalité reste un défi majeur en sciences sociales.

Complexité des phénomènes sociaux : Les sociétés sont des systèmes complexes où de nombreux facteurs interagissent. Il est très difficile d'isoler l'effet d'une seule variable.
Difficulté d'isoler les variables : Contrairement aux sciences exactes où on peut contrôler presque toutes les variables en laboratoire, il est quasi impossible de faire de même avec des êtres humains et des sociétés. Les "toutes choses égales par ailleurs" (ceteris paribus) sont rarement atteintes dans le monde réel.
Multi-causalité : La plupart des phénomènes sociaux ne sont pas le résultat d'une seule cause, mais d'une combinaison complexe et souvent intriquée de multiples causes. La pauvreté, par exemple, n'a pas qu'une seule cause, mais de multiples facteurs qui se renforcent mutuellement. Chercher une cause unique serait une simplification excessive. Cela signifie que l'action publique doit souvent être multi-facettes et coordonnée.

Après la lecture

Passe à la pratique avec deux blocs bien visibles

Une fois le cours lu, ouvre soit le quiz pour vérifier la compréhension, soit les flashcards pour mémoriser les idées importantes. Les deux s'ouvrent dans une fenêtre dédiée.

Quiz + Flashcards

Suite naturelle

Tu veux aller plus loin que l'article ?

Retrouve le même chapitre dans Wilo avec la suite des questions, la répétition espacée, les corrigés complets et une progression suivie dans le temps.

Créer un compte Ouvrir l'app