Wikipedia

Résultats de recherche

Traduction

Corrélation ou Causalité : l’embrouille !

Dans le monde de la recherche et des statistiques, les termes "corrélation" et "causalité" sont souvent utilisés, mais ils ne signifient pas la même chose. Ce n'est pas bien grave quand on ne fait pas de science, apparemment. 

Sauf que ces erreurs d'attribution dépassent largement le domaine des sciences. Ainsi, dans les années 1930, en Allemagne, des slogans affirmaient :

« Trois millions de chômeurs, trois millions de Juifs » 

L’une des raisons qui rend ce type de slogan attractif vient du fait qu’il est subrepticement soutenu par une erreur, une confusion entre corrélation et causalité.

Et l'on peut sans problème remplacer juifs par immigrés : ça marche aussi.



Autre exemple : après les attentats de Charlie Hebdo, les théories du complot ont été particulièrement vives, dont l’une affirmant qu'Israël était le commanditaire du massacre de l’équipe éditoriale. L’une des "preuves" avancées était qu’à chaque fois qu’une résolution était soutenue par la France contre Israël à l’ONU, nous avions droit à une attaque terroriste !

Quelques définitions pour y voir plus clair : la corrélation mesure la force et la direction d'une relation entre deux variables. Si deux variables sont corrélées, cela signifie qu'elles ont tendance à varier ensemble. Cependant, cela ne signifie pas nécessairement que l'une est cause de l'autre.

De l'autre côté, la causalité indique qu'un changement dans une variable provoque un changement dans une autre. Pour établir une relation causale, il faut démontrer que la variation de la variable indépendante entraîne la variation de la variable dépendante.

Exemples de corrélations :

  • Glaces et noyades : En été, les ventes de glaces augmentent en même temps que les noyades. Ces deux événements sont corrélés, mais manger des glaces ne cause pas les noyades. La chaleur estivale est un facteur commun (variable cachée) qui influence glaces et noyades
  • Taille des pieds et compétences en lecture : Chez les enfants, il existe une corrélation entre la taille des pieds et les compétences en lecture. Cela ne signifie pas que des pieds plus grands causent de meilleures compétences en lecture. L'âge est ici le facteur commun (variable cachée).

Exemples de causalité :

  • Fumer et cancer du poumon : De nombreuses études ont montré que fumer cause le cancer du poumon. Ici, la relation causale est bien établie.
  • Vaccination et prévention des maladies : Les vaccins causent une réduction des maladies infectieuses. La relation causale est démontrée par des études cliniques rigoureuses.

Séparer corrélation et causalité peut être complexe pour plusieurs raisons :

  • Facteurs confondants : Parfois, une troisième variable (variable "cachée") influence les deux variables étudiées, créant une corrélation apparente sans relation causale directe.
  • Temporalité : Pour établir la causalité, il faut démontrer que la cause précède l'effet dans le temps.
  • Expérimentation : Les études observationnelles peuvent montrer des corrélations, mais des expériences contrôlées randomisées (ex : études en double insu versus placebo en médecine) sont nécessaires pour prouver la causalité en éliminant le simple hasard... autant que possible (calcul de significativité avec un p<0.05) et les facteurs de confusion**.

Pour reprendre l'exemple assimilant les immigrés aux chômeurs : le chômage est influencé par de nombreux facteurs économiques, sociaux et politiques, tels que la conjoncture économique, les politiques de l'emploi, les compétences des travailleurs etc. Réduire le chômage à la seule question de l'immigration simplifie à l'excès une réalité complexe¹.

Par ailleurs, les immigrés ne forment pas un groupe homogène. Ils viennent de différents pays, ont des niveaux de qualification variés et des expériences professionnelles diverses. Certains peuvent rencontrer des difficultés d'intégration sur le marché du travail, mais d'autres contribuent de manière significative à l'économie². Les immigrés peuvent faire face à des discriminations à l'embauche et à des obstacles structurels, tels que la reconnaissance des diplômes étrangers ou des barrières linguistiques pouvant affecter leur taux de chômage³. 

Enfin, de nombreuses études montrent que les immigrés peuvent avoir un impact économique positif en comblant des pénuries de main-d'œuvre dans certains secteurs, en créant des entreprises et en contribuant à la diversité et à l'innovation⁴. Il est important de considérer le chômage dans toute sa complexité et d'éviter les slogans et raccourcis simplistes qui peuvent mener à des conclusions erronées, voire racistes.

Autre exemple concernant la réussite scolaire qui semble en relation directe avec le niveau socio-économique des parents selon nombre d'études en sociologie. Pourtant l'héritage génétique est partie prenante dans le niveau scolaire des enfants et des étudiants selon quelques études récentes. 

"En vérité, le revenu de la famille explique 7% des différences individuelles de réussite scolaire, soit moins que le score polygénique produit dans cette étude (11%). Voilà qui donne toute sa dimension à ce nouveau résultat! Néanmoins, même 7%, c’est loin d’être négligeable. C’est pour cela que tous les chercheurs en sciences sociales et en sciences de l’éducation, lorsqu’ils souhaitent évaluer l’effet d’un type d’intervention, d’une méthode pédagogique, d’un type d’école, etc., prennent en compte le revenu de famille, et de nombreux autres facteurs qui peuvent expliquer en partie la réussite scolaire. Imaginez par exemple que vous vouliez comparer les résultats des écoles publiques et des écoles privées (ou Montessori, ou Steiner, ou tout autre courant). Les statistiques montrent que les élèves de ces dernières ont de meilleurs résultats au brevet et au baccalauréat. Faut-il en conclure que cela apporte la preuve d’une pédagogie plus efficace? Non, parce que les élèves des écoles privées ne sont pas représentatifs de la population générale. Par conséquent, si l’on veut pouvoir comparer les résultats des élèves de différentes écoles (ou de groupes exposés à des pédagogies différentes), il faut les comparer à revenu familial égal, et de même pour d’autres facteurs comme le niveau d’éducation des parents, etc. Plus on contrôle statistiquement de tels facteurs dans l’analyse, moins on court le risque de conclure à tort que telle école ou pédagogie est meilleure que telle autre, alors qu’en fait les élèves comparés n’étaient pas comparables...

... il est possible, en génotypant les élèves, de vérifier si deux groupes diffèrent par leurs prédispositions génétiques, et le cas échéant, soit de mieux les apparier sur ce critère, soit d’ajuster statistiquement ce facteur dans les analyses, comme on le fait déjà pour le revenu et le niveau d’éducation des parents. En utilisant de telles méthodes, il sera donc possible de produire des résultats plus fiables en sciences de l’éducation, et donc d’éviter de se leurrer sur des approches pédagogiques qui semblent « marcher » alors que les facteurs de confusion sont insuffisamment contrôlés."***


Rappelons - au cas où ce serait nécessaire - que, sans Libre Arbitre - le "mérite" génétique comme environnemental (sociétal) n'existe pas. Mais comprendre la différence entre corrélation et causalité est essentiel pour éviter facteurs confondants, conclusions hâtives et erreurs d'interprétation. En gardant à l'esprit cette distinction et en utilisant des méthodes rigoureuses pour tester les hypothèses, nous pouvons mieux résister aux sirènes complotistes et/ou conspirationnistes*, le tout pouvant spontanément s'articuler avec un « biais de confirmation », soit la tendance à croire les histoires qui vont dans le sens de nos convictions ou préjugés... Car si les faits vont à l’encontre de vos préjugés et croyances, nous aurons tendance à les nier pour éviter que notre conception du monde soit ébranlée. De plus, si l’on attaque nos croyances à partir de faits, celles-ci se verront renforcées ! 

Un cerveau en danger résiste et les faits ne suffisent pas à convaincre les gens qu’ils ont tort !
Peut-être s'entraîner à "penser contre son cerveau" ? (voir https://illusionlibrearbitre.blogspot.com/2024_06_23_archive.html)
 
Une petite vidéo pour illustrer Corrélation versus Causalité, si besoin...

________________________________________ 

 (1) Immigrés et descendants d'immigrés Édition 2023 - INSEE - https://www.insee.fr/fr/statistiques/6793274?sommaire=6793391
(2) Inactivité, chômage et emploi des immigrés et des descendants - https://www.insee.fr/fr/statistiques/4195420
*Une grande partie du mouvement anti-vaccin, par exemple, repose sur des preuves pseudo-scientifiques qui confondent corrélation et causalité McArdle, M. (2008). Corrélation, causalité, vaccination. The Atlantic - https://www.theatlantic.com/business/archive/2008/03/correlation-causation-vaccination/3087
__________________________________________

Et pour aller plus loin, le livre "La dernière blessure" centré sur la notion du libre arbitre (illusoire)... en cliquant sur l'image ci-dessous