X Close

Les sondages sous-estiment-ils Trump — encore une fois ?

WASHINGTON, DC - 19 SEPTEMBRE : Le candidat républicain à la présidence, l'ancien président américain Donald Trump, s'exprime lors du Sommet national du Conseil israélo-américain au Washington Hilton le 19 septembre 2024 à Washington, DC. Trump a pris la parole lors de la conférence pro-Israël, déclarant que s'il n'est pas élu président, Israël sera 'éradiqué' dans les deux ans. (Photo par Kevin Dietsch/Getty Images)

septembre 24, 2024 - 10:20am

Lors des élections présidentielles de 2016 et 2020, les sondeurs ont sous-estimé le niveau de soutien de Donald Trump. En utilisant les moyennes des sondages du jour des élections de 538, l’avance nationale du candidat démocrate sur Trump était de 3,9 points inférieure à ce que les sondages prédisaient en 2020 et de 1,8 point inférieure en 2016. Ce schéma semble prêt à se poursuivre avec Kamala Harris en 2024, et une partie du problème provient de la manière dont les sondeurs estiment la participation.

Le biais de désirabilité sociale est un phénomène bien étudié dans le domaine de la recherche. En termes simples, il se rapporte à la tendance des gens à fournir des réponses aux enquêtes qui peuvent être perçues plus favorablement par les autres, comme le fait de savoir s’ils ont voté lors d’une élection ou s’ils donnent de l’argent à des œuvres de charité.

Étant donné l’impact socialement désirable de la participation électorale, les électeurs ne sont — en général — pas particulièrement bons pour évaluer leur propre probabilité de voter. Les enquêtes qui se basent simplement sur la participation auto-déclarée peuvent donc être sujettes à un degré de biais supplémentaire dans leurs résultats.

Pour lutter contre ce problème, Focaldata a conçu un modèle de participation pour estimer la probabilité qu’un répondant de nos enquêtes électorales américaines vote réellement, plutôt que de se fier simplement à sa propre estimation. Pour le créer, nous avons utilisé le panel de 60 000 répondants de l’étude électorale coopérative de 2020 (CCES), qui ont été appariés au fichier des électeurs pour déterminer si chaque répondant avait effectivement voté lors de l’élection.

Le CCES nous permet de déterminer si la probabilité auto-déclarée d’une personne de voter reflète sa participation ultérieure. En surface, une estimation raisonnable pour un sondeur pourrait être d’attribuer aux électeurs ‘certain’ une probabilité de 100 % de voter, aux électeurs ‘probable’ environ 75 %, aux électeurs indécis une chance de 50-50, et aux ‘ne voteraient pas’ 0 %. En réalité, ces chiffres ne correspondent pas au comportement de vote réel.

Les répondants surestiment leur probabilité de voter aux élections américaines
Probabilité auto-déclarée vs participation validée
!function(){‘use strict’;window.addEventListener(‘message’,(function(a){if(void 0!==a.data[‘datawrapper-height’]){var e=document.querySelectorAll(‘iframe’);for(var t in a.data[‘datawrapper-height’])for(var r=0;r<e.length;r++)if(e[r].contentWindow===a.source){var i=a.data['datawrapper-height'][t]+'px';e[r].style.height=i}}}))}();

En 2020, plus d’un quart — 27 % — des personnes qui disaient être certaines de voter, qui allaient voter tôt ou qui avaient déjà voté, n’ont en réalité pas voté lors de l’élection présidentielle. Plus frappant encore, ceux qui disaient qu’ils voteraient ‘probablement’ ne se sont présentés que 23 % du temps. De plus, un répondant disant qu’il ne votera pas ne les empêche pas complètement de voter — 5 % de ceux qui ont dit qu’ils ne voteraient pas ont en fait voté.

La probabilité auto-déclarée d’un répondant est importante, mais elle ne devrait pas être le seul facteur dans une prédiction de participation dans un sondage d’opinion. Certains sondeurs n’évaluent même pas la probabilité de voter, s’appuyant uniquement sur les électeurs inscrits pour générer leurs résultats principaux. Implicitement, un sondage d’électeurs inscrits suppose que chaque électeur a la même probabilité de voter — en supposant qu’il soit inscrit — ce que nous savons empiriquement ne pas être le cas.

Si les taux de surestimation de la participation étaient similaires à travers différents groupes démographiques, le problème de pondération de la participation pour les sondeurs serait assez faible et ses effets s’annuleraient principalement. Cependant, il existe des différences significatives entre le comportement rapporté et le comportement réel selon le groupe d’âge et le niveau d’éducation, rendant le problème beaucoup plus important.

Considérons les électeurs de moins de 35 ans. En 2020, les jeunes électeurs qui disaient qu’ils allaient ‘certainement’ voter n’ont voté qu’environ la moitié du temps. Parmi ceux âgés de plus de 65 ans, le chiffre monte à 85 %. De même, ceux ayant un niveau d’éducation élevé sont beaucoup plus susceptibles d’évaluer correctement leur probabilité de voter. 80 % des ‘certains’ électeurs titulaires de diplômes de troisième cycle se sont présentés, et seulement 1 % de ceux qui ont dit qu’ils ne voteraient pas ont fini par voter. En revanche, seulement 63 % des ‘certains’ auto-déclarés qui n’ont pas obtenu leur diplôme de lycée ont voté, et 5 % de ceux qui ont dit qu’ils ne voteraient pas l’ont fait.

Si nous devions simplement supposer que ‘certainement’ signifie la même chose à travers différents groupes, nous finirions par obtenir des résultats de sondage trop biaisés vers les opinions des électeurs plus jeunes, non blancs et moins éduqués. Deux de ces trois groupes penchent fortement vers les démocrates, ce qui explique en partie pourquoi le candidat du parti a été surestimé dans les sondages lors des deux dernières élections présidentielles.

L’utilisation d’un modèle de participation sophistiqué qui prend en compte les effets de la probabilité auto-déclarée de voter — aux côtés d’autres facteurs démographiques tels que l’âge, la race, l’éducation et l’intérêt politique — réduit l’avance de Harris sur Trump de 2,4 points de pourcentage en moyenne dans notre dernière vague de sondages des États clés. Dans une élection qui pourrait être décidée par seulement 60 000 électeurs en novembre, cette marge pourrait facilement faire la différence entre un bon et un mauvais appel sur le vainqueur de l’élection. Les sondeurs qui s’appuient simplement sur l’auto-déclaration pourraient être sujets à une autre erreur de sondage en faveur de Trump.

Ceci est une version éditée d’un article publié à l’origine par Focaldata.


Patrick Flynn is a data journalist at Focaldata

patrickjfl

Participez à la discussion


Rejoignez des lecteurs partageant les mêmes idées qui soutiennent notre journalisme en devenant un abonné payant


To join the discussion in the comments, become a paid subscriber.

Join like minded readers that support our journalism, read unlimited articles and enjoy other subscriber-only benefits.

Subscribe
S’abonner
Notification pour
guest

0 Comments
Commentaires en ligne
Afficher tous les commentaires