Présidentielle américaine : peut-on croire les sondages ?
Jérôme Viala-Gaudefroy, Spécialiste de la politique américaine, Auteurs historiques The Conversation France
Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.
Selon l’American Association for Public Opinion Research (AAPOR), ces erreurs résultaient d’une participation insuffisante des sympathisants républicains dans les sondages, d’une surreprésentation des diplômés de l’enseignement supérieur (plus enclins à voter démocrate) et d’une sous-estimation des électeurs indécis qui se sont plus reportés qu’attendu vers Donald Trump ou les candidats tiers Gary Johnson et Jill Stein.
Malgré des tentatives d’amélioration après 2016, les mêmes types de biais ont persisté en 2020. Les sondeurs ont à nouveau sous-estimé le vote en faveur de Donald Trump dans certains États pivots et ont, de plus, surestimé l’avance de Joe Biden au niveau du vote national – si bien que, au final, ces sondages ont été les plus erronés sur les 40 dernières années.
En 2020, les erreurs différaient toutefois de celles de 2016 : les électeurs diplômés n’étaient pas surreprésentés, et les indécis étaient répartis équitablement entre Biden et Trump. Mais la pandémie de Covid-19 avait rendu la tâche des sondeurs plus compliquée : l’AAPOR souligne que les États ayant affiché une proportion plus élevée d’infection au Covid-19 ont été ceux où les erreurs des sondages ont été le plus importantes.
Des erreurs de cette ampleur ne font qu’accentuer la méfiance du public envers les instituts de sondages – particulièrement chez les électeurs républicains, déjà suspicieux envers tout ce qui représente l’establishment.
Problème d’échantillonnageContrairement aux hypothèses initiales, il semble que, en 2016 comme en 2020, les partisans de Trump n’étaient pas réticents à exprimer leur opinion, mais étaient simplement moins enclins à répondre aux sondages, par méfiance envers les institutions. C’est ainsi que les électeurs de Trump, notamment les Blancs de la classe ouvrière, ont été sous-représentés.
En plus de ces biais, les défis techniques liés à l’échantillonnage posent des problèmes majeurs. Les sondeurs doivent aujourd’hui contacter des centaines de personnes pour obtenir un seul répondant, principalement en raison de l’identification des appelants et du filtrage des appels non sollicités.
Or, plus un échantillon est faible (en dessous de 1 000 personnes), moins il est fiable. Pour pallier ces difficultés, les sondeurs ont adopté des méthodes mixtes, mais onéreuses, combinant courriels, sondages en ligne, courriers postaux et appels automatisés, type robocalls.
Les sondages réalisés uniquement en ligne interrogent des participants volontaires qui reçoivent parfois de petites récompenses pour leur participation, mais ils posent des problèmes de précision et de représentativité. Cette méthode, souvent moins coûteuse et moins fiable, a permis la multiplication des instituts de sondages, dont le nombre a doublé entre 2000 et 2022, selon le Pew Research Center.
La marge d’erreur et les électeurs « probables »La marge d’erreur est un aspect clé des sondages, souvent mal compris par le public et les médias. Typiquement, elle se situe entre 3 et 4 points. Elle est encore plus élevée quand les sondages portent sur des sous-groupes, tels que les jeunes, les hommes blancs ou les Hispaniques, pour lesquels les échantillons sont plus petits.
Pourtant, les médias amplifient parfois des résultats, notamment dans les titres, en laissant entendre qu’un candidat est en tête, même lorsque la différence se situe dans la marge d’erreur. De plus, des chercheurs de l’Université de Berkeley ont montré que pour garantir une précision de 95 %, cette marge devrait être portée au moins à 6 %. Un candidat estimé à 54 % des voix serait ainsi susceptible, en réalité, d’obtenir entre 48 % et 60 % des voix, soit une fourchette d’erreurs réelle de 12 points.
L’identification des électeurs probables est un autre défi majeur pour les sondeurs.
Seuls environ deux tiers des citoyens disposant du droit de vote se rendent réellement aux urnes. En 2016, les sondages ont surestimé le taux de participation du côté démocrate, générant une perception erronée selon laquelle la victoire de Hillary Clinton était assurée. Cette perception pourrait d’ailleurs avoir conduit certains électeurs à ne pas se déplacer pour voter, alors que les partisans de Donald Trump, eux, se sont d’autant plus mobilisés en nombre que les sondages annonçaient que leur candidat était distancé. Cette erreur d’estimation de la participation électorale souligne la difficulté de prédire qui ira voter, un aspect crucial pour la précision des sondages.
Des signes d’amélioration aux midterms de 2022 : un espoir pour 2024 ?Lors des élections de mi-mandat en 2022, les sondages ont montré une fiabilité en nette amélioration, avec une précision comparable à celle des meilleures années depuis au moins 1998, sans biais significatif en faveur d’un parti ou de l’autre.
Cependant, il ne s’agissait pas d’une élection présidentielle, et les dynamiques peuvent être très différentes. Ce qui est certain, c’est que de nombreux instituts ont pris des mesures pour corriger les erreurs du passé : en 2022, 61 % des instituts utilisaient des méthodes différentes de celles de 2016, et plus d’un tiers ont changé leurs méthodes après 2020.
Kamala Harris. Photo AFP/Ronda CHURCHILLCes ajustements incluent des changements dans les techniques d’échantillonnage, des ajustements dans la formulation des questions, et une prise en compte plus fine des électeurs probables. Malgré ces améliorations, des défis majeurs subsistent, notamment la difficulté de prédire la participation réelle des électeurs et les biais dus aux faibles taux de réponse.
Mais alors à quoi ça sert, un sondage ?On ne le dira jamais assez : les sondages électoraux sont au mieux, des instantanés, assez imprécis, qui peuvent éventuellement indiquer des tendances. Chaque institut utilisant ses propres méthodes et introduisant ses propres biais, la comparaison entre sondages peut être parfois trompeuse.
Les agrégateurs fournissent des moyennes de sondages qui peuvent être plus fiables, mais sans être pour autant exemptes d’incertitudes. C’est le cas du fameux site FiveThirtyEight que son fondateur, Nate Silver, véritable gourou des statistiques, a quitté en 2023, suite au rachat par ABC, emportant avec lui les droits de son modèle de prévision sur son site Silver Bulletin, très suivi par les médias.
Surfant sur les incertitudes des sondages, les sites de paris politiques en ligne (dont l’un des leaders, Polymarket, a d’ailleurs engagé Nate Silver) se sont, depuis peu, multipliés en toute légalité aux États-Unis. D’aucuns, comme Elon Musk, y voient de meilleurs indicateurs que les sondages, ce qui reste à prouver, et beaucoup craignent surtout que les marchés puissent être utilisés pour manipuler l’opinion publique.
Si les sondages ne sont pas de très bons outils de prédiction d’une élection, d’autant plus que celle-ci pourrait être l’une des plus serrées de l’histoire récente, ils demeurent toutefois des ressources précieuses pour comprendre l’opinion publique sur certains sujets. Mais ils peuvent, là aussi, souffrir de biais, liés notamment à la formulation des questions.
Ainsi, en 2019, USA Today titrait « Sondage : la moitié des Américains estiment que Trump est victime d’une “chasse aux sorcières” alors que la confiance en Mueller s’érode », concernant l’enquête de procureur spécial Robert Mueller sur l’ingérence russe dans l’élection de 2016. La question posée était la suivante : « Le président Trump a qualifié l’enquête du conseiller spécial de “chasse aux sorcières” et a déclaré qu’il avait fait l’objet de plus d’enquêtes que les présidents précédents pour des raisons politiques. Êtes-vous d’accord ? » Cette formulation était problématique car elle combinait deux interrogations distinctes : l’enquête est-elle une « chasse aux sorcières », et Trump a-t-il été ciblé plus souvent pour des raisons politiques ?
De plus, cette formulation ambiguë manquait de neutralité : elle n’offrait qu’un seul point de vue, celui de Donald Trump. Trump s’est d’ailleurs empressé de mettre en avant ce résultat, qui était pourtant en contradiction avec d’autres sondages similaires (WP, CBS News, ou NPR-PBS).
Pour consommer les informations des sondages de manière éclairée lors de cette campagne, il est donc essentiel de comprendre leurs limites, et de bien lire les informations écrites en tout petit en bas des publications, comme la taille de l’échantillon, la date, la marge d’erreur, ou encore la méthodologie employée. Il faut, enfin, tenir compte du commanditaire qui peut choisir de ne publier que la
partie des résultats qui correspond à son biais politique ou médiatique. La meilleure approche pour évaluer la situation politique reste donc de considérer les sondages avec prudence et d’analyser les tendances générales, plutôt que de s’attacher à un seul résultat… et de ne jamais oublier que la réalité électorale peut parfois surprendre.