Élections régionales et intentions de vote : quelles leçons en tirer ?

Pour la Revue Politique et Parlementaire Emmanuel Rivière et Eddy Vautrin-Dumaine tirent les enseignements des scrutins des 20 et 27 juin.

Le premier tour des élections régionales et départementales, le 20 juin 2021, fut comme un nouveau coup de tonnerre pour la vie politique en France, deux électeurs sur trois ayant choisi de bouder les urnes. Outre le taux d’abstention très élevé, c’est l’évolution de ce taux qui impressionne : la participation a chuté de 17 points par rapport aux précédents scrutins de l’année 2015, en mars (départementales) et décembre (régionales).

Sans équivalent à l’échelle d’un pays en Europe, ce décrochage de la participation ne peut pas être imputé au contexte épidémique.

La preuve en est, les élections régionales aux Pays-Bas (en mars 2021) et dans la région de Madrid (en mai 2021) ont réussi, malgré des reculs de la participation, à mobiliser plus de 7 électeurs sur 10 (respectivement 78,1 % et 71,7 %). En Allemagne les scrutins régionaux en Saxe-Anhalt (juin 2021), dans le Bade-Wurtemberg et la Rhénanie-Palatinat (mars 2021) ont pour leur part mobilisé au moins 60 % des électeurs (respectivement 60,3 %, 63,8 % et 64,4 %) comme les élections locales en Écosse (en mai 2021) avec un taux de participation de 63,5 %.

Ce décrochage, français, est donc le signe d’une prise de distance aggravée avec notre système politique et électoral.

En partie seulement anticipé par les sondages d’intentions de vote, ce choc de la participation n’a pas totalement occulté une autre surprise de ce scrutin : les résultats de ce premier tour différaient significativement de ce que suggéraient ces mêmes sondages quant aux rapports de forces électoraux dans le pays et au sein de chaque région. Cela a affecté principalement, mais pas uniquement, la mesure du potentiel du Rassemblement national, dont les listes ont obtenu des scores très inférieurs à ce que laissaient pressentir les sondages.

L’abstention élevée a été, avec raison, présentée comme la principale explication de ce décalage important entre les sondages et le vote. De fait, cette forte abstention aboutit à faire du corps électoral mobilisé les 20 et 27 juin un groupe restreint, spécifique, très différent des votants des précédents scrutins, et sans doute différent des personnes qui se présentaient comme allant voter dans les échantillons des sondeurs.

La question de savoir si l’abstention massive est la cause unique ou principale du décalage entre les sondages et le vote est d’importance : si c’est le cas, le probable retour à une participation élevée lors de la prochaine présidentielle suffira à limiter le risque de projections erronées. Dans le cas contraire, cela pose davantage de questions sur les indications que les intentions de vote présidentielles fourniront aux acteurs politiques, aux commentateurs et aux électeurs.

Des sondages proches les uns des autres, et éloignés des résultats

Les tableaux qui figurent en annexe recensent, pour chaque société de sondage, les enquêtes d’intentions de vote réalisées dans les deux mois précédents le scrutin. Kantar Public n’a pas produit d’enquête d’intentions de vote pour ces élections régionales, mais nous les avons toutes compilées sur la page dédiée aux régionales de notre site internet, et utilisées pour proposer des synthèses sur les enjeux et le climat politique de chaque région métropolitaine. Les collectivités d’outre-mer n’ont pas fait l’objet de telles enquêtes, à l’exception de la Réunion. En Corse un seul sondage a été publié selon la Commission des sondages.

Disons-le d’entrée, il ne s’agit pas ici de dresser un palmarès comparatif de la performance des différents sondeurs. L’examen de ces tableaux montre assez clairement que ce récapitulatif des sondages ne s’y prête pas. Les différents sondages publiés sont beaucoup plus proches les uns des autres qu’ils ne le sont du résultat final. Ce constat est instructif à trois égards.

D’une part, il signale une forme d’homogénéité entre les différentes sociétés d’études, sur les modes de recueil (toutes ces enquêtes ont été réalisées par internet à l’exception de celle portant sur la Corse) et sans doute aussi sur les méthodes de redressement et de traitement des intentions de vote.

D’autre part, cette proximité des sondages entre eux permet d’éliminer une cause souvent évoquée, rarement à juste titre, des décalages entre les sondages et le vote : les tailles d’échantillons, ou leur corollaire qui est la marge d’erreur, ne sont pas ici en cause. Si c’était le cas, on observerait une distribution des différents sondages autour du résultat réel, et non, comme ici, le même décalage.

Enfin, le point le plus significatif est le caractère systématique, non seulement d’un institut à l’autre mais aussi d’une région à l’autre, des décalages observés, ce qui suggère fortement une faille dans la méthode. Cette hypothèse est renforcée par l’examen des évolutions dans les régions qui ont fait l’objet de plusieurs enquêtes, parfois conduites par le même sondeur. Les rapports de force évoluent relativement peu, les dernières enquêtes publiées ne signalent pas d’inflexion qui tendrait vers le bon résultat. Il est douteux que la surprise produite par la découverte non seulement de la faible participation mais par les scores des listes soit l’effet d’un brusque revirement des électeurs. Personne parmi les sondeurs n’a d’ailleurs tenté de se justifier de la sorte. Tous ont convenu que cette fois, cela n’avait pas marché.

La sous-estimation de l’abstention et ses possibles conséquences sur la mesure du vote

Rappelons donc en quoi cela n’a pas marché. L’abstention, principal choc des deux scrutins, n’a pas été systématiquement estimée dans les données publiées à l’occasion de ces enquêtes. Quand elle l’a été, elle fut sous-estimée de 7 à 10 points. À cet égard, l’annonce d’une abstention record à bien été clairement formulée. Mais il est assez banal d’annoncer à l’approche des scrutins intermédiaires, y compris à tort, une abstention record. Ce qui caractérise et distingue le niveau de participation des 20 et 27 juin, c’est qu’il s’agit d’un niveau spectaculaire de progression de l’abstention, avec un bond de 17 points quasiment inédit. Les progressions de l’abstention aux deux tours des municipales de 2020 étaient plus fortes (19 points de plus qu’en 2014 au premier tour, 20 points au second) dans des contextes très marqués par la pandémie. Certes, le coronavirus est encore très présent en 2021, mais ne suffit pas à expliquer une telle chute de la participation, quasiment sans équivalent chez nos voisins européens. En soi, le fait d’avoir une participation déclarée par les sondés supérieure à la réalité n’a habituellement pas d’impact sur la fiabilité des intentions de vote. Il est assez logique que les personnes les moins intéressées par la politique soient peu enclines à répondre à des sondages électoraux. Ce biais d’inclusion ne fait que rapprocher les échantillons interrogés du corps électoral réel. Il reste, au sein des échantillons, des personnes qui déclarent de bonne foi qu’ils iront voter, parce que le civisme est valorisé, mais oublient qu’ils ont le jour du scrutin autre chose de prévu, une contrainte, ce qui peut aussi créer un décalage entre la participation déclarée et la participation réelle. Mais ces circonstances sont assez équitablement distribuées au sein de la population et peu susceptibles de fausser la mesure du rapport de force électoral. Du moins dans des circonstances normales. Lorsqu’une élection mobilise aussi peu que lors de ce mois de juin, la proportion, au sein des échantillons interrogés par les sondeurs de futurs abstentionnistes qui habituellement votent, se considèrent comme électeurs et se déclarent comme tels, devient significative. Même en appliquant un critère aussi restrictif qu’une note de 10 sur 10 sur une échelle de probabilité de vote, on trouvait encore près de 45 % de sondés identifiés comme des votants dans des régions où la participation a été inférieure de 10 points. Il suffit que les facteurs qui finalement conduisent ces mêmes personnes à s’abstenir soient plus forts dans certains électorats pour introduire des biais dans l’anticipation du score des différentes listes.

À elle seule, la très faible participation ne suffit pourtant pas à expliquer les principaux écarts observés entre les sondages et le vote.

Des écarts systématiques

Dans l’ordre décroissant d’importance et de gravité, ces écarts constatés sont les suivants :
Une surestimation systématique des scores des listes présentées par le Rassemblement national, en général d’une demi-douzaine de points, mais pouvant aller jusqu’à une dizaine de points (Auvergne-Rhône-Alpes, Normandie). Naturellement plus le poids politique du Rassemblement national est élevé dans la région, plus le risque d’un écart important était grand. Du reste, les régions où les sondages ont présenté la projection la plus proche du résultat final sont des régions de faible implantation du RN : l’Île-de-France et la Corse, où les performances des sondages peuvent être qualifiées de correcte pour la première, très bonne pour l’Île de beauté. On peut aussi relever que l’enquête réalisée en Corse l’a été non pas par internet mais par téléphone. Avec un seul exemple, il serait toutefois très hasardeux d’en tirer des leçons.

Une sous-estimation tout aussi systématique des sortants, quelle que soit leur couleur politique avec là encore des écarts de 7 à 9 points dans plusieurs régions.
Une sous-estimation du total de la gauche, qui prend des proportions importantes quand elle se cumule avec la sous-estimation des sortants de gauche, mais s’applique aussi aux autres listes de gauche et s’observe également dans les régions détenues par la droite.
Une surestimation du potentiel des listes soutenues par La République en Marche.

Les deux principales faiblesses de la série des sondages publiés à l’approche des régionales sont donc la surestimation du Rassemblement national et la sous-estimation des sortants.

Si l’on compare les résultats réels non pas aux sondages mais aux élections précédentes, il s’agit bien là des deux principaux phénomènes observés : la bonne tenue des sortants, lors de ces élections où les seules alternances se sont produites outre-mer, et la contre-performance du Rassemblement national, qui chute de 10 points par rapport à son score de 2015. À cet égard, on peut reprocher aux sondages d’être passés à côté des principales leçons du scrutin. Ces deux constats sont assez logiquement liés à la chute abyssale de la participation. Réduit à sa portion congrue, le corps électoral a été déserté par une part des électeurs du Rassemblement national, dont le profil sociologique est plus abstentionniste que la moyenne – mais ne l’était pas en 2015 – et s’est concentré sur le noyau dur, ceux qui connaissent – et pour une part apprécient – leur présidente ou président de région, identifient son action, et ne sont pas indifférents à sa poursuite. Les électeurs des 20 et 27 juin sont aussi ceux, de plus en plus rares, qui s’intéressent à la vie électorale sous l’angle de l’affrontement entre les partis, angle principal de la couverture médiatique des deux scrutins. Dans la dimension protestataire du vote RN il y a à la fois une force pour ce parti, celui d’incarner l’opposition à tous les autres, et une faiblesse, la démobilisation quand l’indifférence l’emporte sur la colère.

Le lien entre l’abstention et ces deux phénomènes, performance des sortants et contre-performance du RN, a pu contribuer aux déboires des sondages qui ont sous-estimé l’abstention.

Cependant l’explication n’est pas suffisante. Il est douteux qu’une surévaluation de la participation d’une dizaine de points conduise à surestimer d’autant le score du RN. Cela voudrait dire que seuls les électeurs RN seraient concernés par l’attitude consistant à se déclarer électeur pour finalement s’abstenir, ce qui est très improbable. En outre, les données qui croisent les électorats et l’intention d’aller voter ne signalent pas une telle exclusivité des électeurs RN sur le risque de sur-déclaration du fait d’aller voter.

Une autre explication des écarts constatés peut être liée aux méthodes de redressement des échantillons interrogés.

Ces pratiques ne constituent pas une « boîte noire » comme on le prétend parfois, mais des opérations abondamment décrites et documentées. Elles consistent à s’assurer que l’échantillon interrogé est bien représentatif de la diversité des électeurs par rapport aux référents que constituent les élections antérieures. Concrètement, on demande aux sondés ce qu’ils ont voté lors des précédentes élections, et si l’on constate un décalage par rapport aux résultats connus, on donne un peu plus de poids dans l’échantillon aux électorats (du passé) sous-représentés, et inversement. L’élection présidentielle – en l’espèce celle de 2017 – est systématiquement utilisée, car elle est la plus structurante dans notre espace politique, et mobilise beaucoup d’électeurs. Les autres élections servant de référence sont la précédente édition du même scrutin (pour tenir compte de la dimension personnelle des têtes de liste dans les choix) et l’élection nationale la plus récente, ici les européennes 2019. Ces garde-fous que sont ces opérations de redressement, visant à recaler l’échantillon sur les comportements électoraux antérieurs, peuvent présenter plusieurs faiblesses. Dans leur conception pure et parfaite, ils reviennent à dire que si certains électorats sont sous représentés, c’est qu’ils sont insuffisamment nombreux dans l’échantillon sondé, ce qui peut se résoudre grâce à une pondération appropriée. Dans les faits, ces redressements reposent sur la mémoire des interviewés, qui peuvent se méprendre sur leur vote antérieur. Si bien que deux explications sont possibles lorsque l’on observe, dans un sondage réalisé en 2021, que le vote déclaré aux régionales de 2015 présente un résultat inférieur, par exemple, au score réel du Front national en 2015. La première explication est que ces électeurs FN de 2015 ne sont pas assez présents dans l’échantillon. Dans ce cas le redressement consistant à les remettre à leur poids attendu améliore la qualité de l’échantillon. La seconde est que ces électeurs sont bien représentés dans l’échantillon, mais ne se rappellent pas avoir voté FN six ans plus tôt. Ce défaut de mémoire peut avoir un sens politique. Ne pas se rappeler avoir fait ce choix au moment où le FN était à son apogée en pourcentage de voix peut signifier que le regard que portent sur ce parti ses anciens électeurs a changé, qu’il suscite moins d’enthousiasme. Dans cette hypothèse, un redressement de l’échantillon peut aboutir à remettre artificiellement le RN à un niveau où il n’est plus aujourd’hui. Inversement, on peut observer dans la reconstitution des votes antérieurs des scores supérieurs aux résultats réels s’agissant des sortants. Cela ne signifie pas forcément que leurs anciens électeurs sont trop nombreux dans l’échantillon, mais qu’il s’y trouve aussi des gens conquis par les dirigeants en place, qui n’avaient pas voté pour eux (mais s’étaient abstenus, ou ne l’avaient fait qu’au second tour, etc.) et s’imaginent après coup l’avoir fait. Cela traduit une dynamique positive, en leur faveur, que le redressement de l’échantillon peut artificiellement effacer. La difficulté de l’exercice, c’est que les deux phénomènes (sous-représentation de certains électeurs et défaut de mémoire) peuvent coexister. Lorsque l’affiliation partisane (le fait pour les électeurs de se sentir proches d’un parti bien identifié) était forte, les redressement politiques avaient presque systématiquement des effets vertueux.

Malheureusement, nous observons actuellement un phénomène de rejet des partis tels que l’identification, même du bout des lèvres, à un parti politique concerne de moins en moins de monde.

Dans le baromètre Kantar Public onepoint pour le Figaro Magazine, la proportion de ceux qui n’indiquent aucun parti dont ils se sentiraient « le plus proche ou, disons, le moins éloigné » oscille autour de 40 %. Elle était proche de 30 % il y a 5 ans, et de 20 % il y a 15 ans. Cette désaffection, qui s’ajoute à des comportements électoraux plus volatiles, joue naturellement sur la capacité à se rappeler ce que l’on a voté 5 ans plus tôt à des élections intermédiaires, et par conséquent sur l’efficacité, voire même sur la pertinence des redressements.

Les notices techniques consultables sur le site de la Commission des sondages donnent des indications assez éclairantes sur les effets des méthodes employées pour les sondages sur les élections régionales de 2021. Les précisions fournies dans la partie consultable de ces notices sont très inégales selon les instituts de sondages. Rendons ici hommage à nos confrères d’Ifop et OpinionWay, qui fournissent des informations bien plus riches que ce qui est par ailleurs publié, avec une mention particulière pour OpinionWay qui a depuis longtemps fait le choix de la transparence. Les informations fournies par l’une et l’autre de ces deux sociétés étant cohérentes entre elles, et l’ensemble des sondages ayant été assez homogène en présentant les mêmes défauts, il est raisonnable d’extrapoler les indications fournies par les quelques notices suffisamment détaillées.

Elles montrent que les reconstitutions, faites en 2021, du vote à la présidentielle 2017 sont en général assez fidèles aux résultats réels, preuve du caractère structurant de cette élection.

Elles présentent néanmoins quelques défauts systématiques (trop d’électeurs Hamon déclarés, pas assez d’électeurs Mélenchon), et d’autres qui s’observent dans certaines régions, mais pas partout (surreprésentation du vote Macron ici, sous-représentation du vote Le Pen ailleurs) cette variabilité venant compliquer le travail des sondeurs. Les reconstitutions de vote des régionales de 2015 et des européennes de 2019 ont présenté des distorsions plus importantes et plus systématiques, notamment s’agissant du vote FN, les scores restitués étant significativement inférieurs aux résultats obtenus à l’époque par le parti de Marine Le Pen. Après coup, il est plus facile de dire que cela signifiait davantage une désaffection à l’égard de ce parti qu’une sous-représentation de ses électeurs dans les panels. De même, le fait que le vote de 2015 pour les présidentes et présidents de régions sortants soit assez systématiquement surévalué dans les reconstitutions de vote peut après-coup être lu comme un signe positif de l’attitude des électeurs à leur égard, et non un biais devant être corrigé. Mais il est difficile d’y voir clair tant que le vote n’a pas eu lieu, et de fait, les notices montrent que dans certains cas le résultat non redressé des enquêtes d’intentions de vote aurait donné une meilleure indication du vote final que le résultat publié à l’issue des opérations de redressement.

Un dernier facteur mérite d’être évoqué. Comme le montre la consultation des notices les plus détaillées, les sondeurs disposent au moment de produire leur simulation de vote d’une batterie de résultats, qui diffèrent selon le type de redressement effectué et l’approche employée pour identifier les personnes qui iront vraiment voter. En fonction de leurs choix méthodologiques ils privilégient l’un de ces résultats, mais les ont tous sous les yeux. Or s’agissant particulièrement du Rassemblement national, nous sommes dans un contexte qui peut pousser à surinterpréter les indicateurs qui lui prêtent de bons scores.

Le procès pluri-décennal à l’encontre des sondages a surtout consisté à les accuser de sous-estimer les formations d’extrême droite, en ne s’alarmant pas plus que ça quand l’inverse se produisait.

Au-delà des sondages, il semble de bon ton de prophétiser aujourd’hui que le Rassemblement national, ou les populismes en Europe, progressent, qu’ils sont aux portes du pouvoir, sans accorder beaucoup d’attention aux reculs de ces mêmes partis quand ils se produisent. Aucun élément ne permet d’affirmer que nos confrères sondeurs aient été influencés par un biais de perception inconscient conduisant à donner trop d’importance aux indicateurs favorables au Front national. Mais cette hypothèse mérite d’être évoquée, compte-tenu du statut particulier de ce parti dans le paysage politique français et de la fascination qu’exerce sur les commentateurs toute information lui donnant la vedette.

Via les redressements politiques, la mémoire imprécise des répondants a pu jouer des tours aux sondeurs. Les sondages réalisés entre les deux tours, en s’appuyant sur les reconstitutions de vote du premier tour qui avait eu lieu deux jours avant, assez fidèles à la réalité, se sont montrés plus proches du résultat final que ceux portant sur le premier tour. Cependant, même ces sondages d’entre-deux-tours ont montré des distorsions entre le vote et la réalité aussi bien s’agissant des reconstitutions du vote de l’avant-veille que des projections sur le second tour. Cela confirme que le contexte d’abstention phénoménale reste périlleux pour les sondages. À cet égard, la présidentielle de 2022 présentera moins d’écueils. Il faut pourtant se garder de minimiser les risques d’imprécisions, pour plusieurs raisons. Le bilan médiocre des sondages de 2021 a en effet un précédent : lors des européennes de 2019, les sondages, là encore dans une belle unité, avaient doublement pêché en sous évaluant le potentiel de la liste EELV emmenée par Yannick Jadot, et en surestimant celui de la liste LR conduite par François-Xavier Bellamy. Nul accident de participation à déplorer pour ces élections qui avaient au contraire été marquées par un surcroit de mobilisation. Après le beau succès de sondages de 2017, nous avons donc assisté à deux déconvenues, portant sur des élections et des forces politiques distinctes. S’agissant des redressements destinés à corriger les échantillons en fonction des votes antérieurs, les sondeurs ne pourront guère s’appuyer sur les élections régionales, trop peu mobilisatrices, ou les sur les européennes, trop lointaines. Seul le référentiel de 2017, vieux de 5 ans, vaudra. Le risque d’erreurs de mémoire liées à la désaffection pour un candidat en particulier ou pour son parti ne sera pas à écarter. Plus que sur les redressements, c’est sur la qualité des échantillons – et pas seulement sur leur taille – et sur la capacité d’identification des votants, prise en défaut cette année, que reposera la précision des simulations de vote. Or l’enjeu n’est pas anodin. Rappelons-nous le contexte de ces élections régionales, et la focalisation, alimentée par les sondages, sur le score du Rassemblement national et la possibilité qu’il s’empare d’une région. Cela a eu un impact non négligeable sur la tonalité de la campagne, les thèmes mis en avant, la couverture par les médias nationaux de certaines régions plus que d’autres. Et cela va plus loin. Après avoir affirmé le contraire, Jean-Laurent Felizia, qui conduisait la liste de gauche en région PACA, a finalement opté pour le retrait afin d’y faire barrage au RN. Les 17 % qu’il a obtenu représentaient près de 200 000 votants et un potentiel de 15 élus à l’assemblée régionale. Aurait-il opté pour le retrait si les sondages, au lieu d’un duel serré (et une victoire du RN à coup sûr en cas de triangulaire), avaient anticipé l’avance de 15 points que Renaud Muselier a obtenu sur Thierry Mariani au second tour ? Il aurait été plus difficile de l’en convaincre, et moins de gens, sans doute, s’y seraient employés. Il incombe bien entendu aux sondeurs d’affiner leurs méthodes en vue de 2022, voire d’opter pour une présentation de leurs résultats qui donne davantage à voir l’incertitude. Mais l’enjeu est tel que cela ne peut pas être de leur seule responsabilité. Il serait temps d’acquérir collectivement un degré supplémentaire de maturité sur la fiabilité des sondages, ce qu’ils permettent de comprendre et ce qu’ils ne peuvent pas prédire, et de pêcher plutôt par excès de prudence que par goût du sensationnel. L’attrait médiatique des sondages s’en trouvera peut-être entamé, mais si cela préserve le processus électoral, cela se justifie amplement.

Emmanuel Rivière
Directeur Études Internationales et Conseil politique, Kantar Public
Président Centre Kantar sur le Futur de l’Europe

Eddy Vautrin-Dumaine
Directeur d’Études Kantar Public

Photo : Robert N Brown