28/04/2017 : 1er tour de l’élection présidentielle : la revanche des sondages [T. Guerra]

Dans notre vie politique et électorale, le premier tour de l’élection présidentielle de 2017 portera la marque d’un tremblement de terre. Si la portée exacte de cette élection critique est pour l’heure inconnue, on peut penser que l’ensemble du fonctionnement du système politique français en sera altéré, au moins pour les mois et les années à venir. Pour la première fois, aucune des deux forces politiques qui dirigent le pays depuis la création de la Ve République n’est qualifiée pour le second tour de scrutin. Au terme d’une campagne à plus d’un titre extraordinaire et pleine de rebondissements, Emmanuel Macron, encore inconnu du grand public quelques années auparavant, prend la tête du premier tour en réunissant sur son nom plus de 24% des suffrages exprimés moins d’un an après avoir créé son propre mouvement. Il est en passe de devenir le prochain président de la République. De son côté, avec plus de 7,7 millions de voix, Marine Le Pen dépasse le record historique de suffrages obtenus par le Front national et qualifie son parti au deuxième tour pour la seconde fois en quinze ans.

Le Parti socialiste représenté par Benoît Hamon est désormais en lambeaux. En pleine « pasokification », il semble condamné à voguer dans les basses eaux électorales qu’il n’avait plus connues depuis la candidature Defferre en 1969. Quant à la droite qui se voyait déjà victorieuse à l’issue de ses primaires, l’éclatement des affaires a eu raison de son candidat François Fillon. Enfin, une nouvelle offre de gauche radicale réunie sous la bannière de la France insoumise devient la force électorale principale de la gauche. La polarisation des électorats lors des processus de sélection des primaires a sans doute coûté cher aux deux partis de gouvernement, libérant un espace important au centre du jeu politique qu’ils occupaient jusque-là. Cette situation a largement bénéficié à Emmanuel Macron, qui réalise en cela le dessein de certains parmi les élites françaises, lesquelles rêvaient de la création d’un grand parti du centre sans jamais y parvenir. Mais il est erroné et encore trop tôt pour enterrer le vieux clivage gauche-droite au bénéficie de l’opposition entre gagnants et perdants de la mondialisation, représenté ici par le face à face entre Emmanuel Macron et Marine Le Pen.

Des questions d’une plus grande portée peuvent également être lancées. Assistons-nous à la fin de la tripartition et à l’entrée dans une ère de quadripartition, c’est-à-dire à un changement du système partisan ? Cette élection pourrait-elle signer la naissance d’un nouvel ordre électoral, avec des réalignements de certains groupes sociaux ? Ces questions sur la configuration et la nature de la démocratie française seront à n’en pas douter au centre des recherches dès les prochains jours, en examinant dans le détail et en profondeur résultats électoraux et enquêtes post-électorales.

Reste que, malgré le caractère exceptionnel de cette élection à bien des égards, le résultat n’est pas une véritable surprise. Et ceci pour une raison : les sondages laissaient fortement présager du résultat de ce dimanche. On reviendra ici à la fois sur les critiques parfois injustes dont les sondages ont fait l’objet au cours des derniers mois, et sur leur performance remarquable lors de cette présidentielle qui viennent atténuer ces critiques.

Des sondages fortement contestés par de nouveaux acteurs suite à leurs récents échecs

Les sondages ont d’abord été vilipendés tout au long de la campagne suite à leurs échecs (relatifs) à prévoir et estimer le vote du Brexit, puis lors de l’élection de Donald Trump à la présidence des États-Unis. Dans ces deux cas, ils n’étaient pas loin du but. Sur le cas du Brexit, les résultats étaient si serrés qu’ils tombaient notamment dans la marge d’erreur inhérente aux lois statistiques. Dans le cas américain, de mauvais sondages dans certains États, liés entre autres à d’importants biais de désirabilité sociale et à de mauvaises procédures d’échantillonnage, n’ont pas permis d’identifier le nombre de grands électeurs que chacun amasserait, nécessaire pour l’emporter au collège électoral. Maigre consolation, le vote populaire a été quant à lui bien estimé par les sondeurs.

Suite à l’annus horribilis qu’a donc constitué l’année 2016 pour les sondeurs du monde entier dans des grandes démocraties rompues de longue date aux enquêtes d’opinion, l’industrie française des sondages ne pouvait qu’être sous pression. D’autant que la France regroupe certains des plus grands acteurs européens et mondiaux dans le domaine.

Les choses commencèrent mal pour les sondeurs français, car ceux-ci se sont avérés très imprécis dans l’estimation difficile des résultats des primaires de la droite et de la gauche, malgré d’importants moyens investis dans des dispositifs d’enquêtes sans précédent dans notre pays. Les raisons de ces erreurs restent toujours à éclaircir, et laissaient présager le pire pour la présidentielle.

D’autres types d’analyses ont donc su trouver les faveurs du grand public et de militants qui ne comprennent pas toujours les mécaniques des sondages. Ces analyses d’un genre nouveau s’enorgueillissent d’avoir, elles, prédit la victoire du Brexit et celle de Donald Trump. Parfumées au « Big Data » qui tient lieu dorénavant de faire-valoir scientifique, et fortes de leur victoire toute relative sur les sondages, elles ont rencontré un grand écho après la primaire de droite où elles avaient laissé présager de la victoire de François Fillon. Après ce sans faute, elles ont été fortement mobilisées sur la campagne de la présidentielle, publiant régulièrement de nouvelles « estimations » (Figure 1).

Figure 1. Estimations « Filteris » et prédiction d’un modèle « Big Data »

Pour être clair, de quel genre d’analyse parlons-nous ? Il s’agit le plus souvent d’analyses qui se limitent à l’exploitation des réseaux sociaux. Ces prévisions combinent à la fois analyse quantitative des flux échangés sur les réseaux sociaux (le plus souvent Twitter), et analyse des sentiments, c’est-à-dire la tonalité des échanges à propos de tel candidat sur ces réseaux. Le tout étant censé produire, à l’aide d’un modèle qui reste le plus souvent confiné dans une boite noire (secret industriel oblige), des estimations beaucoup plus fiables que les vieux sondages, trop classiques et représentatifs pour être précis.

Si rétrospectivement ces estimations apparaissent franchement fantaisistes, elles étaient pendant la campagne diffusées auprès d’une large audience. A titre de comparaison, et hors du réseau des journalistes, elles étaient plus commentées et partagées que les sondages traditionnels. L’utilisation partisane dont elles ont fait l’objet n’est pas sans rappeler l’usage des « fake news » aux États-Unis, massivement utilisées par les supporters de Donald Trump. Par ailleurs, la circulation de ses informations au sein des réseaux militants sur internet a pu produire des phénomènes de raisonnement motivé qu’il serait opportun d’analyser.

Le drame de cet usage irresponsable des nouvelles techniques de « prédiction » c’est qu’elles jettent un discrédit considérable sur les enquêtes d’opinion qui n’ont déjà traditionnellement pas bonne presse. Après cela, il sera très difficile de retrouver une forme de crédibilité pour un secteur des études déjà en pleine mutation. Elles font finalement plus de tort encore aux techniques qu’elles se proposent de mettre en œuvre et qui seront, demain, forcément centrales dans l’analyse des données.

La présidentielle française, une grande victoire pour les sondages

Les fausses critiques et les alternatives ne doivent pas pour autant amoindrir les soupçons qui pèsent sur les sondages français. On renverra ici en premier lieu à certains papiers (ici, et encore ) qui tentent de faire le point sur les accusation de herding (littéralement de suivisme), c’est-à-dire que les instituts se copieraient les uns les autres pour construire leurs intentions de vote, ce qui diminuerait la qualité des estimations. Les auteurs en veulent pour preuve d’une part qu’aucun sondage publié n’est un outlier (des sondages avec des valeurs aberrantes) et que, d’autre part, leur distribution n’est pas plausible. En clair, les sondages français seraient trop semblables les uns les autres pour qu’ils soient statistiquement valides.

Il reste qu’au sortir de ce premier tour de la présidentielle, les sondages ont fait démentir tous les pronostics et les critiques qui plaçaient leurs intentions de vote très loin des comportements électoraux effectifs. Or, les sondages français se sont montrés à la hauteur de la tâche qui leur incombait : ils ont été dimanche soir particulièrement proches des résultats électoraux. Avant de voir à quel degré leur précision s’élève, on peut synthétiser rapidement leur dynamique au cours de ces quelques mois de campagne (Figure 2).

Figure 2. Évolution moyenne des intentions de vote au premier tour depuis la primaire de droite

Comme en témoigne l’évolution des courbes sur le graphique, de grands mouvements semblent avoir parcouru l’électorat. In fine, lors du premier tour de la présidentielle ce dimanche 23 avril, les instituts de sondages ont particulièrement bien estimé les résultats électoraux si on les compare à la moyenne des tout derniers sondages publiés (Tableau 1). Notre calcul se base ici sur la dernière enquête publiée par chacun des 8 principaux instituts avant le premier tour de scrutin. Nous nous concentrons ici sur les cinq premiers candidats arrivés en tête dimanche soir.

 Tableau 1. Dernières estimations des instituts et écarts avec le résultat final par candidat

Institut Le Pen Macron Fillon Mélenchon Hamon
Odoxa 23 24,5 19 19 7,5
BVA 23 23 19 19,5 8
Ifop 22,5 24,5 19,5 18,5 7
Ipsos 22 24 19 19 7,5
Elabe 21,5 24 20 19,5 7
OpinionWay 22 23 21 18 8
Harris 21 24,5 20 19 7,5
Kantar 23 24 18,5 18 8
Moyenne des estimations 22,3 23,9 19,5 18,8 7,6
Résultat 21,3 24 20 19,6 6,4
Écart (estimation-résultat) 1 -0,1 -0,5 -0,8 1,2

 

Ce qu’on peut voir très rapidement, c’est que l’erreur sur un candidat (c’est-à-dire l’écart entre la moyenne des dernières estimations et le résultat final) est comprise entre 1,2 et 0,1.

L’erreur la plus importante a été réalisée sur le score de Hamon (en moyenne, le score du candidat socialiste a été surévalué de 1,2 points). Ce n’est pas surprenant car celui-ci appartient désormais aux « petits candidats », qui sont classiquement plus difficiles à estimer.

Marine Le Pen est restée assez logiquement surévaluée, comme dans les scrutins intermédiaires précédents. De ce point de vue, 2017 marque une évolution par rapport à 2012 et 2007 où le vote Le Pen était encore difficilement avouable. Sur ce point, le passage du téléphone à l’enquête en ligne auto-administrée a été particulièrement crucial pour mieux appréhender le vote FN. Pour ce qui est de Fillon et de Mélenchon, l’écart entre estimation et résultat s’élève de 0,8 pour ce dernier et à peine à 0,5 pour le premier. En revanche, pour Emmanuel Macron, c’est un sans-faute (0,1) d’autant plus remarquable qu’il s’agissait de la seule force à ne pas avoir de précédent électoral.

On peut représenter cette « performance » des instituts de sondage français graphiquement pour mieux visualiser l’écart qui sépare la moyenne des dernières intentions de vote, pour chacun des candidats, avec les résultats réels (Figure 3).  Sur ce graphe, la droite qui coupe l’ordonnée à l’origine représente l’estimation parfaite : les estimations de sondages (sur l’axe des abscisses) sont égales aux résultats électoraux (sur l’axe des ordonnées). On s’aperçoit nettement que les points représentants les scores des candidats sont très proche de cette droite, voire confondus. Les dernières intentions de vote des instituts étaient donc particulièrement proches des résultats définitifs.

 Figure 3. Précision de la moyenne des sondages pour chaque candidat

 

Trump et le Brexit ayant servi de carburant à la critique systématique des sondages, citera-t-on maintenant la France pour les encenser ? Il faut l’espérer.

Enfin, lorsqu’on cherche à explorer l’erreur des sondages sur le long terme aux différents scrutins présidentiels, il s’agit de la deuxième meilleure performance des instituts de sondages depuis l’élection de 1969, et après celle de 2012 (erreur de 0,11% en 2012 contre 0,7% en 2017).

Figure 4. L’erreur historique des sondages depuis 1969

 

Finalement, et c’est paradoxal, cette élection qui modifie substantiellement le fonctionnement de notre vie politique a été très bien appréhendée par les sondages, qui restent des outils fiables pour observer les dynamiques politiques de la société française. Une seule ombre au tableau reste à signaler toutefois : l’estimation de la participation qui s’est avérée légèrement plus forte qu’annoncée initialement par les instituts.

 Les défis à venir : second tour et législatives

Avec la prise en compte des comportements de premier tour dans les intentions de vote de second tour, les instituts devraient sans grande difficulté estimer le résultat du second tour le 7 mai prochain. Sauf énorme surprise au regard non seulement des sondages effectués jusqu’à présent mais aussi de ce qui a été observé lors des dernières élections intermédiaires (régionales ou départementales), Emmanuel Macron devrait être largement élu président de la République. Il bénéficierait de transferts particulièrement massifs en provenance de Hamon, Fillon et Mélenchon (Figure 5). Une fois encore, le niveau de l’abstention pourra s’avérer déterminant. Et on sait que les sondages peuvent encore progresser de ce côté-là.

Néanmoins, l’utilisation du redressement politique sur le premier tour devrait fournir des estimations particulièrement fiables et très rapprochées du résultat final.

Figure 5. Transferts de voix du premier au second tour de la présidentielle 2017

Source : enquête jour du vote d’IPSOS

 

Toutefois, pour les législatives de juin prochain, la tâche devrait être nettement plus compliquée. En effet, l’éclatement de l’offre électorale et le morcellement des circonscriptions peut constituer un défi de taille pour les sondages. Il est déjà inenvisageable de conduire un sondage dans chacune d’entre elles. Très clairement, l’enjeu pour les instituts sera de transformer les intentions de vote nationales en projection en sièges dans un contexte où les forces en compétition développeront peut-être de nouveaux systèmes d’alliances. A côté de ce qui les attend, la présidentielle était, pour les sondeurs, presque un jeu d’enfants.

 Tristan Guerra