Ce dimanche a lieu le premier tour de l'élection présidentielle en France, un scrutin qui se déroule tous les 5 ans. Après de longs mois d'une campagne objectivement plus folle que d'habitude, les projections montrent une course à 4 avec cependant deux favoris. Rappelons pour ceux qui ne le savent pas que le scrutin français est à deux tours. Les deux candidats qui termineront en tête dimanche se qualifieront pour le 2e tour dans deux semaines.
Comme je le disais, nous avons une course à 4, ce qui est inédit en France. Traditionnellement, les deux favoris sont faciles à prédire. Bien sûr il peut y avoir des surprises comme en 2002, mais les sondages n'indiquaient pas une course si serrée et surtout pas à 4. Cela étant dit, la convergence entre les 4 candidats semble s'être arrêtée vers la fin. Emmanuel Macron connaissant même une légère tendance à la hausse vers la toute fin. Ainsi, bien que "tout soit possible" (y compris n'importe quelle combinaison des 4 candidats pour le 2e tour), il reste que certains scénarios sont de loin plus probables que d'autres.
1. projections basées sur les sondages
Ci-dessous vous avez les chances d'être au 2e tour ainsi que les intervalles de confiance pour les résultats au 1er tour pour les 5 principaux candidats.
Cela n'a pas vraiment changé depuis ma dernière mise à jour si ce n'est la remontée de Macron. Rappelons en passant que Macron est favori contre n'importe quel autre candidat (ou candidate) au 2e tour (dans bien des cas, assez largement). Ainsi, pour lui, la vraie course a lieu ce dimanche. S'il termine dans les deux premiers, il sera presque assurément le prochain président.
Il y a encore quelques semaines, la présence de Marine Le Pen du Front National au 2e tour était quasi assurée. Mais sa relativement mauvaise campagne (à la fin), sa piètre performance dans les débats et la montée de Mélenchon lui ont finalement fait mal. Ses chances demeurent élevées grâce à des électeurs très décidés, mais force est de constater qu'elle semble avoir râté sa campagne (elle était à 25% et plus depuis 2 ans).
Si François Fillon est dans les deux premiers ce dimanche, il faudra saluer sa persévérance. Alors qu'il était le grand favori après la primaire de la droite, les accusations d'emplois fictifs ont miné sa campagne. Il a cependant décidé de rester candidat et il semblerait que ce n'était pas forcément une mauvaise idée. Son socle électoral est solide à environ 19%. Ses électeurs sont motivés et en général plus âgés (donc ils votent). Soyons honnête, sans le "Penelopegate", il serait sûrement en tête.
L'histoire de cette fin de campagne est naturellement la montée fulgurante de Mélenchon. Au fil des dernières semaines, il a canibalisé les appuis d'Hamon mais aussi (un peu) de Macron et de Le Pen. Il peut sembler surprenant qu'un candidat de gauche "radicale" puisse prendre des votes à la droite dure ou extrême mais ce populisme transcende souvent les clivages gauche-droite. Il avait déjà connu une bonne hausse en 2012 mais n'avait finalement obtenu que 11% des voix. Il semble que ses appuis soient plus solides cette fois-ci mais il reste que sa progression ne lui a pas permis de dépasser les 20% en moyenne.
Finalement, Benoît Hamon a connu une campagne de cauchemard. Après sa victoire surprise dans la primaire de la gauche, il n'a jamais réussit à revenir dans la course pour le 2e tour et il s'est effondré vers la fin. Il n'y a aucune chance qu'il soit au 2e tour et dans les faits il pourrait terminer sous les 5%, un résultat catastrophique pour le PS dont les dépenses de campagne ne seraient plus remboursées!
Regardons la distribution des résultats possibles:
Macron a une courbe plus "large" ou "étendue", ce qui signifie qu'il y a davantage d'incertitude pour ce candidat. Mon modèle est un peu différent des autres (voir ci-dessous) car il tient compte de la certitude du vote (le % d'électeurs pour un candidat qui déclarent leur choix comme étant définitif). C'est peut-être une erreur de tenir compte de cette variable mais en même temps, je trouvais bizarre de ne pas utiliser cette information. Et à ce jeu-là, Macron fait moins bien que Le Pen ou Fillon. Ces derniers peuvent compter sur des électeurs sûrs à plus de 80% alors que Macron n'est que vers 70%. D'un autre côté, Macron peut compter potentiellement sur l'arrivée d'appuis tant de sa gauche que de sa droite (cela signifie aussi qu'il peut perdre tant sur sa gauche que sa droite!). Ainsi, je dirais qu'un modèle qui ne montre pas un plus large intervalle pour Macron n'est pas complet. Oui j'ai dû faire des hypothèses pour intégrer cette incertitude, mais les résultats sont cohérents avec ce que l'on imaginerait. Aussi, rappelons que Macron n'a pas officiellement de parti et n'a jamais été élu auparavant. Sa victoire serait un évènement incroyable dans la politique française. Il est ainsi normal je crois d'avoir une incertitude plus grande pour ce candidat.
Mon modèle a aussi une certaine corrélation entre les candidats en raison de l'utilisation du report des voix et des 2e choix. Ainsi le résultat de Mélenchon par exemple est corrélé négativement avec le vote Hamon, Macron ou même Le Pen, mais pas avec le vote Fillon (ou très faiblement). Les deux corrélations les plus fortes sont entre Mélenchon et Macron ainsi que Macron et Fillon. Pour la première, il y a un groupe d'électeurs de gauche qui semblent pouvoir voter pour Macron, Hamon ou Mélenchon. On le voit bien dans le sondage Harris où les électeurs PS se divisent entre les trois. Je crois sincèrement que ce groupe est probablement la clé du scrutin de dimanche. S'il soutient effectivement Macron en majorité, ce dernier sera élu. Mais si cet électorat devait rester chez lui ou voter pour Hamon et Mélenchon -même dans des proportions juste un peu plus grandes que celles dans les sondages, alors attendez-vous à une surprise. Le fait que le score de Macron soit celui inclus dans les deux plus grandes corrélations est une autre façon de réaliser que son intervalle est plus large: il a un plafond très élevé mais un plancher bas.
L'autre électorat clé est l'électorat de centre-droit. On parle des supporteurs de Bayrou en particulier. À l'heure actuelle ils sont majoritairement chez Macron mais voter Fillon n'est de loin pas impossible pour eux. Il y a aussi les 4% chez Nicolas Dupont-Aignan qui seraient fort utiles à Fillon.
Le graphique ci-dessus montre bien que la course à 4 est réelle. Rappelons-nous que le modèle est calibré en terme d'incertitude par rapport à la précision des sondages depuis 2002. Cela veut dire des marges d'erreur moyennes d'environ 3.8%. Vu que l'écart entre Mélenchon (4e) et Macron (1er) est d'à peine 4.6 points, on voit bien que plusieurs scénarios sont possibles. D'autant plus que nous avons des raisons de penser que les sondages ont peut-être tort (voir ci-dessous).
Quant aux second tours possibles, voici le graphique qui nous fournit l'information:
En gros, il y a une chance sur quatre que le 2e tour ne soit pas cela attendu entre les deux favoris des sondages (favoris au 1er tour bien sûr). C'est une probabilité élevée. Le fait que Macron soit dans les 3 scénarios les plus probables montre son avance sur ses adversaires. Mais il reste que 6 scénarios sont possibles ce dimanche, une première en France.
2. Les sondages
Tel que je viens de le mentionner, les sondages français ont une marge d'erreur effective de 3.8% depuis 2002. Une autre façon de voir l'incertitude des sondages est de réaliser que l'erreur moyenne absolue est de 1.6 points parmi les 5 principaux candidats. Aussi, toujours parmi le top 5, les sondages ont eu tendance à sous-estimé un candidat de manière importante à chaque élection (Le Pen sous-estimé par 3.5 points en 2002, Sarkozy par 3 points en 2007 et Marine Le Pen par 2 points en 2012). Naturellement un candidat a toujours été surestimé (Jospin en 2002, Le Pen en 2007 et Mélenchon en 2012). Le fait que les sondeurs français pondèrent en fonction du vote passé peut possiblement expliquer ces erreurs pour les candidats en baisse ou en progression. Si le yo-yo devait continuer cette année, Mélenchon devrait être sous-estimé et Le Pen surestimée.
Parlant de sondeurs, ces derniers sont accusés de "herding". C'est à dire de ne pas publier leurs vrais chiffres mais de se coller aux autres sondages afin de ne pas avoir tort. Il faut dire que si vous regardez les sondages depuis des semaines, la volatilité entre sondages est vraiment faible. Le Pen par exemple semble systématiquement entre 22 et 23%, ce qui ne devrait pas arriver avec des échantillons aléatoires. Sauf que voilà, les sondeurs français ne font pas des échantillons aléatoires mais par quotas. Et ils redressent ensuite les résultats en fonction du vote passée. Cela a tendance à réduire la volatilité. Cela étant dit, la volatilité observée est vraiment faible et s'il devait y avoir une surprise ce dimanche, les sondeurs devront s'expliquer.
Aussi, tous les sondages sont faits par internet sauf un! Et ce dernier a des résultats relativement différent avec Fillon bien plus faible et Mélenchon 2e.
Alors, est-ce les sodnages vont avoir raison? Nous ne le saurons que dimanche mais en attendant, nous pouvons regarder d'autres indicateurs tels que les recherches dans Google Trends. Il est bien connu qu'il existe souvent une corrélation entre la popularité d'un candidat et sa présence dans le moteur de recherche.
D'après Google Trend, Mélenchon est en tête. Si vous faites la recherche vous-même et que vous regardez pour les 30 ou 90 derniers jours, vous voyez la même chose.
Si l'on compare à 2007 ou 2012, on peut penser que Mélenchon y est surestimé. Il faut dire que son équipe de campagne est bonne pour générer le buzz. En même temps, Macron devrait être un peu inquiet. Les données non basées sur des sondages ne sont pas bonnes pour lui. Non seulement le Google Trends mais aussi le buzz média en général.
Mesure #FILTERIS / #EUROMEDIATIONS du 21 avril - 23h50 / #poidsnumérique des candidats à la #présidentielle2017#Buzz #Bigdata pic.twitter.com/bCohC532eS— JÉRÔME COUTARD (@Filteris) April 21, 2017
Ainsi, nous avons des raisons de penser que Macron est surestimé tandis que Fillon et Mélenchon sont possiblement sous-estimés. Si tel devait être le cas, il se pourrait que les chaînes télévisées françaises ne puissent pas nous donner l'identité du top 2 à 20h ce dimanche (note: les chaînes françaises ont toujours des sondages faits à la sortie des urnes et ils publient les estimations à 20h00, soit quand les bureaux de vote ferment. Il s'agît cependant d'estimation et en cas de course serrée, il nous faudrait attendre les résultats définitifs).
Finalement, il me faut mentionner l'attaque terroriste de cette semaine. Nous ne pouvons pas regarder les sondages pour mesurer les conséquences (il y a bien eu un sondage fait après l'attaque, mais l'échantillon est petit). Il reste que l'on peut imaginer que cela avantagera les candidats de droite (Le Pen et Fillon) car les électeurs les voient en général meilleurs pour les questions de sécurité. J'avoue ne pas pouvoir prédire l'impact de cette attaque et il est possible qu'elle ne changera rien. Mais dans le contexte d'une élection à haute incertitude, disons que ca n'aide pas!
3. Les autres modèles
Je n'avais jamais fait de projections pour la France et j'ai commencé ce modèle essentiellement "pour le fun". Aussi, à l'inverse du Canada ou des États-Unis, les modèles de projections/prédictions semblent moins communs en France.
Il y a Depuis1958.fr. À l'inverse de moi, il ne regarde pas uniquement le 1er tour. Si l'on compare nos prédictions pour dimanche, on voit que l'on s'entend pas mal. Macron à 90% de chances de se qualifier, Le Pen 75%, Fillon 16.7% et Mélenchon 17.7%. Il ne tient pas compte des redistributions de votes où de la certitude des électeurs. Quant aux scénarios pour le 2e tour, là aussi on s'entend pas mal: 66% de chances d'avoir Macron contre Le Pen ou 12% pour Macron contre Fillon. On ne s'entend pas vraiment sur les chances d'avoir Macron contre Mélenchon cependant. J'accorde 7% de chances à ce scénario alors qu'il a près de 13%.
The Economist donne 74% de chances à Macron d'être au 2e tour, 65% à Le Pen, 30% à Fillon et 30% à Mélenchon. J'avoue que je trouve que ce modèle a un peu trop d'incertitude et la joue un peu trop "sûr" afin de ne pas avoir tort. Les sondages depuis 2002 n'ont pas été aussi mauvais. En même temps, il est peut-être prudent de ne pas regarder seulement trois élections. D'autant plus que les sondages ont connu leur dose d'erreur récemment (Brexit, Trump, etc).
Quant à The Crosstap, les probabilités sont très proches de The Economist. Là aussi cependant, leur modèle est calibré avec une erreur moyenne plus grande que celle des élections récentes.
Almost-final odds to make round 2 of the France election:— The Crosstab (@TheCrosstab) April 21, 2017
Macron: 73%
Le Pen: 63%
Fillon: 36%
Mélenchon: 29%https://t.co/ZVAyZ2KLx4 pic.twitter.com/SMkp8MOVXX
Finalement, Contesdefaits a aussi Le Pen avec moins de chances que moi. Je crois que la différence vient vraiment du fait que je sois le seul à tenir compte du fait que Le Pen a un vote bien plus garanti, du moins selon les sondages. C'est peut-être une erreur de ma part et nous verrons dimanche. J'ai déjà mentionné le résultat un peu étrange d'avoir Marine Le Pen avec >80% de "définitifs" et pourtant son score est tombé de 25% à 22%.
Conclusion
C'est de loin l'élection la plus incertaine que j'ai couverte depuis que j'ai commencé ce blogue. Entre la course à 4, les possibles erreurs des sondages et la récente fusillade terroriste, il y a une incertitude majeure quant aux résultats de ce 1er tour. Cela étant dit, ne vous métrompez pas, Macron est le favori et de loin. S'il termine 1er (ou 2e) dimanche, l'accomplissement sera de taille. On parle d'une personne qui est jeune, n'a jamais été élue et a lancé son mouvement il y a 1 an! En même temps, les sondages montrent bien que les gens ne sont pas forcément super fans de son programme. Il est souvent vu comme le candidat par défaut.
Les surprises peuvent arriver mais remarquez bien que Macron a littéralement été en tête de tous les sondages!
Si je devais donner mon opinion subjective quant à quelle surprise pourrait arriver, je crois que Fillon est probablement sous-estimé. Je crois que ses chances d'être au 2e tour sont meilleures que mes probabilités, mais je ne vais pas commencer à modifier les chiffres subjectivement. La question maintenant est vraiment de savoir qui sera surestimé. Là je ne serais pas surpris s'il s'agissait de Macron. Ainsi, je crois qu'un 2e tour Fillon contre Le Pen n'est de loin pas impossible. Pour que cela se produise, il faudrait essentiellement les ingrédients suivant: une abstention importante (ce qui favorise Le Pen et ferait sûrement mal à Macron) et la droite classique qui retourne chez Fillon. On parle ici de 2-3 points que Fillon pourrait aller chercher chez Nicolas Dupont-Aignan ainsi que chez le centre-droit. La droitre en France a toujours été forte et terme de programme, Fillon devrait être plus élevé que 19-20%.
Notes méthodologiques
Voici comment le modèle fonctionne.
1. Faire la moyenne pondérée des sondages en donnant plus de poids aux sondages récents.
2. Faire la moyenne du pourcentage d'électeurs pour chaque candidat qui déclarent leurs choix comme étant définitifs (plus de 80% pour Le Pen, environ 70% pour Macron par exemple).
3. Faire 50,000 simulations (avec écart type d'environ 1.3 pt). Donc ici, Macron (en moyenne à 23%) est parfois à 25% et d'autres fois à 21%.
4. Séparer les électeurs pour chaque candidat dans chaque simulation qui sont définitifs de ceux qui peuvent changer d'avis.
5. Parmi ceux qui peuvent changer, l'hypothèse est que la moitié, en moyenne, votera finalement pour ce candidat (distribution normale avec moyenne à 50%). L'autre moitié ne votera soit pas (fonction du taux prévu d'abstention) ou votera pour son 2e choix. Cette partie est difficile car peu de sondages fournissent cette information. J'ai dû y aller un peu subjectivement. Essentiellement, je me suis basé sur les affiliations idéologiques (Hamon et Mélenchon partagent beaucoup d'électeurs), les 2e choix de certains sondages ainsi que le report des voix au 2e tour. Autre hypothèse: à part les 5 principaux candidats, tous les autres ne peuvent que perdre des votes (=transférer aux 5 principaux), ils ne peuvent pas en recevoir.
6. Faire la somme des votes définitifs, des indécis ayant finalement décidé de rejoindre ce candidat ainsi que les transferts des autres candidats. Cela nous donne des marges d'erreur totales d'environ 3.8%, ce qui correspond exactement aux marges d'erreur effectives des sondages depuis 2002. En d'autres mots, le modèle contient la bonne quantité d'incertitude mais celle-ci est introduite de plusieurs manières (simulations au début, part des indécis qui votent pour un autre candidat, abstention, etc).
7. Calculer le nombre de fois où chaque candidat est dans les deux premiers.
6. Faire la somme des votes définitifs, des indécis ayant finalement décidé de rejoindre ce candidat ainsi que les transferts des autres candidats. Cela nous donne des marges d'erreur totales d'environ 3.8%, ce qui correspond exactement aux marges d'erreur effectives des sondages depuis 2002. En d'autres mots, le modèle contient la bonne quantité d'incertitude mais celle-ci est introduite de plusieurs manières (simulations au début, part des indécis qui votent pour un autre candidat, abstention, etc).
7. Calculer le nombre de fois où chaque candidat est dans les deux premiers.