Les élections municipales auront lieu le 5 Novembre. Je n'ai pas encore écrit à ce sujet mais j'ai décidé de faire quelques simulations pour la course entre Denis Coderre, maire sortant et Valérie Plante.
Si vous n'avez pas le temps de lire tout l'article, voici le résumé:
Entre le faible nombre de sondages et le fait que ceux-ci sont loins d'être précis, nous avons une course où tout peut arriver. Il se peut que le résultat soit serré, mais il se peut aussi que l'un de ces deux candidats soit en fait largement devant. Voyez le 48-52 des probabilités comme représentant notre niveau de confiance par rapport à cette élection, pas forcément comme indiquant une course où ils recevront tous les deux environ 50% des voix.
Maintenant, voici comment j'arrive à cette "conclusion". Ou, si vous préférez, comment justifier passer du temps sur un ordinateur quand vous pouvez faire tout aussi bien en utilisant une pièce et pile ou face.
1. Les (rares) sondages
Cette course n'a pas généré beaucoup de sondages, c'est le moins que l'on puisse dire. Dans les faits, les rares sondages ont soient été "leaké" par un camp ou ont été commandé et payé par un site internet (l'excellent Qc125.com). Sérieusement, c'est hallucinant de constater qu'un site web a commandé davantage de sondage que les médias traditionnels! Finalement ce matin. Radio-Canada a décidé de réveiller Crop de son hibernation des sondages et nous avons enfin eu un sondage publié par un média traditionnel.
Non seulement nous n'avons eu que peu de sondages, ces derniers ne sont pas... optimaux disons. Ils ont une très faible taille d'échantillon (500; 1000 ce matin pour Crop, enfin!) et dans le cas du sondage Mainstreet/Qc125, il n'y avait pas de question de relance (probablement en raison du budget). Ce qui fait en sorte qu'il y avait 41% d'indécis! Imaginez bien ce que cela veut dire: il s'agît en fait d'un sondage auprès de 300 personnes. Après, selon comment les autres 200 se répartissent, vous pouvez avoir une course diamétralement opposée. Si vous répartissez les indécis de manière proportionnelle -ce qui est courant- Denis Coderre est au-dessus des 50% avec 9 points d'avance sur Valérie Plante. À l'inverse, si les indécis se rangent chez Plante dans un ordre de grandeur 60-40, alors la candidate de Projet Montréal est élue!
Le plus récent Léger a été commandé par Projet Montréal et leaké par Qc125. Il faut toujours se méfier des sondages commandés par les partis politiques. Non pas que je soupçonne Léger de changer sa méthodologie, mais il y a probablement une raison pour laquelle Projet Montréal a décidé de faire publier ce sondage et pas les autres: ce sondage était le meilleur pour eux!
Au moins le Crop, fait à la même période que le Léger, nous montre une situation très similaire. Je dis "au moins" mais parfois les sondages font tous la même erreur. À remarquer que tant Léger que Crop ont environ 20% d'indécis, ce qui est assez élevé. Crops montre aussi que Coderre est en tête parmi ceux absolument certains de voter.
Le graphique ci-dessous illustre la situation piteuse dans laquelle nous sommes.
Il s'agît des intentions de vote avant répartition des indécis. Le sondage au milieu, de Mainstreet, n'est de loin pas totalement compatible avec les deux Léger.
Étant donné les larges marges d'erreur et les problèmes de compatibilité (41% d'indécis chez Mainstreet... on les répartit comment?), la seule conclusion semble être que la course est potentiellement plus serrée qu'il n'y a quelques mois.
Pour rendre les choses encore pires, les sondages municipaux semblent avoir une précision douteuse historiquement. Il y a 4 ans, les deux sondages faits durant l'élection à Montréal avaient tous les deux largement surestimé Denis Coderre. Cette même année, les sondages avaient fait encore pire dans bien des autres courses (Laval, Lévis). On n'est loin de la précision habituelle des sondages provinciaux. Aussi, la course à Calgary a confirmé il y a quelques semaines que ces sondages sont moins fiables (Mainstreet ne s'est pas encore remis de son échec). La faible participation y est surement pour beaucoup.
Si je me base sur les sondages à Montréal en 2013 et Calgary en 2017, les vraies marges d'erreur (=celles reflétant le niveau de précision réel et pas théorique) semble être vers les 8-10% (et j'exclus ici le sondage Mainstreet à Calgary qui était carrément plus de 20 points dans le champ!).
Pour vous donnez une idée à quel point c'est imprécis, si un parti/candidat est à environ 30%, pour avoir des marges de 10%, il faut un échantillon de... 80 observations!!! Voyez les choses autrement: si un sondage était publié et n'avait que 80 observations, est-ce vous lui accorderiez de l'attention?
Ainsi, pour les simulations (voir plus loin), j'y suis allé avec des marges d'erreur de 9%, soit à peu près le niveau de précision des "bons" sondages à Calgary et un petit peu mieux que les sondages à Montréal en 2013 (il faut dire que les deux seuls sondages avaient été faits bien avant l'élection).
2. Au-delà des sondages
Regardons Google Trends pour le Québec. Au cours des 30 derniers jours, voici les résultats (note: Google ne semble pas savoir que Denis Coderre est maintenant le maire de Montréal et non plus un député à Ottawa. Idem pour les autres candidats. Cela fait en sorte que j'ai décidé de faire une recherche par termes exactes au lieu de par "sujets").
La course semble belle et bien serrée. Les deux sont au coude-à-coude. À noter l'absence quasi complète d'un effet du débat le 19 octobre.
Pour comparaison, voici les tendances en 2013 durant le dernier mois avant l'élection:
Mélanie Joly générait en fait davantage de recherche que Denis Coderre, ce qui est assez impresionnant. Ce dernier semblait cependant avoir le momemtum vers la fin. Une prédiction basée uniquement sur Google Trends aurait eu tort, mais cela nous aurait au moins permis de prédire que la course était plus serrée que prévue.
Alors, que faire de l'informatio de cette année? Si l'histoire de 2013 se répète, Coderre est dans une position très favorable (il avait gagné alors qu'il était derrière sur Google Trends; Il est devant cette année). Personellement, je vois cela comme une autre indication que la course est imprévisible. à défaut d'être serrée.
3. Simulations
En utilisant la précision moyenne des sondages municipaux et en faisant une moyenne des sondages "récents" (avec répartition semi-proportionnelle et semi-uniforme des ind.cis), voici les chances de gagner et les scénarios possibles.
L'histogramme représente les résultats possibles pour Valérie Plante. Puisqu'il s'agît essentiellement d'une course à deux, le résultat pour Coderre est 100-résultat de Plante. Sa distribution est ainsi quasi similaire, juste centrée un peu plus à gauche (Coderre est centré vers 48.2% alors qu'elle est vers 48.7%).
Remarquez bien qu'une fois redistribués les indécis, les deux candidats sont bien plus élevés que ce que vous avez vu dans les sondages. On peut débattre de comment répartir ces indécis, mais il reste que le jour du vote, il n'y aura pas une option "ne sais pas" sur les bulletins de vote. Ainsi, attendez-vous à ce que le ou la gagant-e soit proche ou au-dessus des 50%.
Aussi, vous pouvez voir l'incroyable incertitude. Denis Coderre est projeté entre 34 et 64%! C'est un peu absurde de faire de telles projections, mais voilà, je travaille avec ce qui est disponible.
Au final, cette course est juste très incertaine. Cela ne veut pas forcément dire qu'elle est serrée, seulement que nous n'avons pas assez d'information pour vraiment projeter un ou ujne favori-e.