Nous avons décidé de réaliser notre propre calendrier de l’avent ! Tous les jours, vous trouverez un petit article ou une reprise d’un jeu de données, d’une publication ou d’un post d’un autre blog que nous avons trouvé particulièrement intéressant. Aujourd’hui, nous allons parler de sondages, et en particulier de sondages pour instituts en manque de moyens.
Supposons que l’on réalise un vote auprès d’un grand nombre d’électeurs, disons un million. Notre institut de sondages, l’IPFRES, souhaiterait savoir lequel des deux candidats, M.J ou M.F va sortir vainqueur du vote. Or, nous n’avons plus beaucoup d’argent. Nous ne pouvons donc interroger que très peu de personnes. Une première idée serait alors : si l’on interroge une seule personne complètement au hasard et qu’on lui demande pour qui elle va voter, est-ce que ça peut suffire pour deviner qui va être vainqueur ? Eh bien, oui. Mais cela dépend fortement d’avec combien d’écart cette victoire se fait ! Si M.F gagne avec 52% contre 48%, on a 52% de chances de tomber sur un de ses électeurs, et donc 52% d’avoir prédit le bon vainqueur – on en déduit qu’on a 48% de chances de s’être trompé… En revanche si la victoire est à 90% contre 10%, nous n’avions que 10% de chances de nous tromper.
Enfin, nous ne sommes pas si pauvres que ça, et nous prenons la difficile décision d’augmenter drastiquement nos charges et d’interroger non pas une mais trois personnes ! Pourquoi trois et pas deux ? Pour être sûr qu’il y ait un vainqueur dans notre échantillon, il vaut mieux que le nombre de personnes interrogées soit impair. Est-ce que cela augmente nos chances de bien prédire le vainqueur ? Le tableau ci-dessous résume nos chances d’avoir bien prédit avec notre échantillon selon le score réalisé :
Vote final | On a bien prédit |
55 % | 58 % |
65 % | 72 % |
75 % | 84 % |
85 % | 94 % |
On voit bien que plus le score est serré, moins on gagne à interroger trois personnes… espérons qu’il ne le soit pas pour notre réputation de sondeurs !