mardi 5 août 2008

Marge d'erreur d'un sondage

Par Dr. Pierre Montès

La figure ci-dessous fournit une courbe permettant de lire sur l'axe des ordonnées la marge d'erreur d'un sondage dont la taille de l'échantillon est donnée sur l'axe des abscisses. Le niveau de confiance choisi pour construire cette courbe est de 95 %, ce qui correspond à celui généralement utilisé dans les sondages dans lesquels on utilise l'expression «la marge d'erreur est de x pourcents, 19 fois sur 20». Les échelles des axes sont logarithmiques. Étant donné la relation entre la taille de l'échantillon et la marge d'erreur, les échelles utilisées font que la courbe obtenue a l'allure d'une droite parfaite.
Supposons qu'une maison de sondage aux États-Unis fasse, au début d'août 2008, un sondage pour mesurer l'intention des américains de voter pour Barack Obama ou pour John McCain aux élections de novembre 2008.

Supposons que 44% des sondés disent qu'ils auraient voté pour Barack Obama et que 42 % d'entre eux disent qu'ils auraient voté pour John McCain.
Si la taille de l'échantillon est de 1000 (1000 américains ont répondu à la question: «Pour quel candidat auriez-vous voté si les élections avaient lieu à la date du sondage ?»), alors, le graphique ci-dessous fournit la marge d'erreur E = 3,1%, 19 fois sur 20.

Cela signifie que, si l'ensemble des américains en âge de voter avait voté au moment où le sondage est fait, août 2008, le pourcentage de vote qu'aurait obtenu chacun des deux candidats serait situé dans les fourchettes suivantes:

a) Obama: 44% ± 3,1%
b) McCain: 42% ± 3,1%

Et l'on peut avoir un degré de confiance de 95% dans ces affirmations: la probabilité de se tromper est de 5% seulement. De plus l'écart entre les pourcentages obtenues par les candidats (44%-42%), soit 2%, est inférieur à la marge d'erreur (3,1%) du sondage. Cela signifierait que la lutte serait très sérrée entre les deux candidats, à trois mois du vote: ils seraient nez à nez.

Si la taille de l'échantillon était de 300 au lieu d'être 1000, la marge d'erreur aurait été de 5,7%, 19 fois sur 20 et les pourcentages de vote qu'obtiendrait chacun des candidats seraient situés dans les fourchettes suivantes:

a) Obama: 44% ± 5,7%
b) McCain: 42% ± 5,7%.

Le graphique montre clairement que la marge d'erreur diminue quand la taille de l'échantillon augmente. Il faut donc éviter d'utiliser dans un sondage un échantillon de petite taille, car, alors, les résultats du sondage seraient très approximatifs, voire erronés.
(c) Pierre Montès, 2008
Par souci de rigueur, il convient d'ajouter que la marge d'erreur fournie est un maximum.
En réalité, pour une taille d'échantillon donnée, à chaque proportion correspond sa marge d'erreur. Au lieu de donner à chaque proportion sa marge d'erreur, on attribue à toutes les proportions la même marge d'erreur (la marge d'erreur correspondant à la proportion médiane en quelque sorte, 50%). Donc la marge d'erreur vraie associée à une proportion donnée sera d'autant plus proche de la valeur maximum utilisée par les maisons de sondage (ou de celle indiquée sur la courbe ci-dessus) que cette proportion est proche de 50 %. C'est la règle généralement suivie et acceptée dans le domaine.

Comme il y a une chance sur deux qu'une proportion soit inférieure à 50% et une chance sur deux qu'elle soit supérieure à 50%, il est tout à fait justifié de calculer la marge d'erreur comme si la proportion que l'on veut mesurer par le sondage était de 50%. On démontre dans les cours de Probabilités et Statistique (et je vous recommande de l'admettre) que la marge d'erreur ainsi calculée est un maximum, pour une taille d'échantillon donnée.

Quand un medium (radio, télé, blog) publie les résultats d'un sondage, notez la taille du sondage (n), sa marge d'erreur (E) et le niveau de confiance associés aux résultats. Si le niveau de confiance est de 95%, ce qui est généralement le cas, alors, vous pourrez vérifier que le couple (taille, marge d'erreur), ou (n, E) fourni par la maison de sondage se situe exactement sur la courbe ci-haut fournie.

____________

N.B. La courbe présentée ici a été calculée et construite par le Dr. Pierre Montès. On peut la diffuser en indiquant sa provenance et la date de sa publication.

Aucun commentaire: