De la toxicité de la donnée à la manipulation des masses

Aujourd’hui, il est facile de faire des sondages en ligne avec des outils gratuits ou peu chers. Les apprentis sorciers ont donc leur baguette magique. Oui mais voilà, posséder les outils pour faire la cuisine ne signifie pas que l’on sait cuisiner.

Par ailleurs, l’avènement de ces outils a un corollaire qui peut être très dommageable : la production de données toxiques. En effet, bien que l’usage de l’informatique ne nécessite plus guère de compétences (clic, clac, c’est dans la boite), la conception et la réalisation de sondages répond à des normes et des règles qui sont précises.

A la différence d’autres professions, les malfaçons ne se voient pas tout de suite. Prenons l’exemple d’une maison. Mis à part les vices cachés, il est assez facile de détecter les problèmes de construction. Dans le cas d’un sondage, on récupère un flot de données qui, isolément, semblent cohérentes. Pourtant, plusieurs problèmes peuvent apparaître de manière sous-jacente :

  • Un problème de conception : les questions, les filtres de ces questions et les contrôles ne sont pas faits.
  • Un problème de représentativité : On ne sait pas qui répond (cas de sondages déployés librement sur Internet) et/ou on interroge les mauvaises personnes.

Tout ceci est très théorique et la plupart des gens estiment que toutes les garanties ont été prises puisque le sondage est mis en ligne. Comme pour d’autres sujets, nous nous déchargeons de notre responsabilité ce qui nous exonère de toute analyse critique.

Alors prenons un exemple concret pour illustrer cela. Imaginez que quelqu’un décide de réaliser un sondage d’opinion par Internet en invitant les internautes à donner leur avis. Sur le papier, rien à redire si ce n’est que l’Internet ne concerne pas tous les électeurs. Laissons de côté ce premier biais et détaillons ce qui pourrait arriver de pire pour un sondage d’opinion en Nouvelle Calédonie :

  • Pour commencer, il demanderait si on est inscrit sur une liste spéciale, celle des provinciales, sans demander au préalable la durée de résidence de la personne. Ainsi, un internaute fraîchement arrivé en Nouvelle Calédonie pourrait se déclarer inscrit sur les listes. Ne maîtrisant pas tous les concepts liés au corps électoral, il pourrait tout simplement se tromper.
  • Ensuite, il demanderait la communauté d’appartenance histoire de vérifier que l’on est représentatif à ce niveau (ie : que l’on assure la diversité du corps électoral concerné pour être sûr que toutes les tendances ont pu s’exprimer). Belle intention mais s’il ne propose pas la case « ne veut pas répondre », la personne qui ne souhaite pas divulguer son origine pourrait cocher « autres ». Dans ce cas, il serait impossible de faire la différence entre les réponses et il ne serait pas possible de vérifier que le sondage est représentatif. Et oui, les « autres communautés » seraient mélangées avec les ‘refus de répondre’.
  • Ce sondage me dirait ensuite « mais où habites-tu et ou votes-tu ? » Logique. Il proposerait de répondre à la question « pour qui as-tu voté aux élections législatives de 2012 ? » Et là, bien sagement, il introduirait une liste en fonction de la commune actuelle de vote. Aie, il faudrait lui indiquer que si on vote dans une commune aujourd’hui, on ne votait pas forcément dans cette commune en 2012. Un détail, n’est-ce pas ? Même si des contrôles a posteriori peuvent être faits sur les autres variables, il serait impossible de faire un contrôle sur cette question rendant de facto le sondage inexploitable.
  • Au niveau des réponses pour les votes, il oublierait de mentionner le vote blanc ou nul, rendant délicates les comparaisons avec les élections passées. Le redressement des résultats ne serait pas possibles et le sondage serait inexploitable.
  • Pour aller plus loin, il interrogerait sur les intentions de vote aux prochaines législatives, sur la base d’une seule combinaison de candidats. Généralement, pour ce type de sondage, on propose plusieurs combinaisons ou options.
  • Il pourrait aussi poser un tas de questions sur la future primaire de la droite et du centre et sur le premier tout de l’élection présidentielle.
  • Enfin, comme tout bon sondage d’opinion il pourrait proposer un baromètre des personnalités politiques. Par souci d’économie, il se concentrerait uniquement sur certaines personnalités.

 

Edifiant me direz-vous ? Exprimé de cette façon, le pire sondage possible ne peut être qu’un cas d’école afin de sensibiliser les étudiants sur la technique des sondages. Malheureusement, en regardant bien autour de vous, vous avez peut-être croisé ce type de sondage. Si tel est le cas, vous venez d’avoir la preuve qu’il est facile de créer de la donnée toxique. Pourtant, la réalisation d’une étude d’opinion obéit à des règles strictes.

Si vous avez déjà croisé ce type de sondage, vous devez-vous dire que ce n’est pas possible, que vous vous voulez le voir de vos yeux. Seulement voilà, ayant cliqué sur un bandeau pour répondre au dit sondage, on vous aura sûrement indiqué que vous ne pouvez plus vous reconnecter. Pour ceux qui voudront en avoir le cœur net, il y a un moyen de répondre plusieurs fois. Et là, on créé un autre biais : le bourrage des urnes. En effet, lorsque ce type de sondage est déployé sans contrôle, il place un cookie sur votre ordinateur pour vous identifier et veiller à ce que vous ne répondiez pas plusieurs fois. Si vous supprimez les cookies de votre ordinateur, vous gagnez autant de « parties gratuites » que vous le souhaitez. A leur décharge, les concepteurs du sondage pourraient vous répondre qu’ils traceront les adresses IP (identification de la connexion Internet) afin d’éliminer les petits malins qui auraient trouvé l’astuce. Dans ce cas, deux problèmes apparaitraient :

  • ils introduiraient un nouveau biais puisque, dans une entreprise ou un foyer donné, une seule personne seulement pourrait répondre. Ceux qui utilisent Internet pendant leur pause du midi, sur leur lieu de travail, avec la même adresse IP, seraient donc lésées créant ainsi un autre biais pour cette étude (un de plus).
  • Tracer votre adresse IP reviendrait à vous identifier nominativement (surtout pour les particuliers) ce qui revient à enfreindre les règles de l’anonymat (je sais où vous habitez et que je connais vos opinions politiques). Si un institut de sondage procédait de la sorte, il aurait l’obligation de procéder à la destruction du lien. Mais si le sondage est fait par un tiers non professionnel, rien ne pourrait vous le garantir.

 

Au-delà de la piètre qualité d’un tel sondage, à quoi tout cela servirait-il finalement ? Il produirait une donnée toxique, inexploitable. Mais entre nous, combien de personnes se poseraient ce genre de questions ? La science des sondages apparait comme une discipline pour initiés.

En revanche, ce type de données toxiques peut malheureusement servir à marquer les esprits. Avec un corps électoral de 150 000 personnes (dont 100 000 à Nouméa), si 20 ou 30 000 personnes accédaient aux résultats d’une telle étude, l’influence sur les électeurs serait non négligeable (sans compter le nombre de relais ou partages de l’information). On passerait donc de la toxicité à la manipulation des masses dans le cadre de stratégies électorales. Heureusement, le législateur a prévu ce cas au travers des règles de diffusion des sondages d’opinion (loi : 77-808).

En conclusion, bien que la loi existe, il est important que les citoyens fassent preuve de vigilance dans la lecture et l’appréhension de l’information. Dans le moindre doute, ils peuvent saisir la commission nationale des sondages (http://www.commission-des-sondages.fr/) qui se chargera de vérifier les conditions de réalisation et agira si nécessaire (retrait de publication ou démarche plus coercitives).

Un citoyen averti en vaut deux.

 

Stéphane Renaud

Stephane.renaud@quidnovi.nc

Leave a Comment