Tout est bon pour venir à bout de la neutralité du Net, présentée par une partie des milieux d’affaires américains comme une insupportable distorsion du marché. Jeff Kao, spécialiste des données, s’est livré à une analyse des commentaires publiés sur le site de la Commission fédérale des communications (FCC). Il démontre qu’au moins 1,3 million de posts favorables à sa suppression ont été mis en ligne par des spambots, des robots dédiés.
Jeff Kao commence par remarquer que les mécanismes mis en place par la FCC pour recueillir ces commentaires publics étaient notoirement opaques et confus. Une autre difficulté consistait en l’énorme masse de données recueillies : plus de 22 millions de commentaires représentant plus de 60 GB de texte et de métadonnées. Après avoir écarté les doublons, Kao a isolé 2 955 182 commentaires uniques, puis les a cartographiés en vecteurs spatiaux sémantiques et les a traités à l’aide d’algorithmes d’analyse de signification agrégateurs. Cette méthode lui a permis d’identifier près de 150 modèles de commentaires de différentes tailles.
Compte tenu des campagnes de mailing qui invitent les internautes à recopier un texte pré-rédigé pour soutenir une cause sur les réseaux sociaux, sur des agoras publiques ou auprès d’élus, il ne suffit pas de constater que des textes sont identiques pour pouvoir en conclure qu’il s’agit d’opinions publiées par des spambots ; l’analyse se doit d’aller plus loin pour distinguer ce qui est le fruit authentique de campagnes de mobilisation, d’un côté, et d’une duplication industrialisée, de l’autre.
Paradoxalement, ce sont justement les efforts de dissimulation entrepris par les auteurs du programme visant à inonder le site de la FCC de messages favorables à la suppression de la neutralité du Net qui ont permis à Kao de les confondre. Une partie significative des messages isolés développait en effet le même raisonnement, mais en introduisant systématiquement des synonymes et des formulations alternatives. De cette façon, chacun de ces messages avait l’apparence d’un texte unique et n’était pas écarté par les filtres d’identification des doublons. Kao note également que le style de ces messages était anormalement affecté. Paradoxalement, une des expressions reprise dans chacun de ces messages spécifiques, sous différentes variations, était « people like me », devenant tour à tour « folks like me », « citizens », « individual citizens » ou « Americans » : comme une protestation désespérée d’humanité proférée par des machines…
Sur le fond, pas de surprise : ces messages défendent l’idée que la neutralité du Net formalisée par la FCC sous la présidence Obama représente une distorsion du marché et d’un Internet ouvert, une perversion, une intrigue ourdie pour contrôler le web, etc.
Il est bien connu qu’il faut plus d’énergie et de temps pour démonter une imposture que pour la mettre en place. L’analyse de Jeff Kao, menée avec des moyens somme toute limités, n’a pas mesuré tous les indices dénotant une campagnes de spam, ignorant par exemple la nature des adresses email utilisées ou les heures de soumission. Il s’en dégage néanmoins une tendance claire : selon Kao, seuls quelque 800 000 commentaires, sur les 22 millions recensés, sont à première vue légitimes. Sa conclusion est que sur ce qu’il appelle les commentaires publics « organiques » (c’est-à-dire non soumis par des machines), plus de 99 pour cent étaient favorables au maintien de la neutralité du Net.
De quoi prendre avec des pincettes, désormais, les mécanismes faisant appel aux commentaires en ligne pour prendre le pouls de la « vox populi » et injecter une dose de démocratie directe dans les prises de décision. Si ces mécanismes peuvent être aussi facilement abusés et manipulés, non seulement les statistiques qui en résultent n’ont aucune valeur, mais il faut de toute urgence apprendre à s’en méfier.