Les «pods» d’Instagram jouent l’algorithme en coordonnant les likes et les commentaires sur des millions de publications

Les chercheurs de NYU ont identifié des centaines de groupes d’utilisateurs d’Instagram, dont certains avec des milliers de membres, qui échangent systématiquement des likes et des commentaires afin de jouer sur les algorithmes du service et d’augmenter la visibilité. Au cours du processus, ils ont également formé des agents d’apprentissage automatique pour savoir si un message a été préparé de cette manière.

Les «pods», comme ils ont été surnommés, chevauchent la frontière entre les vrais et les faux engagements, ce qui les rend difficiles à détecter ou à prendre des mesures. Et alors qu’ils étaient une menace de niche (et sont toujours comparés aux faux comptes et aux activités de robots), la pratique augmente en volume et en efficacité.

Les pods sont faciles à trouver via la recherche en ligne, et certains sont ouverts au public. Le lieu le plus courant pour eux est Telegram, car il est plus ou moins sécurisé et n’a pas de limite au nombre de personnes pouvant être sur une chaîne. Les publications liées dans le pod sont appréciées et commentées par d’autres membres du groupe, ce qui a pour effet de les diffuser plus largement sur Instagram. algorithmes de recommandation, stimulant l’engagement organique.

La réciprocité en tant que service

La pratique des groupes qui s’aiment mutuellement les messages est appelée abus de réciprocité, et les réseaux sociaux en sont bien conscients, ayant déjà supprimé des configurations de ce type. Mais la pratique n’a jamais été étudiée ou caractérisée en détail, a expliqué l’équipe de la Tandon School of Engineering de NYU.

« Dans le passé, ils se sont probablement davantage concentrés sur les menaces automatisées, comme donner des informations d’identification à quelqu’un à utiliser, ou des choses faites par des robots », a déclaré l’auteur principal de l’étude Rachel Greenstadt. «Nous y avons prêté attention car c’est un problème croissant et il est plus difficile de prendre des mesures contre.»

À petite échelle, cela ne semble pas trop menaçant, mais l’étude a trouvé près de 2 millions de publications qui avaient été manipulées par cette méthode, avec plus de 100 000 utilisateurs prenant part à des pods. Et ce ne sont que ceux en anglais, trouvés en utilisant des données accessibles au public. L’article décrivant la recherche a été publié dans les Actes de la Conférence mondiale et peut être lu ici.

Surtout, le goût réciproque fait plus que gonfler l’engagement apparent. Les publications soumises aux pods ont obtenu un grand nombre de likes et de commentaires artificiels, oui, mais cette activité a trompé l’algorithme d’Instagram pour les promouvoir davantage, conduisant à beaucoup plus d’engagement même sur les publications ne pas soumis au pod.

À l’intérieur de l’IA Instagram qui remplit Explore avec un contenu frais et juteux

Contacté pour commentaires, Instagram a initialement déclaré que cette activité «violait nos politiques et que nous avions mis en place de nombreuses mesures pour y mettre fin», et a déclaré que les chercheurs n’avaient pas collaboré avec l’entreprise sur la recherche.

En fait, l’équipe a été en contact avec l’équipe chargée des abus d’Instagram dès le début du projet, et il semble clair d’après l’étude que les mesures en place n’ont pas eu, du moins dans ce contexte, l’effet souhaité. Je l’ai signalé au représentant et je mettrai à jour ce message si j’entends de plus amples informations.

« C’est une zone grise »

Mais n’atteignez pas encore les fourches – le fait est que ce type d’activité est remarquablement difficile à détecter, car il est vraiment identique à bien des égards à un groupe d’amis ou d’utilisateurs partageant les mêmes idées qui interagissent avec le contenu des autres dans exactement le comme Instagram le souhaiterait. Et vraiment, même classer le comportement comme abus n’est pas si simple.

« C’est une zone grise, et je pense que les gens sur Instagram la considèrent comme une zone grise », a déclaré Greenstadt. «Où ça finit? Si vous écrivez un article et le postez sur les médias sociaux et l’envoyez à des amis, et ils aiment ça, et ils le font parfois pour vous, faites-vous partie d’un pod? Le problème ici n’est pas nécessairement cette les gens font ça, mais Comment l’algorithme devrait traiter cette action, en termes d’amplification ou de non amplification de ce contenu. »

Évidemment, si les gens le font systématiquement avec des milliers d’utilisateurs et facturent même l’accès (comme le font certains groupes), cela équivaut à un abus. Mais tracer la ligne n’est pas facile.

Plus important encore, la ligne ne peut pas être tracée à moins que vous ne définissiez d’abord le comportement, ce que les chercheurs ont fait en inspectant attentivement les différences de modèles de goûts et de commentaires sur les publications ordinaires et boostées par les pods.

«Ils ont des signatures linguistiques différentes», a expliqué la co-auteure Janith Weerasinghe. « Quels mots ils utilisent, les schémas de synchronisation. »

Comme vous pouvez vous en douter, les étrangers obligés de commenter les messages dont ils ne se soucient pas vraiment ont tendance à utiliser un langage générique, en disant des choses comme « nice pic » ou « wow » plutôt que des remarques plus personnelles. Certains groupes mettent en garde contre cela, a déclaré Weerasinghe, mais pas beaucoup.

La liste des meilleurs mots utilisés se lit, comme on peut le prévoir, comme la section des commentaires sur n’importe quel post populaire, bien que cela parle peut-être d’un manque d’expressivité plus général sur Instagram qu’autre chose:

Mais l’analyse statistique de milliers de ces messages, à la fois alimentés par pods et normaux, a montré une prévalence nettement plus élevée de commentaires de «support générique», se présentant souvent de manière prévisible.

Ces données ont été utilisées pour former un modèle d’apprentissage automatique qui, une fois lâché sur des poteaux qu’il n’avait jamais vus, a été capable d’identifier les poteaux avec un traitement aussi précis que 90%. Cela pourrait aider à faire apparaître d’autres pods – et ne vous y trompez pas, ce n’est qu’un petit échantillon de ce qui existe.

« Nous avons obtenu un assez bon échantillon pour la période de temps des pods facilement accessibles et facilement trouvables », a déclaré Greenstadt. « La grande partie de l’écosystème qui nous manque, ce sont des modules plus petits mais plus lucratifs, qui doivent déjà avoir une certaine présence sur les réseaux sociaux. Nous ne sommes pas des influenceurs, donc nous ne pouvions pas vraiment mesurer cela. « 

Le nombre de pods et les postes qu’ils manipulent a augmenté régulièrement au cours des deux dernières années. Environ 7 000 postes ont été trouvés en mars 2017. Un an plus tard, ce nombre était passé à près de 55 000. Mars 2019 a vu plus de 100000, et le nombre a continué d’augmenter jusqu’à la fin des données de l’étude. Il est sûr de dire que les pods affichent désormais plus de 4000 fois par jour – et chacun obtient une grande quantité d’engagement, à la fois artificielle et organique. Les pods comptent désormais 900 utilisateurs sur moyenne, et certains en avaient plus de 10 000.

Instagram dit que les pirates de croissance sont à l’origine d’une série de fausses vues de Stories

Vous pensez peut-être: « Si une poignée d’universitaires utilisant des API accessibles au public et Google pouvaient comprendre cela, pourquoi n’a pas Instagram? »

Comme mentionné précédemment, il est possible que les équipes là-bas n’aient tout simplement pas considéré cela comme une menace majeure et n’ont donc pas créé de politiques ou d’outils pour la prévenir. Les règles interdisant l’utilisation d’une «application ou d’un service tiers pour générer de faux goûts, suivis ou commentaires» ne s’appliquent sans doute pas à ces pods, car à bien des égards, elles sont identiques à des réseaux d’utilisateurs parfaitement légitimes (bien qu’Instagram ait précisé qu’il considère pods comme violant la règle). Et la menace des faux comptes et des robots est certainement à plus grande échelle.

Et même s’il est possible que des pods puissent être utilisés comme lieu de désinformation parrainée par l’État ou à d’autres fins politiques, l’équipe n’a rien remarqué de ce genre (même s’ils ne le recherchaient pas spécifiquement). Donc pour l’instant les enjeux sont encore relativement faibles.

Cela dit, Instagram a clairement accès à des données qui aideraient à définir et à détecter ce type de comportement, et ses politiques et algorithmes pourraient être modifiés pour l’adapter. Les chercheurs de NYU aimeraient sans aucun doute vous aider.

Traduit de l’anglais de https://techcrunch.com/2020/04/29/instagram-pods-game-the-algorithm-by-coordinating-likes-and-comments-on-millions-of-posts/

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.