À l'intérieur de l'IA Instagram qui remplit Explore avec un contenu frais et juteux – TechCrunch

Instagram a publié un article décrivant les machines cachées qui remplissent l'onglet Explorer dans Instagram avec des nouveautés intéressantes à chaque ouverture. C’est un peu technique, alors voici cinq plats à emporter.

Même Instagram et Facebook ont ​​des ressources limitées

Contrairement au flux, que certains préféreraient toujours être simplement chronologique, l'onglet Explorer doit être piloté par algorithme. Cependant, comprendre ce qui se passe sur un réseau social basé sur une image et recommander de nouveaux contenus à des personnes est un problème aussi difficile à résoudre que vous ne le rencontrez.

Si ces entreprises disposaient d’une puissance de traitement et d’un temps de traitement illimités, la question d’Explorer serait probablement différente. Mais comme ils ont besoin de servir des centaines de millions de personnes à court préavis et simplement énorme ressources informatiques. Je pense qu’ils placent cela en haut de la liste pour que les gens ne se demandent pas pourquoi ils font des économies.

Il est également plus facile d’expérimenter et d’itérer lorsque vous pouvez modifier des éléments et voir rapidement les résultats, soulignent-ils.

Il s’agit du compte, pas de la poste

Tant de choses sont postées sur Instagram qu'il serait quasiment impossible de garder chaque photo individuellement, à des fins de recommandation de toute façon. Le suivi des comptes est plus simple et plus efficace, car les comptes ont tendance à avoir des thèmes ou des sujets allant du plus large, comme «voyage», à quelque chose de très spécifique, comme particulièrement le sceau rond.

Si l’enregistrement d’un message sur un compte ne signifie pas nécessairement que vous aimerez tout le reste de ce compte, c’est un bon indicateur du fait que vous êtes au moins intéressé par le thème de ce compte. Même si c’était le message de ce chat que vous souhaitiez garder à cœur, car il vous rappelle les vieux Mittens, si vous aimez les photos d’un compte qui publie principalement des chats, c’est une information précieuse.

Des habitudes complexes informent l'algorithme

Notamment, Instagram n’utilise pas uniquement les fonctions d’image pour déterminer quels comptes sont liés de manière topique, bien que ce genre de chose puisse également être détectée. Ils utilisent également votre comportement.

Par exemple, lorsque vous aimez plusieurs articles à la suite, ils ont plus de chances d’être liés, même si les algorithmes d’Instagram ne peuvent tout à fait le voir:

Si une personne interagit avec une séquence de comptes au cours de la même session, il est plus probable qu’elle soit cohérente sur le plan topique par rapport à une séquence aléatoire de comptes de la gamme diversifiée de comptes Instagram. Cela nous aide à identifier des comptes similaires sur le plan local.

Les gens ont plutôt tendance à regarder de cette façon, en passant d'un compte à un autre ou en se concentrant sur les animaux, car ils ont besoin d'un relais. Toute cette information est aspirée par l'algorithme et vérifiée pour sa pertinence. Bien entendu, des actions délibérées telles que «voir moins de messages de ce type» et le blocage de comptes ont également beaucoup de poids.

Des «comptes de démarrage» au top 25

Il peut être assez difficile de passer de quelques milliards de messages à deux douzaines de messages, mais vous pouvez réduire le problème à une taille raisonnable en limitant l'onglet Explorer aux comptes liés d'une manière ou d'une autre à des comptes pour lesquels l'utilisateur a déjà aimé ou enregistré des publications. . Ces comptes s'appellent des «comptes de démarrage», car tout le reste du processus en découle réellement.

En raison de la façon dont le système d’apprentissage automatique représente les comptes et leurs thèmes, il est très facile pour lui de trouver quelques centaines de comptes similaires.

Imaginez si vous connaissez quelqu'un qui aime un marbre rouge orangé particulier et que vous devez en trouver d'autres. Si vous plongez simplement votre main dans un sac de billes, il est peu probable que vous en trouviez une rapidement. Même si vous les répandez sur le sol, vous devrez quand même en chasser un peu. Mais si vous les avez déjà organisées par couleur, tout ce que vous avez à faire est de pénétrer dans le voisinage général du marbre qu’ils aiment et vous aurez presque la garantie de choisir un gagnant.

Pour ce faire, le modèle d’apprentissage automatique attribue à tous ces comptes une sorte d’emplacement dans un espace virtuel. Plus deux d'entre eux sont proches de cet espace, plus ils sont proches.

La partie vraiment difficile de réduire un ensemble de milliards en un ensemble de centaines est essentiellement déjà accomplie par la façon dont les comptes sont classés.

À partir de là, Instagram effectue trois passes avec des réseaux de neurones de complexité croissante.

Première, légèrement déroutant, est une version combinée plus simple des deux processus suivants, qui passe de 500 à 150 comptes. C’est un peu bizarre, mais réfléchissez de cette façon: ce réseau de neurones a vu les étapes 2 et 3 se produire plusieurs fois et a une joli bonne idée de ce qu'ils font. Un peu comme si vous aviez vu les cookies se faire assez de fois pour que vous puissiez deviner une recette. Vous vous en approcherez probablement, mais vous ne voudriez pas non plus le publier à une centaine de millions de personnes. Donc, cette étape obtient juste le truc évident.

Seconde est un réseau de neurones peu coûteux qui utilise beaucoup plus de signaux que la simple similarité topique mentionnée ci-dessus. C’est là que vos goûts personnels entrent en jeu, ainsi que des données plus détaillées sur les comptes. Vous aimez les voyages, bien sûr, mais vous aimez particulièrement des couples voyager – les deux choses que l’algorithme de tri des billes ci-dessus peuvent aider. D’autres paramètres, tels que la popularité générale d’une publication, ou sa différent parmi les autres postes de la composition, indiquez également. Cela effleure encore 100, laissant 50.

Troisième C’est une version coûteuse en informatique de ce qui précède, qui permet de transmettre ces 50 et les divise en deux, essentiellement en regardant de plus près et en prenant le temps d’inclure, éventuellement, un millier de points de données au lieu de cent.

Je suppose que c’était un peu long pour une «vente à emporter». Ne vous inquiétez pas, le prochain est rapide.

Et bien sûr, non

«Nous voulons nous assurer que le contenu que nous recommandons est à la fois sûr et approprié pour une communauté mondiale de nombreux âges sur Explore», écrivent-ils. "En utilisant une variété de signaux, nous filtrons le contenu que nous pouvons identifier comme n'étant pas éligible pour être recommandé."

Alors maintenant, vous savez pourquoi vous n’obtenez aucun cette dans Explore.

Traduit de la source : https://techcrunch.com/2019/11/25/inside-the-instagram-ai-that-fills-explore-with-fresh-juicy-content/

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.