CAPACITÉ À INFORMER DES ALGORITHMES DE RECOMMANDATION Une expérience sur le ser
CAPACITÉ À INFORMER DES ALGORITHMES DE RECOMMANDATION Une expérience sur le service YouTube Novembre 2019 Les collections CSA © Conseil supérieur de l’audiovisuel Capacité à informer des algorithmes de recommandation Une expérience sur le service YouTube 3 Résumé Une étude empirique visant à mesurer l’impact de l’algorithme de recommandation du service YouTube sur la diversité et le pluralisme de l’information Cette étude restitue les résultats d’une étude empirique menée par le Conseil visant à appréhender le fonctionnement d’un algorithme de recommandation d’une plateforme et son impact en matière de pluralisme de l’information et de diversité des opinions présentée aux utilisateurs. Les plateformes, au premier rang desquelles se trouvent les réseaux sociaux, jouent un rôle de plus en plus important dans l’accès à l’information, en particulier chez les jeunes générations : 62 % des internautes déclarent utiliser les réseaux sociaux pour s’informer1. L’immédiateté, la fraîcheur des informations disponibles et la personnalisation des contenus selon les centres d’intérêts expliquent la place toujours croissante des réseaux sociaux dans l’accès à l’information2. Les algorithmes de recommandation, qui opèrent une sélection des informations mises à disposition de l’utilisateur, jouent un rôle central dans la consommation de contenus d’information sur ces plateformes. Les principaux critères régissant ces algorithmes sont connus : les préférences et historique de consommation de l’utilisateur, les caractéristiques des contenus (source, durée), leur succès (nombre de vues, partages, commentaires), etc. Toutefois, l’importance accordée à chacun d’entre eux et leur articulation sont plus floues et plus difficiles à observer. La question se pose alors de la capacité des recommandations d’un algorithme à offrir une variété de points de vue sur un sujet donné, permettant de s’informer de manière complète et diversifiée. L’étude se concentre sur la plateforme de partage de vidéos YouTube qui occupe une place majeure dans la consommation de contenus vidéo sur Internet et propose une offre très diversifiée dans les thématiques abordées, les types d’éditeurs présents (chaînes de télévision, professionnels d’Internet, vidéastes amateurs, etc.), les formats utilisés ou encore la durée des contenus. Par ailleurs, YouTube rend publiques un grand nombre de données qui facilitent la caractérisation des contenus. Enfin, YouTube dispose d’une fonctionnalité de lecture automatique, qui s’appuie sur un algorithme de recommandation enchaînant les vidéos sans que le vidéonaute n’ait à intervenir. Elle se rapproche ainsi à certains égards à la diffusion linéaire en télévision. Ce sont les recommandations faites à partir de cette fonctionnalité qui ont été étudiées ici. 1 Kantar pour La Croix. Baromètre de la confiance dans les médias. 01/2019. 2 Médiamétrie. La place croissante des réseaux sociaux dans l'accès à l'information. 29/11/2016. Capacité à informer des algorithmes de recommandation Une expérience sur le service YouTube 4 Principe de l’étude et méthodologie : l’examen des recommandations du mode lecture automatique de YouTube faites à chacun des participants Le principe de l’expérience a consisté à lancer, à partir du compte Google de chaque participant, des vidéos sur divers sujets. Ces vidéos étaient les mêmes pour tous les participants. À partir de chaque vidéo de départ, les 10 vidéos successivement recommandées par la lecture automatique ont été analysées selon les prismes de la diversité des points de vue et de la proximité avec les centres d’intérêt des participants. Les vidéos de départ portaient sur 23 thèmes présélectionnés, très divers et susceptibles de susciter des clivages d’opinions marqués, tels que la laïcité, le réchauffement climatique ou la vaccination1. Entre 3 et 5 vidéos présentant une diversité de points de vue ont été sélectionnées pour chacun de ces thèmes, soit un total de 101 vidéos de départ. L’expérience a été réalisée à partir de 42 profils, dont ceux de 38 agents du Conseil2 et 4 profils fictifs créés spécialement pour l’étude. Les participants ont rempli un questionnaire sur leurs habitudes et préférences de consommation sur YouTube, dans le respect du cadre juridique relatif à la protection des données personnelles3. Ces informations fournies par les participants et les vidéos suggérées par la lecture automatique de YouTube (plus de 39 000 au total) constituent la matière première de l’étude. Résultats et enseignements Les résultats de l’expérience menée par le Conseil permettent de dégager quelques enseignements sur le fonctionnement de l’algorithme de recommandation de YouTube s’agissant de la fonctionnalité de lecture automatique. Dans ses premières recommandations, l’algorithme semble accorder moins d’importance au nombre de vues, à la date de publication ou encore au nombre de réactions qu’aux mots- clés associés au thème de départ des vidéos. L’analyse des vidéos recommandées aux participants selon leur nombre de vues et leur date de publication fait apparaître que celles-ci ne sont ni les plus vues ni les plus récentes sur la plateforme. La moitié des vidéos recommandées comptent moins de 150 000 vues et 80 % en totalisent moins de 500 000. De même, seules 22 % des vidéos recommandées ont moins de 6 mois. L’algorithme ne semble pas non plus recommander en priorité les vidéos récentes qui ont fait un « buzz » : les deux vidéos de moins de deux mois les plus recommandées au cours de l’expérience comptaient respectivement 757 et 1 215 vues. 1 Liste exhaustive des 23 thèmes : « Le grand remplacement », Bitcoin et cryptomonnaies, Corrida, Drague dans la rue, Droits sexuels et reproductifs, Éducation sexuelle à l’école, Épilation, Euro, Homosexualité, Intelligence artificielle, Laïcité, Machisme vs. Féminisme, Missions sur la lune, Mort de Michael Jackson, Réchauffement climatique, Réforme de la SNCF, Sectes, SIDA, Téléphone à l’école, Territoires palestiniens occupés, Vaccins, Véganisme, Vie extraterrestre. 2 Le nombre de participants retenu répond avant tout à des préoccupations de nature pratique. 3 RGPD, Règlement Général sur la Protection des Données. Capacité à informer des algorithmes de recommandation Une expérience sur le service YouTube 5 Les vidéos les plus recommandées (plus de 40 fois au cours de l’expérience) portent généralement sur le thème de départ et sont majoritairement recommandées juste après la vidéo de départ. L’analyse des caractéristiques de ces vidéos n’a pas montré de trait commun : le nombre de vues, le nombre de « j’aime » / « je n’aime pas », et le nombre d’abonnés de la chaîne de publication varient fortement. Dans ses premières recommandations, l’algorithme semble dès lors se focaliser sur le thème de départ et proposer un même corpus de vidéos aux utilisateurs, indépendamment des caractéristiques des vidéos. Pour proposer du contenu supposé pertinent aux utilisateurs, l’algorithme s’appuie sur les mots-clés présents dans le nom des chaînes, les titres et les tags1 afin de lier les vidéos entre elles par un dénominateur commun. La recommandation algorithmique pourrait produire des phénomènes dits de chambre d’écho à l’échelle du groupe de participants pouvant affecter la diversité des contenus proposés et le pluralisme des opinions exprimées dans les vidéos recommandées. Sur l’ensemble des vidéos recommandées, 18 % concourent au débat associé au thème de départ (27 % lorsqu’on prend en compte les vidéos se rapportant à ce thème de manière plus large). Ce chiffre varie cependant considérablement selon les thèmes et peut aller de 2 % à 33 %. Parmi les facteurs pouvant expliquer ces différences figurent le nombre de vidéos disponibles sur le sujet sur YouTube et le dynamisme de la communauté d’utilisateurs portant le sujet en question et qui se matérialise notamment par le nombre de commentaires, partages ou réactions. De plus, les résultats de l’étude mettent en exergue que la puissance des chaînes, c’est-à-dire la probabilité pour qu’un utilisateur qui vient de regarder une vidéo d’une chaîne donnée se voie ensuite proposer une vidéo de la même chaîne, est un facteur important de recommandation : sur l’ensemble des vidéos recommandées, 41 % des vidéos lues proviennent de la même chaîne que la vidéo directement précédente. Un phénomène dit de chambre d’écho2, consistant à se voir recommander des vidéos de même type ou d’une même source pendant une longue période de temps, pourrait donc apparaître ici aussi. S’agissant de la diversité des points de vue exprimés dans les vidéos recommandées sur un thème donné, plus d’un tiers des vidéos recommandées portant sur le thème de départ expriment le même point de vue que la vidéo de départ. Au fil des recommandations, 44 % des vidéos proposés par la lecture automatique vont dans le même sens que la vidéo directement précédente. Ce phénomène pourrait provenir des tags qui peuvent porter la marque de l’opinion exprimée dans la vidéo et prioriser ainsi dans les recommandations les vidéos exprimant le même point de vue. Le dynamisme de la communauté semble également jouer un rôle central. 1 Un tag (ou étiquette, marqueur, libellé) est un mot-clé associé à de l'information (par exemple une vidéo), qui décrit une caractéristique de l'objet et permet un regroupement facile des informations contenant les mêmes mots-clés. Les tags sont habituellement choisis de façon personnelle par l'auteur ou l'utilisateur ; ils ne font souvent pas partie d'un schéma de classification prédéfini. 2 Une chambre d'écho est une expression généralement retenue pour décrire une situation dans laquelle un individu se voit proposer de l'information, des idées, ou des croyances amplifiées ou renforcées par la répétition. Capacité à informer des uploads/Litterature/ csa-etude-capacite-a-informer-des-algorithmes-de-recommandation-une-experience-sur-le-service-youtube.pdf
Documents similaires










-
35
-
0
-
0
Licence et utilisation
Gratuit pour un usage personnel Attribution requise- Détails
- Publié le Jui 21, 2021
- Catégorie Literature / Litté...
- Langue French
- Taille du fichier 1.6156MB