Congrès

L’archiviste et les médias sociaux : communautés de pratiques et défis pour les institutions de mémoire relevant du secteur public

Dans le cadre du 49e congrès de l’AAQ, notre reporteur étudiante, Camillia Buenestado Pilon, a préparé une série de comptes-rendus de conférences. Ceci est le troisième et dernier texte de la série.

Archiviste et chargée de recherche et de politiques stratégiques à Bibliothèque et Archives Canada, Rachelle Chiasson-Taylor a présenté, au cours du congrès de l’Association des archivistes de 2020, un résumé de ses recherches portant sur la gestion du contenu des médias sociaux intrant dans les fonds privés de BAC. Les recherches de Mme Chiasson-Taylor ont notamment pour objectif de trouver une orientation claire pour la Direction des archives privées chez BAC visant l’acquisition de médias sociaux, dans le cadre d’une pratique archivistique plus large.

Lesdites recherches résultent entre autres de l’acquisition entre 2015 et 2018 des contenus de médias sociaux de l’ancien premier ministre Stephen Harper. Cette acquisition assez importante a soulevé une préoccupation de se doter d’une approche cohérente en la matière, tandis que les politiques d’acquisition de BAC ont été dument vérifiées pour s’assurer qu’elles soient assez solides pour ce nouveau genre de document. Par ailleurs, s’il a fallu examiner les pratiques de BAC avec ce type de contenu, les recherches de Mme Chiasson-Taylor se sont aussi penchées sur ce que font d’autres institutions dans le monde relativement à ce type de contenu et ce à quoi ressemblerait une possible communauté de pratique.

Mme Chiasson-Taylor procède d’emblée de dégager certains enjeux essentiels à la réalisation de sa recherche. Elle affirme que les médias sociaux sont un facteur incontournable du patrimoine historique, que les institutions de mémoire se doivent d’acquérir, de préserver et de s’assurer de rendre accessibles à long terme. Or, à la suite d’un balayage environnemental, seulement 7,5 % des institutions de mémoire ont un plan pour les médias sociaux entrants dans les fonds privés, cependant que les médias sociaux exigent des pratiques professionnelles adaptées pour leur acquisition, leur conservation et leur accès à long terme. De plus, le contenu des médias sociaux est rarement inclus dans le développement des collections dans la majorité des institutions. D’ailleurs, souligne la chercheure, il n’existe aucune norme claire pour guider l’archivage du contenu des médias sociaux acquis dans le secteur privé. Enfin, l’archivage des contenus de médias sociaux présente des enjeux de grande taille, tant au niveau de la législation que des technologies de sauvegarde et de capture. Il apparait donc évident que l’accès au contenu de médias sociaux dans les archives privées n’est pas développé, essentiellement en raison de la concurrence de ces droits et lois. Les lois qui régissent les interlocuteurs, les institutions de mémoire et la propriété intellectuelle mettent en péril l’archivage pérenne des médias sociaux.

Mme Chiasson-Taylor soulève deux préoccupations qui feront l’objet d’une analyse plus poussée. Dans le balayage environnemental, seulement les institutions acquérant des archives web le faisaient pour l’acquisition de médias sociaux. De plus, les technologies sont problématiques. Voyons voir en quoi ces enjeux mettent sérieusement en péril l’acquisition de ce type de contenu.

Archives web VS médias sociaux

Tout d’abord, faut-il considérer les médias sociaux comme une composante ou non de l’archivage du web? L’archiviste affirme que l’archivage du web fait partie du développement des collections dans la majorité des bibliothèques et archives du monde. Il se réalise de deux façons : par nom de domaine, ou de façon sélective. En ce qui concerne les médias sociaux, la volatilité des plateformes, et les droits d’auteur font en sorte que des choix doivent être faits.

Les archives web font partie intégrante des stratégies et politiques des collections dans les institutions publiques, et la plupart des institutions de niveau national à travers le monde moissonnent le web de façon sélective. Tel est le cas de BAC, qui fait partie du consortium Internet Archive. Dans la « Wayback Machine », plusieurs sites avec le domaine .ca d’importance nationale sont archivés. Et dans l’éventualité de l’acquisition de médias sociaux de manière sélective, les implications pour l’archiviste sont importantes, d’où l’enjeu des pratiques professionnelles adaptées. C’est intéressant, relève Mme Chiasson-Taylor, car sélection implique expertise, qui implique elle-même un investissement. Si l’on procède par « cherche et trouve », il faudra que ces archives présentent des mots-clés spécifiques, qui seront eux-mêmes créés par des experts. Le contenu numérique requiert un grand investissement dans l’expertise technologique, historique, et archivistique.

Les technologies

Nous avons vu qu’il y a deux sortes de façon de moissonner les médias sociaux. Mme Chiasson-Taylor précise que deux mécanismes interagissent avec les plateformes de médias sociaux : via le site web du média social, et par le biais de la « Wayback Machine », et via le API (Application Programming Interfaces), qui traduit le contenu en HTML et rendu sur un navigateur. Pour ce qui est de la « Wayback Machine », on reconnait l’environnement, mais il faut admettre qu’il y a beaucoup de pertes au niveau du rendu visuel et du contenu interactif. À l’inverse, un moissonnage fait par API fournit le contenu sous forme de texte structuré, destiné à être rendu par une application. Il faut lui appliquer un logiciel pour recréer l’environnement. Mais dans les deux cas, force est de constater qu’il y a des pertes de données et ainsi, un problème important de technologie.

L’archiviste et analyste politique chez BAC relève trois constats qui pourraient expliquer l’absence de stratégie nationale pour l’archivage des médias sociaux.

La gouvernance, les lois, l’éthique et les ententes pour les licences sont des facteurs déterminants dans l’acquisition de médias sociaux.

  • Chaque raison d’archiver le web dans chaque juridiction est dictée par le contexte unique de ladite juridiction et autorités juridiques. Et donc, les législateurs différents génèrent des législations différentes. On ne peut transférer un contexte d’acquisition web d’une juridiction à l’autre.
  • Les problèmes de droits d’auteur et de propriété intellectuelle sont immenses lorsque l’institution n’est pas détentrice des droits de propriété intellectuelle. Le droit légal d’archiver des sites web dépend largement des pays et de l’objectif des organisations.
  • Au niveau éthique, on peut se demander si la construction d’outils de recherche contribue à la mise en place d’infrastructures de surveillance des données (Dataveillance). On pourrait faire valoir que quand les utilisateurs de réseaux sociaux ne limitent pas l’accès à leur contenu et leur profil, et quand leur contenu agrégé et anonyme est approprié par une tierce partie, il ne devrait y avoir aucun problème. Cependant, cette position ignore le fait que le contenu accessible au public n’est pas toujours destiné à être agrégé ou consommé par n’importe qui.

Les archives web et les médias sociaux sont différents, mais complémentaires.

  • La nature des médias sociaux exige un ensemble de pratiques professionnelles différentes que pour les contenus web, en raison des droits et technologies d’accès.
  • Le droit d’auteur du créateur ne peut couvrir les commentaires et les réactions qui s’attachent à son fil de discussion ou à ses messages principaux.
  • Les conditions générales de service des plateformes sont contraignantes en termes de traitement, de préservation et d’accès.
  • Les contextes affiliés aux médias sociaux doivent être saisis à des fins d’authenticité et de préservation; des copies ou des instantanés de pages web n’arrivent pas à capter la complexité de ce contexte.
  • Les médias sociaux ne peuvent être utiles à long terme que s’ils sont collectés avec des métadonnées, minimalement par le biais des API des différentes plateformes. Toutefois, cela limite l’accès.

Des pratiques avant-gardistes d’archivage des médias sociaux existent.

  • Aux Pays-Bas : La plateforme Occasio est l’une des premières formes d’archivage des médias sociaux. C’est la plus ancienne collection Internet. Elle se compose de tableaux d’affichage des années 1980 et 1990 conservés par l’Institut National d’Histoire Sociale d’Amsterdam. Ils peuvent se targuer qu’ils sont les initiateurs des archives nées numériques!
  • En Belgique : C’est avec la capture de tweets sur les attaques terroristes à Bruxelles en 2016 que les chercheurs belges ont développé une application en open source, Twapperkeeper (qui fait maintenant partie de l’outil HootSuite). Cette application capture, store et protège les tweets tout en rassemblant une communauté de personnes qui partagent leur expertise. De plus, un consortium s’est également développé en 2016 avec différentes universités. Quand à lui, le projet PROMISE vise à identifier des méthodes d’archivages web affiliées au contenu d’archivage belge et à faire des recommandations pour l’archivage durable des médias sociaux.
  • Aux États-Unis : La stratégie de NARA en matière de médias sociaux regroupe les meilleures pratiques pour les captures de médias sociaux et est cristallisée dans un document, un White Paper, révolutionnaire et utile pour les médias sociaux. Il ne s’agit pas d’acquisition, mais plutôt de gérer le contenu créé par des agences gouvernementales centrales dans une perspective de préservation de l’accès à long terme.
  • La Library of Congress : un cas intéressant de moissonnage de tous les tweets dans le domaine des États-Unis. Depuis 2010, la Library of Congress a archivé tous les tweets provenant des États-Unis, mais depuis 2018, elle n’en acquiert plus – ou plutôt sur une base très sélective. Cette collecte visait à acquérir et à préserver un registre de connaissances et de créativité.
  • Au Royaume-Uni : le MirrorWeb est un modèle d’acquisition de médias sociaux dévolu entièrement au privé. C’est ainsi un modèle de partenariat public-privé intéressant. Cependant, il n’y a pas encore d’accès possible dans les fonds privés.
  • La bibliothèque de l’Université George Washington : leurs initiatives, commente Rachelle Chiasson-Taylor, sont les plus progressistes. Ils peuvent collecter des données à des fins de recherche, d’archivage et d’enseignement par le biais de leur logiciel Social Feed Manager, élaboré pour soutenir la recherche sur les médias sociaux sur le campus. Celui-ci recueille des données à partir de sources publiques et gratuites fournies par les plateformes. Les chercheurs reçoivent des données dans plusieurs formats et peuvent consulter des documents en personne à la bibliothèque. Une solution sur mesure pour l’accès.
  • La Bibliothèque nationale de Nouvelle-Zélande : dans le cadre du projet ATL 100, qui célèbre les 100 ans de la Alexander Turnbull Library, les Néozélandais sont invités à faire don de leurs archives Facebook à la bibliothèque. Celle-ci poursuivra son travail pour les besoins de recherche émergents et anticipés de l’avenir. Il s’agit d’un leader dans la collecte et l’accès aux archives privées.
  • Les archives nationales d’Australie : elles ont mis en place des directives claires pour archiver des médias sociaux conçus par le gouvernement central (un peu comme NARA).

Quelles pistes de solution?

Au terme de ses recherches, Mme Chiasson-Taylor en arrive à certaines pistes de solutions axées sur les médias sociaux qui devront éventuellement être intégrées dans une stratégie d’acquisition de contenus web.

  • Demander l’intégration du contenu web et de médias sociaux dans la législation pertinente avec une portée et des détails suffisants. Il faut mettre à jour les lois qui régissent les documents numériques dans nos fonds d’archives et institutions publiques;
  • Inclure la collecte de médias sociaux en tant que composante du développement des collections privées. Le développement n’inclut pas encore la collecte;
  • Diriger le tri et le téléchargement par les créateurs du contenu de leurs propres archives de médias sociaux avant le transfert, en amont;
  • Exiger un niveau de détail plus élevé concernant le contenu des médias sociaux et les droits du créateur dans les contrats de don ou d’acquisition;
  • Investir dans le personnel et les ressources pour la collecte de données sur le web et les médias sociaux et sous-contracter les tâches au secteur privé habilité;
  • Créer et maintenir des licences numériques avec les fournisseurs de médias sociaux;
  • Établir des normes universelles et une communauté de pratique pour partager l’information sur l’acquisition de ces documents.

En conclusion, un long chemin reste à parcourir avant de voir les communautés de pratiques s’homogénéiser et les enjeux demeurent importants. Mais l’acquisition de ce type de contenu fera certainement partie du paysage archivistique futur.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s