Numérique

La construction des sources historiques de demain: dématérialisation et conservation du contexte

Par Béatrice Lecomte, archiviste au Service des archives et de gestion des documents de l’UQAM *

Introduction

Hans Booms a, dans un texte fondateur, situé l’évaluation comme étant la fonction la plus noble de la discipline archivistique. Il est donc toujours important de garder en tête ce que la littérature met comme outils, principes et processus à disposition de l’archiviste afin qu’il arrive à une évaluation la plus rigoureuse possible. Cette fonction a pour but, particulièrement dans le cas des archives historiques, de bien refléter la société d’où émanent les documents. La lecture d’un texte de Joseph Morsel, historien-médiéviste, intitulé “Les sources sont-elles « le pain de l’historien » ?”, dans lequel il enjoint ses collègues et étudiants à ne jamais oublier que leurs « sources » ont subi un tri et une sélection (Morsel 2003), suscite quelques réflexions quant au concept d’évaluation. En effet, cette lecture, mise en parallèle avec le texte d’Hans Booms (2002), où ce dernier illustre l’influence de la société sur l’acte d’évaluation, permet de réaliser toute l’importance de préserver le contexte lors de l’évaluation. Ces lectures mettent en lumière l’impact que peut avoir ce geste.

À partir de ces réflexions, il est intéressant de pousser plus loin et d’explorer comment le contexte peut être conservé à l’ère du numérique. En effet, il est moins aisé, avec le règne de la « donnée », de percevoir l’intérêt ou la signification d’un document électronique au-delà de l’information factuelle qu’il porte. Le rapport avec un tableur rempli de données est définitivement moins inspirant, voire émotif, au premier abord qu’avec un parchemin enluminé. Le contexte participe à cette inspiration, car il fait mesurer la signification ou « l’importance historique » du document en question. Mais dans le cas des archives numériques, où se situe ce contexte? On pourrait arguer qu’il est maintenant défini par les métadonnées liées au document, mais est-ce suffisant et à quelles conditions? Permettront-elles aux documents de nous donner un reflet fidèle et complet de notre société? Dans un autre ordre d’idée, la dématérialisation annoncée aura-t-elle un impact sur la lecture des sources historiques?

Le but de ce texte est de se pencher sur ce que différents auteurs pensent de la construction des archives historiques à partir des documents numériques et de faire la synthèse des outils et moyens disponibles ou à créer, afin d’assurer la conservation du contexte de création des données et la pérennité de l’ensemble. C’est tout d’abord par l’exploration de différents concepts, tels que ceux de « sources » et de « contexte », que l’exercice sera tenté. Ensuite, nous verrons différents points de vue sur les changements amenés par l’arrivée du numérique et de ses impacts sur les pratiques archivistiques et la discipline historique. Finalement, nous examinerons dans quelle mesure et sur quels aspects il pourrait être nécessaire de renforcer l’évaluation afin d’appuyer les archivistes dans leur rôle d’ « architectes actifs de la mémoire » (Doom 2006, 26).

Concepts en jeu

Les sources ou l’archivistique, discipline auxiliaire de l’histoire 

Dans un texte publié en 2003, suite à une journée d’étude de la Sorbonne ayant pour thème « L’historien et « ses » sources », Joseph Morsel nous invite à prendre conscience de la construction des sources utilisées par les historiens. En effet, il a comme objectif de rappeler à tous les historiens que les sources qu’ils s’approprient dans le cadre de leurs recherches ont été le produit d’une société, qu’elles ont été choisies par le chercheur et le plus important, en ce qui nous concerne, qu’elles ont été sélectionnées au fil du temps par des archivistes. Ce texte souligne l’impact qu’a l’évaluation des archives dans la construction de la postérité, mais cette conscience n’a pas toujours été présente. Il faut rappeler qu’avant la Révolution française, les archives avaient principalement un rôle administratif ou juridique et que c’est plus tard au XIXe siècle que la vision patrimoniale des archives s’est développée (de Boisdeffre 2010, 62). Certains auteurs élargissent même le concept de document en tant que source à tout ce qui peut être « lu », comme le font Marie-Anne Chabin (2004, 147) et Régis Debray (1999, 28). Ce dernier affirme que c’est la conscience de l’histoire qui fait le document. Nous verrons plus loin comment cela s’applique dans le cadre du numérique.

Dématérialisation : conservation de documents ou conservation de données ?

Avec l’arrivée du numérique, on a beaucoup entendu parler de la dématérialisation qui en était le résultat. Bien qu’a priori, on perde la notion d’objet physique « manipulable » dans les documents produits à l’aide de bits et d’octets, les points de vue diffèrent quant à la signification de ce changement.

En effet, certains, comme Françoise Banat-Berger, affirment qu’il y a bel et bien dématérialisation, puisque le support n’est plus indissociable du contenu et que le risque d’obsolescence des supports est élevé. Aussi, selon elle :

Archiver de manière pérenne une information numérique revient par conséquent à la rendre indépendante de son environnement d’origine afin de pouvoir la restituer lorsque cela sera utile, dans l’environnement qui sera celui du temps de la restitution. (Banat-Berger 2010, 75)

Pour assurer la conservation, cette auteure s’attarde principalement dans ses écrits à définir les critères d’évaluation des formats de données, comme la priorisation des formats ouverts (la documentation sur la structure du format étant disponible) ou encore des formats normalisés (Banat-Berger, Duplouy et Huc 2009, 105). Dans le même ouvrage, elle indique aussi les qualités recherchées pour les supports afin de favoriser la préservation, telles que la stabilité, la distribution et la simplicité (Banat-Berger, Duplouy et Huc 2009, 87). De façon générale, François Banat-Berger invite à conserver le contenu et l’information de représentation, peu importe le support favorisé.

De son côté, Marie-Anne Chabin considère, nous l’avons vu plus haut, que lorsqu’il y a une trace volontaire (ou même fortuite) qui est assez intelligible pour devenir une source d’information, il y a document. Cette définition s’applique également au numérique à condition que l’information soit fixée et le support maintenu (Chabin 2004). Pour Chabin, la matérialisation est l’outil qui rend l’information intelligible pour quelqu’un d’autre et elle est présente dès que l’auteur pose le geste de laisser une trace, même si le document n’est jamais diffusé ou même lu (Chabin 2004, 145). On peut concevoir facilement que, dans le monde numérique, la définition de support est bousculée quant à nos conceptions traditionnelles, mais qu’il est toujours présent. Il n’y a donc pas dématérialisation à proprement parler. Par contre, elle rejoint la position de Françoise Banat-Berger en ce qui concerne la mise de côté du support par rapport à l’importance du contenu dans l’environnement numérique (Chabin 2004, 147). De ce point de vue, c’est la capacité de transmettre l’information, la possibilité de la lire, qui fait le document. Afin de se transformer en archives, au sens patrimonial, le document devra être en mesure d’affronter le temps, contenir des informations complètes et être conservé à l’abri de la dégradation. Il est donc nécessaire de tenir compte de ces facteurs dans l’établissement des calendriers de conservation afin de considérer le potentiel de pérennité des différents formats. Dans le contexte numérique, cela demande la stabilité du support, comme l’a exprimé Françoise Banat-Berger, ainsi que la fixation de l’information.

Contexte de création et contexte de conservation

Mais quelle information fixer dans le cas du numérique ? Dans les archives sur support papier, le matériau lui-même participait de la définition du contexte de création. Il pouvait être « lu » et même attester de l’authenticité et de la valeur d’un document. Dans le cas du numérique, la question se pose autrement. Devons-nous ajouter à l’information factuelle consignée des éléments nous permettant de reconstituer le contexte?

Hans Booms, dans son texte « Ordre social et constitution du patrimoine archivistique », affirme que dans l’évaluation, qu’il considère, rappelons-le, comme la fonction la plus importante de l’archiviste, il est primordial de conserver le contexte. En effet, il écrit :

En évoquant les relations entre l’individu et la société, nous avons constaté d’emblée qu’il n’est pas donné à l’être humain de désigner comme précieux ou non précieux un objet considéré pour lui-même, c’est à dire isolé de son contexte. (Booms 2002, 16)

On voit bien que, dans ce cas, il faut être en mesure de relativiser et de comparer. Dans le cadre de l’évaluation, cela se traduit selon Hans Booms par l’établissement de critères de valeur déterminée par le contexte social lors de la création. Ces critères étant identifiés et contrôlés, ils constituent des éléments d’informations supplémentaires illustrant le contexte. Aussi, l’utilisation d’une échelle de valeurs contemporaine à la naissance du document évite que l’archiviste fasse « violence aux sources » (Booms 2002, 35) et, en influence la lecture. Par contre, tout comme Joseph Morsel, il plaide en faveur de la prise de conscience des historiens quant à la construction de leurs sources. On peut aussi voir que cette approche dans l’évaluation permet de faire des liens entre les événements documentés et les documents conservés.

D’autres auteurs se sont aussi penchés sur l’importance de conserver le contexte. Par exemple, Luciana Duranti, dans « Archives as a Place », en fait un facteur de fiabilité de l’archive (Duranti 1995). La garantie de son authenticité est assurée par la conservation du contexte, par sa localisation et sa description, ainsi que par la permanence de leurs relations (Duranti 1995, 247). Francis X. Blouin affirme de son côté que le concept du records management sous-entend par défaut l’importance du contexte de création des documents puisqu’il s’attache à illustrer les activités ou les fonctions (Blouin 2006, 96).

Le collectif Roger T. Pédauque, quant à lui, explique qu’il y a du sens dans la forme (Pédauque 2003, 10), sens auquel il faudra réfléchir de façon particulière en ce qui concerne les documents numériques. D’ailleurs à propos de cette dissociation entre le contenu et le support, il constate :

[…] le document paraît souvent une notion secondaire, seul le texte, le contenu, compte vraiment. Pourtant, le contenu n’a de valeur […] que par rapport à un contexte. Le document n’est-il pas justement une des constructions de ce contexte en positionnant les informations qu’il contient par rapport à celles contenues dans d’autres documents et en permettant au lecteur d’avoir une indication de la valeur du contenu par le statut du document? (Pédauque 2003, 17)

Du côté australien, dont nous verrons le modèle plus loin, on souligne la possibilité de donner le contexte par des schémas de métadonnées riches et élaborés (McKemmish et al. 2014, 4). Ces auteurs soulignent tout le défi d’archiver des documents qui ne sont pas des objets passifs, mais aussi la confiance qu’ils ont envers les archivistes et gestionnaires de documents d’y parvenir puisqu’ils ont toujours été des experts en termes de métadonnées, sous toutes leurs formes, à travers toutes les époques.

Dans le contexte du numérique, peu importe le format ou les formes priorisées, l’évaluation en sera influencée. Ces facteurs, que nous pouvons considérer comme externes au contenu s’ajouteront aux critères de sélection, un peu à la manière dont l’état de conservation des documents est appliqué en ce moment.

Archiver le numérique dans une perspective patrimoniale

Les changements avec l’arrivée du numérique

La révolution du numérique a amené également de nombreux changements dans la pratique archivistique. Nous en verrons ici quelques-uns tout en essayant de voir l’impact de ces changements sur l’évaluation. Tout d’abord, rappelons que Luciana Duranti aime à considérer les archives comme un lieu, notion qui disparaît avec le numérique. En effet, les facteurs favorisant l’établissement d’archives nationales, comme la conservation de l’intégrité ou l’économie par la centralisation, deviennent peu à peu caducs. Les documents sont généralement mieux conservés dans leur environnement original, la multiplication des formats rend la préservation coûteuse et l’accès à distance facilite les choses pour l’usager (Duranti 1995, 250). D’ailleurs au sujet de la simplicité et de l’accessibilité des outils, Richard N. Katz et Paul B. Gandel écrivent que tout le monde est aujourd’hui un archiviste potentiel et peut se créer son propre dépôt virtuel (Katz et Gandel 2011, 231).

Pour ces derniers, les changements causés par les nouvelles technologies ont un impact sur l’archivistique au moins aussi important que le passage de la tradition orale à la tradition écrite (Katz et Gandel 2011, 225). Ils semblent croire que cette masse d’information, décontextualisée par une myriade de manipulations puisse nous faire revenir à des temps plus obscurs (Katz et Gandel 2011, 234). Ils déplorent aussi le fait que l’évaluation des informations en ligne soit réalisée par des algorithmes liés à la fréquentation et au référencement des sites. Ils plaident donc pour que l’archiviste puise ses documents directement à la source de production et de création (Katz et Gandel 2011, 236).

Il y aussi des changements au niveau de la notion de document. Marie-Anne Chabin, nous l’avons vu plus haut, considère que le changement se situe plus précisément au niveau de la définition de « support », mais d’autres auteurs croient qu’il y a bien une mutation de ce concept. Le collectif Roger T. Pédauque, par exemple, considère que le changement de l’aspect matériel cause un changement du traitement cognitif, de la perception et de l’usage (Pédauque 2003, 2). Selon lui, avec le numérique, la perte de l’appréciation directe du document, le besoin de médiation de la machine est significatif. Il résume ce changement par les équations suivantes : « document traditionnel = support + inscription » et « document numérique = structure + données » (Pédauque 2003, 10).

Il faut encore une fois souligner que le support devient effectivement plus ambigu, les fichiers pouvant accueillir images, vidéos et son en plus du texte, et Roger T. Pédauque évoque aussi la dispersion des documents dans différentes « caches » et unités de stockage (Pédauque 2003, 6). Ceci n’est qu’un élément supplémentaire confirmant l’instabilité ou « la fragilité des usages numériques », comme le titre Jean-Claude Domenget (2013).

Cette fragilité se reflète aussi concrètement dans les défis de conservation que posent les documents numériques. Comme le présente Marie-Anne Chabin, auparavant, la stabilité et la capacité d’autoconservation garantissaient l’intégrité du document (Chabin 2004, 151). Maintenant, en plus de le maintenir en état de stabilité, il faut garantir son existence et sa conservation dans le temps et donc le « fixer ». Mais, nous l’avons vu, un des défis dans ce cadre est de définir et de circonscrire l’objet à pérenniser, tout comme celui qui sera manipulé, décrit ou consulté (Chabin 2004, 155).

Il reste un dernier aspect à aborder, puisqu’il pose la question de l’avenir de la vision traditionnelle de l’archivistique en tant que discipline auxiliaire de l’histoire. Francis X. Blouin constate que, en partant du point de vue de la classification, l’archivistique et l’histoire ne font plus partie du même cadre conceptuel. Avant, des liens très serrés existaient entre les deux disciplines (Blouin 2006, 97). L’objectif était de conserver des documents authentiques qui avaient le potentiel de servir de sources (de par leurs valeurs de témoignage ou d’information). Aujourd’hui, l’histoire se détache des archives et les archives font une place importante à une nouvelle clientèle qui n’est pas exclusivement constituée de chercheurs universitaires. Aussi, les archivistes se consacrent de plus en plus à la gestion de documents et à la gestion de la masse documentaire et ne sont plus « les jumeaux des historiens » (Blouin 2006, 98). Ces derniers ont ainsi moins d’influence aujourd’hui que dans le dernier siècle sur la façon de constituer et d’appréhender les archives.

Les changements dans la façon de faire l’histoire

L’archivistique n’est bien sûr pas la seule discipline à être affectée par la venue de ces technologies. Nous nous permettrons ici un détour en abordant les changements qui affectent les historiens. Martine de Boisdeffre constate que le contact avec l’archive n’est plus direct, puisque les accès peuvent être distants, comme nous l’avons évoqué plus haut (de Boisdeffre 2010, 66). La séparation entre les données et le support est effective (alors qu’avant, soulignons-le encore une fois, si on conservait le support, on préservait les données). Cela encourage la diffusion et bien que le rapport soit à distance, il est plus étroit entre les usagers (chercheurs ou grand public) et les archives. Elle écrit : « Les temps sont finis où seuls les historiens avaient un rapport avec les archives en tant que lieu matériel où ils lisaient des pièces matérielles dont ils se faisaient les interprètes et les passeurs » (de Boisdeffre 2010, 69).

Serge Noiret affirme dans la même veine qu’il est maintenant possible à tous de faire de l’histoire sans médiateur (Noiret 2011, 19). Pour lui, l’histoire 2.0 est en émergence. Elle donne accès à des archives sans intermédiaire et le web collaboratif permet aux historiens d’accéder à nombre de témoignages ou de documentation personnelle (Noiret 2011, 32). Cela demande la création de nouveaux outils pour les historiens ainsi que de nouvelles façons d’évaluer les sources. Un peu comme Hans Booms, qui souhaitait la préservation des liens, cet auteur souligneamène cet aspect dans la technologie actuelle en affirmant que les hyperliens d’aujourd’hui ne fournissent plus seulement un « parcours de lecture », mais « y ajoute du « sens » en proposant de compléter la recherche avec d’autres contenus qui y soient liés » (Noiret 2011, 7). Même s’il ne s’agit pas sémantiquement parlant des mêmes liens, l’analogie reste intéressante.

Finalement, dans ce contexte, Franziska Heimburger et Emilien Ruiz encouragent les historiens à se former aux outils informatiques (Heimburger et Ruiz 2012, 87). Avec une formation à ces outils et le développement de compétences solides dans la critique des corpus numériques, il sera possible pour les historiens de les exploiter avantageusement. Toujours est-il qu’il faudra être en mesure d’en valider l’authenticité. Il s’agit peut-être là d’un des derniers points de convergence entre l’archivistique et l’histoire.

Les pistes de solution de Françoise Banat-Berger

Dans un des textes cités plus haut, Françoise Banat-Berger situe l’importance, dans une perspective archivistique, que l’organisation soit faite dès la création des documents. Cela sous-entend l’application d’un calendrier de conservation et d’un plan de classification. En effet, elle écrit : « il est vain de pouvoir récupérer un « vrac » numérique, dont on ignore le statut ou les caractéristiques » (BanatBerger 2010, 77). Afin de conserver le contexte, et donc la capacité de tirer une signification des données, on peut aisément concevoir la nécessité de l’intervention la plus hâtive possible de la part de l’archiviste.

L’auteure considère qu’il y a cinq aspects sur lesquels l’archiviste peut agir. Premièrement, il est impératif de chercher à conserver le contenu descriptif (structure, aspects techniques, etc.) dans le but de transmettre la capacité de « restituer ce contenu dans toute son intelligibilité à la communauté de ses utilisateurs au-delà de ceux qui l’ont produit » (Banat-Berger 2010, 75). Dans un deuxième temps, il faut mettre en œuvre un modèle organisationnel pour la collecte et le contrôle qui soit clair. Ensuite, elle réclame une plus grande coopération entre les archivistes et les informaticiens. L’adoption des formats ouverts est pour elle, un moyen de garantir la pérennité des documents et finalement, l’utilisation de la cryptographie permet à ses yeux de garantir l’intégrité des archives. C’est ce passage à un mode d’archivage dynamique qui force l’action des archivistes dès le début de la création de l’information.

Un autre élément milite en faveur de cette évaluation avant la création. En effet, avec les volumes d’information produits, le tri se complexifie, en plus d’être plus coûteux. Les systèmes de GED actuels ne permettent pas le raffinement nécessaire à l’évaluation dans un but patrimonial. Françoise BanatBerger en conclut donc que :

D’une manière pragmatique, on négociera alors des modalités de tris beaucoup plus simples à mettre en place, en reportant sur le système d’archivage électronique la mise au point ultérieure de tels traitements. (Banat-Berger 2010, 77)

Nous pouvons en comprendre qu’elle privilégie une vision plus large de l’évaluation, avant d’avoir les moyens de faire un tri plus fin. On peut y voir le développement d’un calendrier de conservation plus « inclusif », moins restrictif dans ce qui sera conservé, en attendant la conception de nouveaux outils permettant ce tri raffiné. D’autres initiatives ont été tentées afin d’arriver à une évaluation préalable. Le groupe de travail australien, dont nous avons parlé plus tôt, s’est efforcé de développer un schéma de métadonnées pouvant soutenir cette vision.

L’initiative australienne, le Recordkeeping Metadata Schema (RKMS)

À l’aube des années 2000, un groupe d’archivistes australiens ont conçu un plan de gestion documentaire qui mettait en avant-plan les métadonnées comme moyen de décrire les archives dans leur contexte. Nous verrons plus loin les utilités et limites des métadonnées comme façon de préserver le contexte, mais il est intéressant ici de se pencher sur ce qui les a amenés à favoriser à développer cette approche. Elle se base sur le modèle du continuum des documents, développé par Frank Upward (1996). L’objectif était de mettre en place un cadre favorisant l’établissement de standards quant à la création de schémas de métadonnées adaptés à la conservation des archives provenant de divers secteurs d’activités. Cette initiative provenait du constat que peu de contrôle était effectué dans la conservation des documents numériques et qu’il était nécessaire de permettre l’accès des individus ainsi que des institutions à des documents authentiques et fiables.

Pour ces chercheurs, il était donc indispensable de laisser des traces du contexte qui soient transmises de façon explicite et permanente. Sue McKemmish et ses co-auteurs écrivent :

As long as records remain in the local domain in which they are created, a lot of broader contextual metadata is “in the air”, carried in the minds of the corporate users of the records. When records move beyond the boundaries of the local domain in which they were created or, […], they are created in the first place in a global rather than a local domain, then this kind of metadata needs to be made explicit – that is, captured and persistently linked to the record. (McKemmish et al. 2014, 7)

Ils ont donc développé un modèle plus large et précis de schéma de métadonnées qui permet d’identifier, de catégoriser et d’étiqueter les documents à travers le temps et l’espace. Pour eux, la documentation des associations permet de conserver le contexte et même, a un certain point, construit ce contexte (McKemmish et al. 2014, 23). Il s’agit par l’utilisation de ces liens de construire un « cocon de sens » autour du document (McKemmish et al. 2014, 9, notre trad.). On peut rapprocher cette façon de voir les choses de la définition de « dossier » par Louise Gagnon-Arguin et Sabine Mas qui stipule qu’ « il constitue en lui-même une unité d’information définie par le lien unissant les documents qu’il contient » (Gagnon-Arguin et Mas 2011, 5). De plus, pour ces deux auteures, qui citent Marie-Anne Chabin à cet effet, un des objectifs du dossier est de fournir une trace de l’activité documentée et la connaissance du sujet concerné (GagnonArguin et Mas 2011, 11). C’est l’ensemble, le « cocon », qui porte le sens.

Dans le but de refléter l’évaluation faite lors de la création, les chercheurs australiens ont inclus dans leurs métadonnées enrichies, la possibilité d’inclure le calendrier de conservation en tant qu’attribut du document par une étiquette « évaluation » (McKemmish et al. 2014, 17). De plus, leur modèle mettant l’accent sur les relations entre créateur, document et activité, il répond au besoin identifié de conservation du contexte par la préservation des liens.

Nous pouvons constater que chez la majorité des auteurs recensés, les solutions peuvent se mettre en place avec de grands efforts, mais de façon assez organisée au niveau des institutions ou des structures gouvernementales. L’intervention hâtive des archivistes dans le cas d’archives privées, de petites organisations ou d’individus, est peu réaliste par ces moyens et l’évaluation de ces archives en format numérique s’annonce d’autant plus ardue. Néanmoins toute la littérature produite à ce sujet amène certainement des points de vue intéressants. Dans la section qui suit, nous tenterons de résumer les différents éléments à garder en tête lors de l’évaluation afin de conserver des archives les plus « parlantes » possible.

Outils, constats et défis

L’utilité des métadonnées

Dans le cadre de l’initiative australienne, les métadonnées ont été définies comme étant toute information qui identifie, authentifie, décrit et gère les documents créés dans le cadre d’une activité (McKemmish et al. 2014, 7). Elles incluent les métadonnées générées automatiquement par les systèmes d’opération, mais aussi celles qui peuvent être saisies dans le traitement documentaire. Dans la définition donnée par la National Information Standards Organization, on définit trois principaux types de métadonnées : descriptives (telles que titre, auteur, mots-clés, etc.), structurelles (qui nous renseignent sur comment les composantes sont mises en ordre) et administratives (date, format, données de préservation, etc.) (NISO 2004, 1). Elles permettent d’identifier, retrouver et organiser les ressources et rendent possibles l’interopérabilité et l’archivage. Pour cette organisation, les métadonnées sont la clé de la préservation et de l’accessibilité future des ressources. En effet:

Archiving and preservation require special element to track the lineage of a digital object (where it came from and how it has changed over time), to detail its physical characteristics, and to document its behavior in order to emulate it on future technologies. (NISO 2004, 2)

Dans le projet mené en Australie, les travaux ont dégagé que les métadonnées devaient remplir les exigences suivantes afin de répondre aux objectifs de l’initiative : identifier les ressources de façon unique, assurer leur authenticité, déterminer l’information de préservation, contenir les dispositions d’accès et d’utilisation, documenter la conservation de la ressource et permettre l’interopérabilité. Encore une fois, on voit les mêmes préoccupations qui se répètent afin d’assurer la pérennité des documents numériques.

Dans cette optique, il est possible de considérer l’exhaustivité des métadonnées d’un document numérique comme un facteur favorisant la conservation de celui-ci en plus des critères d’évaluation habituels. L’ensemble de la documentation amené par les métadonnées participera certainement à la lecture du contexte et sa complétude a une valeur certaine. Les documents et systèmes de gestion qui exigent des métadonnées obligatoires peuvent ainsi devenir un outil afin d’augmenter la représentativité des archives conservées.

Par contre, ce point de vue n’est pas celui de tous les auteurs. Aux yeux de Luciana Duranti, l’authenticité, impérative à conserver au-dessus de tout, est assurée par trois facteurs, la transparence, la sécurité et la stabilité. La transparence vient de la conservation des documents par une institution externe au producteur afin de garantir « l’immuabilité » à partir d’un certain point. La sécurité est, de son côté, difficilement atteignable en contexte numérique puisque la migration de support conservera les données, mais pas l’authenticité. Au sujet des métadonnées, elle affirme qu’elles ne sont pas suffisantes afin d’assurer la stabilité, puisque cette dernière implique que le contexte de création et les relations du document restent intacts et que les métadonnées ne contenant pas le contexte « historique » sont incapables de répondre à ce besoin (Duranti 1995, 251–252). Il est par contre difficile de déterminer ce qu’elle sous-entend par « contexte historique » en opposition à contexte de création. Même les documents sur support papier ne sont pas toujours accompagnés de leur petit carton expliquant le « contexte historique » et il est tout à fait possible avec les technologies actuelles d’ajouter des champs intégrés au document qui consignent les métadonnées de tous les types mentionnés par la NISO, tout comme l’initiative australienne nous en donne la preuve. Le défi est de s’assurer qu’elles ont le potentiel de suivre le contenu du document lors d’éventuel changement de support.

D’ailleurs à ce sujet, Ciaran B. Trace, dans son article « Beyond the Magic to the Mechanism : Computer, Materiality and, What it means for Records to be “Born Digital” », fait la liste des endroits où peuvent se « cacher » les différentes métadonnées. Car en plus du document, il ne faut pas oublier que celles reliées à l’ordinateur lui-même ou encore à son utilisateur ainsi que celles contenues dans les fichiers peuvent posséder leur pertinence (Trace 2011, 24). Conserver ces informations en relation avec les documents peut s’avérer compliqué, surtout qu’être archiviste ne signifiait pas jusqu’à maintenant devoir comprendre en détail la structure et l’architecture des outils informatiques. Pour Ciaran B. Trace, cette compréhension est désormais incontournable, d’autant plus que le nouveau médium d’écriture que représente l’ordinateur peut, comme l’écrivait Matthew G. Kirschenbaum qu’elle cite, donner une impression d’éternité (Trace 2011, 25-26).

Francis X. Blouin, pour sa part, semble laisser entendre que la préservation du contexte se fait de façon naturelle maintenant que les archivistes travaillent de plus en plus en amont de la chaîne de production documentaire et que les documents sont perçus en tant que résultats d’une activité. Pour lui : « il n’est plus besoin de s’inquiéter des éventuelles différences de lectures d’un même document ou de ses divers classements » (Blouin 2006, 5). Il est conscient des avantages que constitue l’utilisation des métadonnées comme outil normalisé afin de faciliter les échanges et de réunir les fonds. Mais il semble craindre qu’elles amènent une forme de rigidité et que des glissements conceptuels du type de ceux vus dans les vedettes-matière se produisent. Ce dernier point concerne probablement plus la description et la diffusion que l’évaluation proprement dite, mais fait partie des avantages liés à l’utilisation des métadonnées.

Un autre de ces avantages est que maintenant, les métadonnées peuvent porter les traces des changements effectués sur les documents. Comme le rappelle David Bearrman, l’évaluation a toujours nécessité une bonne connaissance de l’organisation et de ses fonctions (Bearman 2011, 241). Dans ce texte, il souligne aussi que la mise en page annonce le contenu et est donc dans ce cas, porteuse de sens. Cette mise en forme, dans le cas du numérique, rappelons-le, n’est toutefois pas permanente. Roger T. Pédauque écrit à ce sujet que :

Un document n’aurait de forme à proprement parler qu’à deux moments : celui de sa conception par son auteur qui devra le visualiser ou l’entendre, pour s’assurer qu’il correspond à ses choix (et encore ce n’est pas obligatoire si sa production relève du processus) et celui de sa re-construction [sic] par le lecteur. (Pédauque 2003, 9)

Il faut donc s’efforcer de la préserver et elle s’exprime souvent par les métadonnées. Pour David Bearman, l’adéquation entre la présence de métadonnées renseignant sur la structure « visuelle » du document et ses relations et la connaissance de l’organisation, comme on l’a toujours reconnu dans la pratique de l’évaluation, permet à l’archiviste de déterminer la valeur du document, facilite le travail de l’archiviste (Bearman 2011, 255).

Elizabeth Yakel établit un autre parallèle entre la façon, disons traditionnelle, de faire de l’archivistique et les changements amenés par le numérique dans lequel les métadonnées permettent des fonctionnalités intéressantes. Elle aborde le fait de conserver l’ordre originel, le principe de respect du fonds, afin de conserver le contexte (Yakel 2011, 260). Dans les archives sur des supports ne nécessitant pas de médiation, le contexte est établi par la description du fonds, principalement l’histoire administrative, la biographie et la portée du fonds. S’y ajoute la localisation des documents ou du fonds par rapport aux autres, c’est-à-dire les « relations immuables » évoquées par Luciana Duranti (1995, 244). Dans le cadre numérique, ce contexte s’exprime plutôt par la biais des citations réciproques, des hyperliens, des relations entre sources primaires et secondaires et par la présence de métadonnées (Yakel 2011, 261). La construction de liens ou d’hyperliens entre dossiers et documents participe aussi de la construction du contexte et ces liens peuvent être intégrés dans les métadonnées. Dans ce cas, l’utilisation de langage XML, comme l’a suggéré le groupe de recherche australien, est tout à fait appropriée (McKemmish et al. 2014, 25).

Le nouveau rôle de l’archiviste

Nous avons évoqué à plusieurs reprises le transfert du moment de l’évaluation vers la création du document. Dans un monde numérique idéal, l’évaluation est déterminée à la création afin d’éviter le fameux « vrac » inintelligible appréhendé par Françoise Banat-Berger. Dans le cas des institutions, cette approche est tout à fait réaliste et réalisable, et elle se met en place dans certaines institutions par le biais du records management et par l’établissement  de calendrier de conservation. Dans ce cas, les pratiques se modulent et évoluent. Comme le souhaite Elizabeth Yakel (2011, 257), le développement de stratégies de documentation en collaboration avec les institutions créatrices, n’est pas qu’une idée farfelue.

Il reste toujours à voir comment seront conservées les « autres » archives, issues de créateurs moins « structurés ». Justement, à ce sujet, Elizabeth Yakel amène le concept de « shared authority and distributed curation » (Yakel 2011, 259). Elle entend aussi donner plus de responsabilités à ce qu’elle nomme les « communautés » dans la conservation de leurs archives et fait passer l’archiviste d’un rôle de médiateur-descripteur, à un rôle de collaborateur. Cela s’inscrit tout à fait dans la veine du web 2.0 et change sensiblement la façon de concevoir l’archivistique. De son point de vue, ce partage de responsabilité amènera une plus grande transparence dans l’évaluation et enrichira grandement le contexte (Yakel 2011, 269). Aux archivistes qui auraient l’impression d’une perte de contrôle, ou encore d’autorité, dans le cadre de telles pratiques, elle répond plus loin:

Borrowing from economic theory, I pose that authority might be a non-rivalrous good. What it means is that consumption or use by one person does not stop others from using the same good. […] Authority (in our case authority surrounding archival collections) may be like air: archivists, researchers, communities all have and can use it – for better or worse, correct or not, leaving it up to judge its merits. (Yakel 2011, 269)

On ne peut s’empêcher de penser que cette approche permet à un niveau très global, de s’assurer que l’évaluation se fait en concordance des valeurs contemporaines de la création des documents, comme le souhaitait Hans Boom en 1972.

Françoise Banat-Berger est moins avant-gardiste dans sa vision du nouveau rôle de l’archiviste, même si elle s’inscrit dans la même direction. Elle voit un nouveau positionnement de la part des archivistes, plus engagés et en interaction, afin de devenir « créateurs de valeur » (Banat-Berger 2010, 78). Ce positionnement plus central dans la chaîne documentaire, confère un rôle social à l’archiviste en plus de son rôle patrimonial traditionnel. Pour elle, l’intervention dès la fermeture des dossiers (amenant la prolifération de fonds ouverts), permettrait aux archivistes de devenir gardiens des « preuves ». Cela implique, bien sûr une entente entre les producteurs et les services d’archives, en plus de demander à ces derniers d’être les responsables des droits d’accès. Le changement de rôle à ses yeux se concentre beaucoup sur la conservation et la diffusion et outre le fait de se positionner en amont, l’impact de l’arrivée du numérique n’a que peu d’impact sur les critères d’évaluation eux-mêmes.

Francis X. Blouin à quant à lui considérer l’évaluation d’un angle encore plus général, et ce, peu importe le support et les technologies. Il souligne qu’il ne faut pas tenter de chercher un sens intrinsèquement historique lors de l’évaluation. Il est en faveur de l’adoption de stratégies de documentation claires afin de constituer des archives représentatives de la société (Blouin 2006, 4). Il croit que cela permet aux historiens de relativiser leurs sources, malgré le fait que les archives se détachent des impératifs historiographiques. Il écrit :

On pourrait cependant objecter que leur constitution repose tout de même sur l’acceptation d’un certain nombre de normes culturelles ou politiques dont l’archiviste n’a d’ailleurs pas nécessairement conscience. Elles existent en effet, de manière implicite, en particulier dans le cas de la constitution d’archives nationales. Ainsi sélectionnées, organisées et présentées, les archives, bien que désormais indépendantes de cadres historiographiques, peuvent contribuer implicitement au renforcement de certaines constructions culturelles ou politiques qui, en exerçant une influence sur le contenu des documents conservés, modèlent aussi le processus selon lequel nous pouvons ensuite les connaître et les penser. (Blouin 2006, 6)

Il rejoint en cela les propos de Joseph Morsel qui, nous l’avons vu, invite les historiens à prendre conscience que leurs sources ont été sélectionnées par des gens de différentes époques. Est-ce à dire que peu importe les moyens employés, il subsistera toujours une part de subjectivité dans l’évaluation des archives? C’est très possible, d’où l’importance de documenter le processus d’évaluation afin de fournir la lorgnette, on l’imagine, à partir de laquelle « lire » les archives. Ces informations alimenteront bien sûr le contexte, en tant que contexte de préservation et elles sont encore plus pertinentes dans le cadre des archives numériques qui peuvent donner une impression, insistons sur le mot, d’immatérialité et de transparence.

Technologies, formation et nouvelles compétences

Un dernier aspect, moins directement lié à l’évaluation, mais néanmoins incontournable est à considérer dans l’émergence des archives numériques. Il s’agit du rôle technologique qu’a à jouer l’archiviste. Comme le mentionne Ciaran B. Trace, peu de littérature s’est attardée jusqu’à maintenant sur le sujet. Par contre, puisque la grande majorité des documents qui seront traités dans un futur proche auront été créés sous forme numérique, l’acquisition de compétences dans ce domaine par les archivistes est indispensable. Il s’agit d’une part d’acquérir la compréhension des documents numériques en tant qu’objets physiques, conceptuels et logiques ainsi que la compréhension des outils et processus en jeu. Il faut être en mesure d’évaluer les différents degrés d’abstraction pour arriver à les préserver (Trace 2011, 8). Comme elle l’écrit plus loin, afin de rencontrer les nouveaux défis, il faut en comprendre le fonctionnement physique et logique (Trace 2011, 25).

Sans se substituer aux informaticiens, les archivistes doivent être en mesure de transmettre cette compréhension. Elle permet une meilleure gestion des documents, mais en plus, elle peut faciliter l’évaluation que ce soit par l’utilisation de schémas de métadonnées ou par l’utilisation de feuilles de styles qui permettent de « typer » les documents. Tout cela bien sûr, dans la crainte de l’amoncellement de copies, de versions, dans lequel il est difficile de faire le tri. La formation des utilisateurs-créateurs est donc à ajouter à la liste des nouvelles tâches des archivistes. Il ne faut pas oublier aussi la formation des utilisateurs que sont les historiens qui devront apprendre à retracer l’information dans la masse à l’aide d’outils statistiques ou lexicologiques (Banat-Berger 2010, 79).

Sommes-nous vraiment aux abords d’une révolution du domaine archivistique comparable à celle de l’émergence de la tradition écrite ? Nous le verrons bien. Mais de toute façon, le contexte numérique amènera le besoin de développer de nouvelles compétences. Historiens et archivistes devront maîtriser les nouveaux outils leur permettant d’exploiter, chacun à leur façon, leur matière première, qu’est l’information.

Conclusion

Nous pouvons le constater, avec l’arrivée du numérique, l’histoire et l’archivistique vivent des mutations et sont possiblement des disciplines moins proches et moins complémentaires qu’elles ne l’étaient. Auparavant, les sources étaient authentifiées par leur conservation, sans altération, dans le même lieu et donc le potentiel de pérennité et une partie de l’évaluation était très liés au support. Aujourd’hui, on passe du traitement des documents au traitement des ressources et ces ressources se retrouvent dispersées et moins statiques qu’elles ne l’étaient. L’archivistique se préoccupe maintenant de la vie entière du document, et cela même s’il n’est pas destiné à une conservation dite historique.

Les travaux jusqu’à maintenant se sont beaucoup penchés sur les archives institutionnelles et les réflexions faites et les outils proposés offrent des avenues intéressantes. L’utilisation d’outils plus traditionnels, comme le calendrier de conservation est plus que jamais pertinent, mais de nouveaux moyens d’assurer la conservation du contexte sont à l’horizon. Les métadonnées n’ont toujours pas atteint leur plein potentiel à cet effet.

Nous avons vu aussi la transition de l’intervention de l’archiviste sur le plan de l’évaluation. Dans de nombreux cas, l’évaluation se situe de plus en plus tôt dans la vie du document et son « destin » est pratiquement déterminé avant même sa création. Le rôle de l’archiviste en est inévitablement modifié. Les archivistes devront poursuivre et intensifier leur implication dans le développement de normes et de standards de préservation, ainsi que dans le monitorage de leur implantation. Nous entrons de plus en plus dans une ère de collaboration et d’interaction et nous pouvons supposer que l’archiviste se positionnera de plus en plus en tant que formateur, tant auprès de l’usager que, dans le cas de l’évaluation, du créateur. Il reste encore à déterminer comment ce rôle s’exercera auprès d’individus ou de plus petites institutions disposant de moins de moyens.

De façon plus terre à terre, on peut retenir des différents points de vue des auteurs ici recensés, trois aspects à considérer particulièrement dans l’évaluation des documents numériques dans une perspective patrimoniale. La stratégie de documentation, évoquée par plusieurs auteurs, claire et documentée est un premier moyen d’arriver à cette fin. Outre cela, il est nécessaire de s’assurer que les métadonnées évoquées plus haut, soient en mesure de « suivre » les documents évalués et qu’elles soient les plus exhaustives possible afin de rendre compte du contexte. Finalement, il faut tenir compte de la stabilité du support et de la pérennité potentielle du format employé, dans l’optique de limiter coûts et manipulations. Tous ces moyens facilitent et encouragent la construction de fonds d’archives les plus représentatifs de notre société.

En fin de compte, il ne faut pas oublier notre incapacité à déterminer ce qui sera utilisé ou non par les historiens du futur. Ils feront eux-mêmes leurs recherches à partir des valeurs et priorités de leurs propres sociétés. Il reste à faire l’évaluation des archives de la façon la plus honnête et transparente possible afin de mettre à leur disposition un éventail de possibilités, sans tenter d’orienter leur lecture. Une autre chose reste par contre à espérer. C’est que la relation avec un document numérique devienne aussi organique qu’avec un document sans médiation. Certains historiens ne prêchent que par le culte de la source originale et la matérialité qui l’accompagne, ce qui est peut-être moins concevable dans un monde où il est possible de créer de multiples copies à l’aide de quelques clics de souris et où le document semble se dématérialiser. Nous ne sommes toujours pas tout à fait certains de l’impact qu’aura cette mutation sur l’acte de lecture et sur l’interprétation. Le changement de perception quant à l’idéal d’original n’est peut-être pas encore accompli aujourd’hui, mais rappelons-nous qu’après plus de mille ans d’utilisation du modèle « support-inscription », nous venons tout juste de passer à un nouveau modèle de « données-structure lisibles par médiation d’une machine ».

***

Ce billet est tiré d’un travail étudiant réalisé à l’EBSI, Université de Montréal, dans le cadre du cours SCI6112 – Évaluation des archives  – donné au trimestre d’hiver 2014 par Yvon Lemay.

Pour en savoir plus:

Banat-Berger, Françoise. 2010. Les archives et la révolution numérique. Le Débat, no 158 (1): 70–82. <http://www.cairn.info/revue-le-debat-2010-1-page70.htm&gt; (consultée le 5 mars 2014).

Banat-Berger, Françoise, Laurent Duplouy et Claude Huc. 2009. L’archivage numérique   long terme les débuts de la maturité   Paris  la Documentation française.

Bearman, David. 2011. Structural Formalism in Documentation: Reflecting Function and Supporting Meaning. In Controlling the Past: Documenting Society and Institutions, 241–56. Chicago: Society of American Archivists.

Blouin, Francis X. 2006. Deux sphères conceptuelles distinctes   le classement des archives et la recherche historique. Matériaux pour l’histoire de notre temps, no 82 (2): 96–99.

Booms, Hans. 2002. Ordre social et constitution du patrimoine archivistique   à propos de l’évaluation des sources d’archives. Traduit par Barbara RothLochner. Archives 33 (3–4): 7-44. <http://www.archivistes.qc.ca/revuearchives/vol33_3-4/33-3-4booms.pdf&gt; (consultée le 5 mars 2014)

Chabin, Marie-Anne. 2004. Document trace et document source. La technologie numérique change-t-elle la notion de document? InformationInteraction-Intelligence 4 (1): 141–57.

De Boisdeffre, Martine. 2010. Les archives à l’ère numérique. Le Débat, no 158 (1): 61–69. <http://www.cairn.info/revue-le-debat-2010-1-page-61.htm&gt; (consultée le 5 mars 2014).

Debray, Régis. 1999. Trace, forme ou message? Cahiers de Médiologie, no 7: 27–44.

Domenget, Jean-Claude. 2013. La fragilité des usages numériques. Les Cahiers du numérique 9 (2): 47–75.

Doom, Vincent. 2006. L’évaluation scientifique des archives  Principes et stratégies. La Gazette Des Archives, no 202: 5–27.

Duranti, Luciana. 1995. Archives as a Place. In Paper Presented at a Half-Day Seminar in Sydney. <http://inls525fall2011.web.unc.edu/files/2011/09/LucianaDuranti.pdf&gt; (consultée le 5 mars 2014).

Gagnon-Arguin, Louise et Sabine Mas. 2011.  Typologie des dossiers des organisations   : analyse intégrée dans un contexte analogique et numérique..  Québec  Presses de l’Université du  Québec.

Heimburger, Franziska et Émilien Ruiz. 2012. Faire de l’histoire à l’ère numérique   retours d’expériences. Revue d’histoire moderne et contemporaine, no 58-4bis (5): 70–89.

Katz, Richard N. et Paul B. Gandel. 2011. The Tower, the Cloud, and Posterity: Documenting in a Digital World. In Controlling the Past: Documenting Society and Institutions, 217–40. Chicago: Society of American Archivists.

McKemmish, Sue, Glenda Acland, Nigel Ward et Barbara Reed. 2014. Describing Records in Context in the Continuum: The Australian Recordkeeping Metadata Schema. <http://www.infotech.monash.edu.au/research/groups/rcrg/publications/ archiv01.html> (consultée le 5 mars 2014).

Morsel, Joseph. 2003. Les sources sont-elles « le pain de l’historien » ? Hypothèses, no 1 (Mars): 271–86.

NISO. 2004. Understanding Metadata. <http://www.niso.org/publications/press/UnderstandingMetadata.pdf&gt; (consultée le 5 mars 2014).

Noiret, Serge. 2011. La Digital Histor    histoire et mémoire à la portée de tous. <http://cadmus.eui.eu/handle/1814/17576&gt; (consultée le 5 mars 2014).

Pédauque, Roger T. 2003. Document   forme, signe et médium, Les reformulations du numérique. <http://archivesic.ccsd.cnrs.fr/sic_00000511&gt; (consultée le 5 mars 2014).

Trace, Ciaran B. 2011. Beyond the Magic to the Mechanism: Computers, Materiality, and What It Means for Records to Be « Born Digital ». Archivaria, no 72: 5–27.

Upward, Frank. 1996. Structuring the Records Continuum – Part One: Postcustodial Principles and Properties. First published in Archives and Manuscripts 24, no. 2: 268-285. <http://www.infotech.monash.edu.au/research/groups/rcrg/publications/r ecordscontinuum-fupp1.html> (consultée le 5 mars 2014).

Yakel, Elizabeth. 2011. Who Represents the Past? Archives, Records, and the Social Web. In Controlling the Past: Documenting Society and Institutions, 257–78. Chicago: Society of American Archivists.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s