Recherche scientifique et théorie

Faire cohabiter préservation numérique et durabilité: entretien avec Mathieu-Alex Haché

Par Jonathan David, responsable du blogue Convergence

Écologique, le numérique? Depuis déjà plusieurs années, de nombreuses voix se font entendre pour réclamer le fameux « bureau sans papier » au nom du développement durable. Depuis le début de cette interminable pandémie mondiale, les flux massifs et en continu de données issues des vidéos de nos réunions sur Zoom ou Teams ont remplacé nos déplacements physiques et la pollution qui venait avec. Est-ce dire que notre bilan écologique s’est amélioré?

On produit, on stocke et on consomme de plus en plus de données numériques. Les objets connectés accumulent de plus en plus de « traces » quant à leur état ou leur utilisation en temps réel. La résolution et le poids des contenus médiatiques que nous consommons et partageons augmentent sans cesse afin de répondre à des standards toujours plus haut. Et que dire de la durée de vie « utile » de notre équipement informatique et de son obsolescence programmée? D’un point de vue environnemental, l’information coute cher.

Faire cohabiter la préservation numérique et le développement durable n’est pas une mince affaire. Le calcul est facile : plus on conserve, plus on diffuse, plus on consomme de ressources.

L’archiviste, en tant que gardien du savoir et médiateur culturel, a certainement un rôle à jouer pour assurer cette cohabitation. Je pense notamment aux processus d’épuration et de destruction qui suit un calendrier qui a préalablement été réfléchi et qui s’appuie sur des critères de nécessité.

Pour en savoir davantage sur ce sujet passionnant, je m’entretiens avec Mathieu-Alex Haché, étudiant à la maîtrise en sciences de l’information à l’école de bibliothéconomie et des sciences de l’information (EBSI).

***

J.D. – D’abord merci d’avoir accepté de venir partager avec nous les résultats de votre recherche « Faire cohabiter préservation numérique et durabilité : un défi paradoxal à relever ». La première question qui vient fréquemment à l’esprit lorsqu’on discute gestion documentaire et durabilité, c’est la fameuse comparaison gestion numérique / gestion papier. De votre point de vue, est-ce que le bilan environnemental d’une gestion de l’information numérique est mieux ou pire qu’une gestion papier? En prenant compte la facilité de création et de duplication en mode numérique, est-ce qu’on crée trop de documents et est-ce qu’on en partage trop, à trop de gens, en trop de copies, inutilement?

M-A.H. –Cette fameuse comparaison se trouve en effet sur toutes les lèvres lorsque vient le moment d’aborder le sujet de la gestion documentaire et de la durabilité. En comparaison à des supports analogiques comme le papier ou même le microfilm qui sont recyclables et peu consommateurs, les technologiesau service de la pérennisation de notre patrimoine documentaire numérique ontun impact environnemental loin d’êtrenégligeable. Quant à l’énergie nécessaire pour faire fonctionner l’infrastructure qui sous-tend les transferts, versements, flux d’archivage et l’accès aux documents numériques, là aussi les chiffres donnent le vertige. Prenons l’exemple de l’édition de 1597 du traité théologique La institución de la religióncristiana de Jean Calvin. La taille de sa copie de conservation, consultable en ligne via Internet Archive (images individuelles en format JPEG2000), culmine environ 1 Go. Si le maintien de 1 Go de contenu numérique dans un stockage en ligne coûte entre 0,2 et 7 kWh, disons 3,5 kWh/Go, et un kWh peut être transmis sur le réseau électrique américain[1] à un bilan carbone de 2,25 kg, cette version à elle seule équivaut à l’émission de 7,87 kg de CO2 par année.

Qu’en est-il de l’empreinte carbone générée par le contrôle du climat des surfaces d’entreposage pour la conservation des archives en format papier ? Des calculs démontrent qu’en Pennsylvanie[2], une institution d’archives émet annuellement 3,68 kg de CO2, et ce par pied carré. Imaginons une institution dont l’espace physique de conservation des archives papier totalise 10 000 pieds carrés. Cela se traduit par 36 800 kg de CO2 par année. Pour mettre ces chiffres en perspective, un conducteur américain moyen émet 4600 kg de CO2 chaque année. L’occupation de cette surface d’entreposage équivaut donc à l’émission de carbone d’environ huit voitures.

Nous le savons désormais, les données que nous créons et transmettons quotidiennement contribuent largement à la dégradation de notre écosystème. La facilité avec laquelle nous pouvons préserver l’ensemble de ces copies ne doit pas cependant pas nous dissuader d’exercer une « évaluation sélective et critique ».Bien plus encore, la déduplication des fichiers devrait faire partie du processus d’évaluation.

J.D. –Le premier constat de votre recherche est le suivant : la société doit changer de paradigme dans la façon d’envisager la satisfaction de ses besoins en matière de consommation d’information numérique. Quels sont les principaux enjeux qui selon vous rendent nécessaire ce changement de paradigme?

M-A.H. –Dans le cadre de mon travail de recherche, nourri par les idées du récent article de Pendergrass et al. (2019)[3], j’ai abordé la convergence entre préservation numérique et durabilité à travers le prisme de John R. Ehrenfeld. Dans un contexte d’écologie industrielle, Ehrenfeld soutenait que l’augmentation de l’efficacité du consumérisme ne fait que réduire la non-durabilité plutôt que construire la durabilité, et on qualifie de durables les améliorations de produits et de procédés qui restent dommageables pour l’environnement, tout en n’éliminant pas le problème. Dans la même veine, je pense que le recours à la technologie afin de minimiser les répercussions environnementales engendrées par la préservation numérique (ex. : éviter de transférer de grandes quantités de données sur le réseau pendant la journée puisque la planification de ces tâches dans l’optique qu’elles s’exécutent la nuit permet de tirer parti des périodes où la demande d’électricité et de bande passante est faible), bien que nécessaire à titre de mesure provisoire, ne fait que réduire la non-durabilité. Afin de construire une préservation numérique écologiquement durable à grande échelle, la communauté archivistique se doit d’entamer un changement de paradigme dans la façon dont elle conçoit les pratiques relatives à la pérennisation des archives électroniques. En l’occurrence, cela ne présuppose pas que les archivistes prennent part à une rébellion et rejettent radicalement les fondements théoriques et les pratiques traditionnelles de la discipline.

Les enjeux qui rendent nécessaire cetteréorientation proviennentdu fait que les institutions d’archives préconisent une approche rigidement centrée sur le management. Les archivistes mesurent et chiffrent ce qu’ils préservent et s’engagent dans une quête pour bonifier ces statistiques : plus de contenu, meilleure gestion, plus d’utilisation. Par conséquent, les cadresnormatifs et les standards qui furent développés pour encadrer la préservation des documents numériques reflètent cet angle d’approche et convergent vers un point commun, c’est-à-dire qu’ils s’avèrent intensifs en puissance de calcul et contribuent à accroître la consommation énergétique des programmes de préservation numérique des institutions.

J.D. –Si on se penche plus précisément sur le travail des archivistes, quels rôles doit-on leur attribuer en cette ère où l’abondance numérique cause de réels enjeux environnementaux? Doivent-ils envisager un grand réaménagement disciplinaire? Je pense entre autres à la numérisation de masse et à l’accès instantané à leurs collections en tous lieux et en tout temps?

M-A.H. –Je pense qu’il est primordial que les archivistes s’approprient la problématique du dérèglement climatique. La communauté archivistique aurait tort de croire qu’en raison du fait que les impacts environnementaux engendrés par la préservation numérique lui sont pour ainsi dire invisibles, il ne lui incombe pas d’adapter en conséquence les balises qui délimitent la pratique professionnelle. Qui plus est, les archivistes ne devraient pas laisser l’imperceptibilité de leurs impacts environnementaux consolider le statu quo. Tous les archivistes peuvent s’emparer de ce sujet et il existe plusieurs moyens pour verdir un peu le flux de travail de la préservation numérique (allant de l’ingestion des données au sein du dépôt numérique fiable jusqu’à l’accès) : faire un bilan carbone, tenter de quantifier la consommation énergétique des activités périodiques liées à la préservation numérique,privilégier le réemploi ou recyclage du matériel électronique existant, incorporer une « conscience environnementale » dans le processus de prise de décision quant aux solutions de stockageen local, procéder à une enquête préalable afin d’identifierles sources d’énergie sur lesquelles s’appuient les fournisseurs infonuagiques externes envisagés, songer à la mutualisation de l’infrastructure technologique avec des institutions de même nature, et enfin, le choix et l’achat de solutions logicielles ne devrait plus se faire sous le seul prisme des bénéfices financiers attendus, mais aussi en fonction de leur consommation énergétique supposée et de leur empreinte environnementale. Il faut également se rendre à l’évidence que la perfection n’est pas toujours un objectif réaliste. Bien que les archivistes souhaitent préserver au mieux le patrimoine numérique, il n’est pas toujours nécessaire de chercher à atteindre les « meilleures pratiques ». Il y a parfois une présomption selon laquelle tout le monde devrait viser le sommet, mais ce n’est certes pas le cas. Suivre aveuglément un modèle ou une norme de certification et supposer que l’on doit toujours obtenir les meilleurs scores pour tousles critères énoncés n’est pas une avenue écologiquement durable.

En effet, je pense que la problématique du dérèglement climatique exige un changement de paradigme quant aux pratiques de la préservation numérique. Là encore, les plus réticents se demanderont pourquoi bousculer, voire révolutionner bon nombre de conceptions considérées comme immuables et intangibles ? Dans les faits, en adaptant leurs pratiques, les archivistes ne limitent pas seulement l’empreinte carbone de leurs opérations quotidiennes, ils freinent également les effets du changement climatique sur leurs fonds et collections.

Pour construire la durabilité et non simplement réduire la non-durabilité, ce réaménagement disciplinaire doit forcément passer par un changement dans la façon dont les archivistes perçoivent la pérennisation de ce qui n’est plus une réalité matérielle physiquement circonscrite. Je pense ici à l’émergence de la notion de « perte acceptable ». Quelques archivistes américains avancent que la théorie archivistique doit s’acclimater, et ce en adoptant un certain degré acceptable de mutabilité et de perte dans les collections numériques. De prime abord, cette vision est susceptible d’en faire sourciller plusieurs puisque le terme « perte » recèle des connotations négatives dans le contexte de la préservation, mais peut-être que la perte peut être une stratégie durable si les archivistes tiennent compte du contexte environnemental de leur travail.En apparence, nous sommes bien loin d’une stabilité absolue en ce qui concerne les documents numériques. Leur nature intrinsèque les amène à être modifiés, transmis, copiés et restitués dans une pléthore de contextes. Je ne veux pas me faire l’avocat du diable et il importe d’apporter des nuances ici : divers éléments doivent être pris en considération, tels que l’unicité, la valeur historique et patrimoniale, l’éligibilité au titre de preuve sur requête judiciaire, les formats de fichiers, etc. Par exemple, quelles seraient les répercussions d’un « bit flip[4]» dans une série donnée ? Constituent-elles un risque tolérable ? Un « bit flip » dans un fichier JPEG compressé risque d’entraîner des effets dommageables plus prononcés au niveau de la visualisation et l’intelligibilité de son contenu comparativement à changement similaire dans un fichier TIFF non compressé. En somme, une analyse détaillée doit répondre si le jeu en vaut la chandelle.

En ce qui concerne la numérisation, la transparence est de mise. Le simple fait de justifier la numérisation en masse de collections ou fonds sera apprécié des puristes du développement durable.

Quant à l’accès instantané aux collections et fonds numériques, il s’avère parfois bénéfique de l’aborder sousun angle d’approche différent. Je pense qu’il est utile dans certaines situations de s’écarter d’un « instantdeliverymindset » (Pendergrass et al., 2019) au profit de stratégies d’accès à la demande. En principe, certains documents numériques très peu souvent consultés par les utilisateurs ne requièrent pas un accès en ligne instantané. Étant donné qu’un stockage en réseau consomme continuellement une grande quantité d’énergie, les documents qui font l’objet d’accès moindres et plus épisodiques pourraient plutôt être stockés hors-ligne, au moyen de bandes LTO par exemple.

J.D. –L’archiviste a toujours pensé qu’il avait le devoir social de collecter et de rendre disponible l’ensemble des documents acquis tout en respectant l’ordre et le contexte original. Ainsi, au nom de la recherche de l’authenticité, il conservera de multiples versions afin de témoigner, par exemple, du cheminement intellectuel de l’auteur d’origine. Il y a-t-il ici une incompatibilité entre le devoir de fidèle reconstitution et le devoir de durabilité? Doit-on resserrer nos critères d’évaluation afin de répondre aux enjeux environnementaux?

M-A.H. –Je pense que le devoir fidèle de reconstitution et le souci écologique peuvent faire bon ménage et cohabiter. Pour ce faire, il faudrait sans doute revoir l’orthodoxie de longue date en matière d’authenticité des archives. Tous s’entendent pour dire que pour être en mesure d’attester l’authenticité d’un document, il faut assurer le respect de son intégrité et conserver intacte la chaîne des opérations successives effectuées à son égard (traçabilité). À cet effet, la vérification périodique de la fixité des fichiers est un processus qui, par essence, est énergivore. Bien que la consommation énergétique relative à la génération et à la comparaison de sommes de contrôle varie en fonction de l’algorithme de hachage et du système de stockage utilisés, des pistes de réflexion se laissent entrevoir : la vérification doit-elle avoir lieu uniquement lorsque le contenu est déplacé ? Lorsque les fichiers sont migrés ? Peut-être qu’il s’avère suffisant de prescrire une vérification mensuelle d’un échantillon aléatoire de paquets d’information (AIP) ainsi qu’une vérification complète de la totalité des paquets à intervalle de trois ans, lors d’un audit du programme de préservation numérique. Moins nous vérifions l’intégrité des fichiers, plus nous sommes susceptibles d’être confrontés à la corruption, mais nous pourrions considérer cela comme un compromis décent afin de relever le défi de la durabilité à long terme.

Déjà en 1993, Hugh Taylor nous informaitque : « [t]he extent to which records have a bearing on the natural world should be one of the first considerations in archival appraisal » (Taylor, 1993, p. 208)[5]. Trois décennies plus tard, je crois fermement que ces propos sont toujours d’actualité. Tendre vers une préservation numérique décarbonée, c’est certes possible. Différents leviers d’actions sont à la disposition des archivistes, quitte à revoir le rapport entretenu avec les assises théoriques de la discipline. Quant à la fonction d’évaluation, je pense que pour juguler les effets de la pollution numérique atmosphérique, la profession gagnerait à inclure les « coûts écologiques » engendrés par le traitement curatif perpétuel nécessaire pour assurer l’intégrité, la pérennité et la sécurité des archives numériques au sein des critères d’évaluation traditionnellement admis. Les archivistes pourraient par exemple évaluer une potentielle acquisition d’archives nées numériques en tenant soigneusement compte de la consommation énergétique (refroidissement des serveurs, puissance de traitement des cycles CPU pour générer et valider les sommes de contrôle, etc.) indispensable à sa survie au sein de l’institution. Un autre facteur qui perturbe radicalement les fondements théoriques de la pratique archivistique tient au fait que les documents numériques ne requièrent pas tous le même « degré de soin » en termes de pérennisation. Par exemple, des documents nativement numériques peuvent se voir consacrer des efforts de préservation plus rigoureux que des copies numérisées de documents analogiques stables qui peuvent être numérisésà nouveau au besoin. Dès lors, de plus en plus d’institutions (je vous invite à consulter Rockefeller Archive Center[6]et NorthwesternUniversityLibraries[7]) penchent vers une approche à plusieurs niveaux dans le cadre de leur politique de préservation numérique. Dans cette optique, l’on ajoute une couche réflexive à l’évaluation archivistique qui consiste en l’attribution du niveau approprié de mesures de conservation à un ensemble donné de documents numériques.

J.D. –La question des formats de conservation est aussi un enjeu qui entre en conflit avec l’idée de réduire la consommation d’espace de stockage. On recommande habituellement aux archivistes de conserver la version d’origine, soit le format le plus lourd, et de la conserver dans son état d’origine, sans compression. À des fins de diffusion sur le web, il y a généralement création d’une copie moins lourde pour combler les besoins d’accès instantané. Mais le changement de technologie, notamment dans l’audiovisuel, fait en sorte que les résolutions, maintenant 4K, sont toujours plus gourmandes et la course pour obtenir une qualité d’image ultime semble infinie, au point où les techniques de maquillage doivent maintenant s’y adapter. Quelle-est votre vision par rapport à ces enjeux ?

M-A.H. –En effet, le rythme effréné de l’évolution technologique a fait naître une philosophie qui prône la conformité aux meilleures pratiques en matière de résolution et celle-ci s’est profondément enracinée dans l’éthos professionnel des archivistes. C’est particulièrement le cas pour les archives audiovisuelles. Citons que la numérisation d’une simple minute de contenu audiovisuel dans un format non compressé à une résolution de 2K se concrétise en un fichier d’une taille d’environ 26 gigaoctets. À une résolution de 4K, il en résulte un fichier de 100 gigaoctets[8]. La quête vers cet idéal préconstruit exacerbe les effets nocifs à l’endroit de l’environnement puisqu’elle débouche sur une utilisation plus intensive de l’infrastructure technologique. Ces constats nous amènent à nous questionner : chaque document doit-il être numérisé avec la meilleure résolution atteignable ? À ce sujet, une tendance se profile selon laquelle les institutions d’archives adoptent une approche dite en paliers, où les ressources sont allouées en fonction de la valeur et du caractère unique des documents numériques à préserver. Vus sous cet angle, les formats et la résolution des fichiers s’arriment avec l’envergure et la portée du projet duquel ils émanent, la valeur informationnelle et de recherche du contenu, les besoins d’accès des utilisateurs finaux, etc. Dans certains cas, je pense que nous devons éviter de nous efforcer à atteindre ces idéaux optimaux puisqu’ils multiplient proportionnellement l’impact du système d’archivage sur l’environnement. J’apprécieparticulièrementcette citation fort éloquente qui fait le pont avec lesconservateursd’archivesen format papier : « [They] don’t strive to keep everything in perfect condition forever, instead they strive to “manage the change”, accepting that the physical materials will alter over time and that they will do the best they can to mitigate, manage and document this » (Mitcham, 2020, paragr. 12)[9].

J.D. –Dans les entreprises et les organisations, la rapidité des changements technologiques nous force à nous adapter régulièrement et il n’est pas rare de voir la même information consignée dans plusieurs systèmes distincts, par exemple sur une solution collaborative et une solution de conservation. De plus, les bonnes pratiques en matière de sécurité de l’information préconisent de conserver plusieurs copies de sauvegarde. Comment ces organisations peuvent-elles améliorer leur bilan environnemental?

M-A.H. –Plus souvent que rarement, les fichiers à archiver proviennent effectivement de multiples sources comme les dossiers dans les GED, les systèmes de fichiers Windows, etc. Dès lors que la gestion du cycle de vie est maîtrisée de bout en bout, il devient plus facile d’alléger les ressources machines dédiées aux flux d’archivage. Soulignons que le versement des documents au sein d’un système de préservation numérique suppose des traitements de contrôle en entrée et ensuite à intervalle régulier dans l’objectif que, à la restitution, les documents soient réputés intègres et fiables. Il peut s’agir par exemple de la validation et de la normalisation des formats de fichiers avant leur ingestion. Pourtirer leur épingle du jeu, les organisations gagneront à se poser la question suivante : chaque contrôle et chaque métadonnée technique qui en découle sont-ils tous en cohérence avec le degré de risque associé au document à archiver et à conserver ? Cette approche, baptisée « juste traitement » sans superflu, constitue une façon d’inscrire l’archivage électronique dans la démarche du numérique responsable. Il s’agit toutefois d’une avenue délicate à arbitrer et à juger en fonction du risque avéré ou évalué, d’où l’importance de rester raisonnable dans ses évaluations et décisions. Loin de se résumer à des solutions taillées sur mesure, je pense que les réponses se doivent d’être colorées par le contexte organisationnel de chaque service d’archives concerné. L’idéal est de prendre un peu de recul, en examinant ce qui est source de pollution et pourrait êtreévité.

En matière de sécurité de l’information, la pierre angulaire de la préservation numérique prend racine dans l’idéologie selon laquelle « lots of copies keepsstuffsafe (LOCKSS) ». C’est d’ailleurs une conviction qui est reflétée dans les « Niveaux de préservation numérique », élaborés par la National Digital Stewardship Alliance, qui stipulent qu’un programme de préservation numérique résilient devrait maintenir au minimum trois copies distinctes, chacune consignée dans des emplacements géographiques différents. Autre constat qui vient envenimer cette tendance : selon la loi de Kryder, du nom d’un ingénieur américain, nous pouvons techniquement doubler nos capacités de stockage tous les treize mois, tout en en divisant par deux le coût. C’est bien la réalité d’aujourd’hui ! Cet amenuisement des coûts de stockage a ouvert la porte à une « ère de la redondance ». Nombreux sont ceux qui croient que la redondance est garante de pérennité, mais à y regarder de plus près pourtant, il en est toute autre chose. La question n’est pas tant de prôner l’agonie de la redondance, mais plutôt de réserver les solutions de stockage ayant un haut degré de redondance exclusivement aux documents revêtant une valeur intrinsèque exceptionnelle. Pour agir vers la sobriété numérique, les entreprises et les organisations devraient adapter les niveaux de redondance à leurs besoins réels plutôt que de surdimensionner. Il est inutile d’avoir des disques de stockage qui tournent et qui ne sont pas utilisés. C’est une nouvelle façon de consommer l’IT.

J.D. –Le bilan écologique des organisations est teinté par plusieurs enjeux de management. Souvent, on évalue le succès des différentes opérations archivistiques en calculant le nombre (de documents archivés, de pages numérisées, etc.). Une réduction de la cadence ne risque-t-elle pas d’être interprétée comme étant un manque d’efficacité? De plus, le secteur des archives est souvent le département le moins bien financé de son organisation. La plupart des gestionnaires s’entendent pour dire qu’il y a un manque de personnel, les obligeant à resserrer leurs priorités. Dans ces conditions, la bonification de la sélection, de l’évaluation et de la destruction semble être un objectif louable, mais est-ce vraiment applicable sur le terrain?

M-A.H. –Je suis sans doute très optimiste, mais comme pour la plupart des actions durables, il est avant tout question d’un changement de mentalité, davantage que la mise en œuvre de techniques ou de technologies coûteuses. Les mesures évoquées plus haut peuvent paraître à première vue idéalistes puisqu’elles sont formulées en termes de minimisation des activités inhérentes à la préservation numérique. Il ne faut cependant pas oublier que bon nombre de pratiques écologiquement durables amènent également des économies financières – ce qui signifie que l’agenda environnemental peut être aligné sur la viabilité financière et les réductions de coûts auxquelles de nombreuses institutions doivent déjà faire face. Êtreécologiste ne veut pas dire être pour la décroissance et l’écourtement de la longétivité notre patrimoine documentaire numérique. Cela se traduit par rationaliser, être plus sobre et économe, et surtout changer nos habitudes avec une vision plus globale des choses. Autrement dit, il faut regarder au-delà de nos murs institutionnels et outrepasser le courant dominant afin de repenser la façon de mesurer le succès. Les institutions d’archives ont tout intérêt à s’éloigner d’une vision que l’on pourrait qualifier à juste titre de « management-centric » (Trent, 2019)[10] pour y inclure l’impact sur une communauté, ou la société en général, et sur l’environnement naturel. De façon plus terre à terre, les archivistes soucieux d’assurer un fonctionnement écologiquement responsable de leurs services disposent d’ores et déjà de plusieurs leviers d’intervention accessibles. Ils peuvent commencer par évaluer à quel point leur service est un « environnemental consumer » (Abbey, 2012)[11], et ce par la réalisation d’audits divers destinés à apporter des données concrètes (consommation énergétique, émissions de gaz à effet de serre, etc.). Le partage de ces données et d’expériences en matière de développement durable est aussi un point à ne pas négliger. À mon avis, les maîtres-mots pour réduire l’empreinte carbone de la préservation numérique, et de la discipline archivistique plus globalement, doivent être « flexibilité » et « adaptation ».

J.D. –Finalement, si on se projette dans les années à venir, quelles sont les différentes actions qui seront priorisées par les acteurs du milieu afin de réduire leur empreinte écologique? Autrement dit quelles sont les solutions qui, selon vous, permettront de faire la différence?

M-A.H. –Pour les organisations qui ont une fibre écologique, il existe déjà différents leviers à actionner pour aller de l’avant ou, tout au moins, des axes de réflexions. Compte tenu de la pléthore de contextes organisationnels qui s’adonnent à l’archivage électronique, il s’avère ardu d’anticiper les actions qui seront priorisées. Chose certaine, il n’y a pas de panacée et l’addition de petites actions individuelles, aussi insignifiantes qu’elles puissent paraître, fera la différence. En voici quelques-unes qui, à mon avis, seront susceptibles d’être adoptées par les acteurs du milieu : une des exigences d’un système de préservation numérique est la lisibilité. En raison de l’obsolescence de certains formats, des opérations successives de migration doivent inéluctablement être effectuées. Ces actions génèrent des traitements machine de masse et la mobilisation de moyens de stockage temporaires considérables. À cet égard, une bonne pratique pourrait consister à mettre en place une politique de migration locale basée sur une évaluation rigoureuse des risques plutôt que de s’en remettre uniquement aux recommandations émises par les logiciels de préservation numérique. Une étude réalisée en 2016 par la Bentley Historical Library[12] a révélé que le logiciel Archivematica, par le biais de son registre central de formats, exécutait dans l’ombre des migrations pour un certain corpus d’images matricielles et de fichiers vidéo que la bibliothèque considérait comme des formats normés et pérennes. En pratique, avec de nombreuses organisations étant aux prises avec des téraoctets ou encore des pétaoctets de contenu numérique, de telles disparités peuvent engendrer une consommation énergétique superflue.

Outre les archives dites patrimoniales ou historiques, un volume important de données est destiné à être éliminé périodiquement selon le calendrier de conservation et les durées de conservation qui y figurent. L’élimination au plus tôt en conformité avec les règles de gestion est l’objectif poursuivi par un système d’archivage en bon fonctionnement. Je fais ici référence aux archives courantes et intermédiaires vouées à être éliminées. Pour faire la parallèle avec l’univers analogique, prenons l’image de la boîte d’archives papier contenant plusieurs dossiers qui ont des durées de conservation disparates (un dossier à 10 ans et l’autre à 20 ans). La durée de conservation réelle sera donc calquée sur la durée la plus longue, ce qui va engendrer 10 ans d’occupation de surface physique pour le dossier à 10 ans. Dans le domaine de la préservation numérique, le paquet d’information archivé (AIP) peut contenir plusieurs dossiers ou documents. Ainsi, constituer des paquets à durée de conservation homogène afin de se prémunir contre une consommation d’énergie peu ou pas justifiée.

***

Atacama Desert, Pica, Chili. Crédit photo: Tamara Merino CC BY-NC-ND 2.0

[1]Faute de données disponibles en contexte canadien.

[2] Idem.

[3]Pendergrass, K. L., Sampson, W., Walsh, T. et Alagna, L. (2019). Toward Environmentally SustainableDigital Preservation. The American Archivist, 82(1), 165-205. https://doi.org/10.17723/0360-9081-82.1.165

[4]Dans un jargon informatique plus classique, un « bit flip » désigne une altération de la chaîne de bits composant un fichier.

[5]Taylor, H. A. (1993). Recycling the past: The archivist in the age of ecology. Archivaria, (35), 203-213.

[6]https://docs.rockarch.org/digital-preservation-policy/

[7]https://www.library.northwestern.edu/about/administration/policies/digital-preservation-policy.html

[8]Ici, le poids respectif des fichiers dérive du format Digital Picture Exchange (DPX) 16 bits.

[9]Mitcham, J. (2020, 6 avril). Enacting Environmentally Sustainable Preservation: some thoughts. Digital Preservation Coalition Blog. https://www.dpconline.org/blog/enacting-environmentally-sustainable-preservation-some-thoughts

[10]Trent, R. (animatrice). (2019, 20 juin). Panel: Environmentally sustainable preservation of physical and digital materials [enregistrementsonored’une session de RBMS 2019]. Rare Books and Manuscripts Section. https://alair.ala.org/handle/11213/13104

[11]Abbey, H. N. (2012). The Green Archivist: A Primer for Adopting Affordable, Environmentally Sustainable, and Socially Responsible Archival Management Pratices. Archival Issues, 34(2), 91-115.

[12]Eckard, M. (2016, 18 octobre). Customizing Archivematica’s Format Migration Strategies with the Format Policy Registry (FPR). Bentley Historical Library Curation Team.https://archival-integration.blogspot.com/2016/10/customizing-archivematicas-format.html

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l’aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s