Préservation et conservation/Théorie et principes

Dématique et SAE (19) : Le Calendrier de conservation dans un contexte d’archivage électronique

Le calendrier de conservation d’archives ou le tableau de gestion d’archives (TGA) est partiellement défini par le Code du patrimoine français :

Art. L. 212-2 du Code du patrimoine modifié le 23 février 201 (modifié par l’art. 5 de la Loi n° 2008-696 du 15 juillet 2008 relative aux archives)

« À l’expiration de leur période d’utilisation courante, les archives publiques autres que celles mentionnées à l’article L. 212-3 font l’objet d’une sélection pour séparer les documents à conserver des documents dépourvus d’utilité administrative ou d’intérêt historique ou scientifique, destinés à l’élimination »

Pour ce faire, des TGA, par organismes et/ou par services, sont établis par le Service Archives (SA), conformément aux textes en vigueur, et validés par les signatures conjointes du SA et du Service producteur (SP).

Ces tableaux contractuels précisent, pour chacun des types de données ou d’archives (il ne s’agit nullement d’un répertoire des dossiers en cours) :

  • durée d’utilité administrative (DUA) = période légale pendant laquelle le SP peut avoir à utiliser ces données
  • référence aux textes en vigueur
  • durée de conservation des données au sein du SP avant versement au SA
  • sort final au terme de la DUA (destruction par, ou du moins, sous contrôle du SA et du Service contrôleur [SC] pour le contrôle scientifique et technique [CST] de l’État ou conservation définitive par le SA, qui peut être amené à y faire du tri)

Dans le contexte électronique, cette définition s’avère non pas obsolète, mais pour le moins fort incomplète. En effet, ces tableaux de conservation, de par leur nom, doivent porter en eux l’ensemble des règles de bonne gestion du cycle de vie des données, notamment quant à leur pérennité, à leur intelligibilité et à leur confidentialité, autant de paramètres à prendre en compte afin que l’archivage électronique ne soit pas vu comme une contrainte, mais bien comme un atout pour la préservation de la valeur probatoire, puis de la valeur patrimoniale pour les données à conserver ad vitam aeternam.

Ainsi, plusieurs colonnes doivent désormais être ajoutées :

Calendrier de conservation d'archives électroniques type

Calendrier de conservation d’archives électroniques type

Durée recommandée de conservation 

En effet, la pratique réglementaire et la pratique usuelle sont deux conceptions distinctes.

La DUA est une durée minimale de conservation à des fins légales ou administratives, avant le terme de laquelle il soit rigoureusement interdit d’éliminer l’archive, sous peine de sanctions administratives, voire pénales selon le degré d’implication de ce manquement dans la responsabilité de l’organisme quant à ses engagements contractuels. Nonobstant, à l’inverse d’un droit anglo-saxon plutôt axé sur la soustraction de preuves afin que la partie adverse ne puisse m’inculper, sauf à les produire elle-même, la DUA échue ne saurait impliquer automatiquement destruction de l’archive.

Sans nécessairement lui donner le statut « à conserver », l’usage des services ou d’autres raisons exceptionnelles quant à la nature de l’archive peuvent pousser à sa conservation excédant la DUA. Dans le cas où plusieurs SAE ou plusieurs volumes de conservation sécurisée soient mis en place dans l’organisme, avec des niveaux de sécurité différents, il va de soi que, la valeur légale de l’archive étant rendue obsolète, elle puisse alors être transférée sur un SAE ou sur un volume de conservation sécurisée à niveau de sécurisation moindre.

Durée de communicabilité 

Ces durées sont à prendre en compte afin d’assurer le respect des règles de confidentialité des données, en contrôlant au mieux leur accès.

Ainsi, tout demandeur tiers, considérant qu’il ne soit pas membre actif du SP de la donnée, se voit automatiquement refuser l’accès à la donnée. En ce cas, le demandeur tiers doit faire une demande de communication dérogatoire au SP, sous la stricte autorisation du SC, seule à même d’accorder ou de rejeter, sur motivations obligatoires, la dérogation.

Dans le cas des données à caractère personnel (DCP) et dans le respect exclusif des règles définies par la Commission d’accès aux documents administratifs (CADA) et par la Commission nationale informatique et libertés (CNIL), la personne directement concernée par le contenu de la donnée se doit d’avoir un accès, direct ou indirect, aux données le concernant, sans restriction de communicabilité pour sa part. Il en va ainsi, par exemple, du dossier patient informatisé (DPI), consultable via le médecin-conseil ou le médecin-référent.

Format de fichier 

Il s’agit ici de définir le format de fichier attendu pour le type de document.

On ne répètera jamais assez qu’un format pérenne standard devrait être imposé à l’entrée de tout SAE. Le principe de base est que tout document bureautique finalisé, et donc transmissible, devrait être figé en PDF/A, permettant en outre aisément de le signer électroniquement, par autant de parties que souhaitées (factures, contrats, délibérations, rapports…), notamment via des parapheurs électroniques.

D’autres formats sont tout à fait légitimes, à condition qu’ils soient ouverts et documentés (recommandation OAIS), tels XML, JPEG, MP3…

Conversion de format 

La pérennité et l’intelligibilité de l’information, dans le domaine électronique, oblige à anticiper l’obsolescence des formats, par de la veille, particulièrement dans le cas de formats non pérennes à l’origine, voire fermés. On indiquera donc ici la durée avant conversion et le format de conversion à durée échue.

Il va de soi que pour des données à DUA longues (30-60 ans), voire très longues (100-120 ans ou à sort final « à conserver »), on appliquera plusieurs stratégies de conversions successives tout au long du cycle de vie, stratégies définies au fil du temps en fonction de l’évolution des technologies.

Restriction d’accès 

Outre les règles de communicabilité, définies réglementairement, certains contextes ultra-sécuritaires imposent des notions supplémentaires de restriction d’accès aux données, notamment dans des domaines militaires, scientifiques ou technologiques.

C’est ici que seront rattachés les paramètres « Confidentiel », « Confidentiel défense », « Sécurité défense »… Il en va de même pour l’anonymisation de certaines métadonnées, afin que l’accès à la donnée ne soit pas prohibé, sans toutefois remettre en cause la confidentialité des individus.

On mettra ainsi en place des versions diffusables des documents, les DCP étant alors biffées (tout à fait réalisable en électronique, voire plus fiable qu’en papier ou il suffisait d’un miroir et d’une bonne lampe pour révéler par transparence cet obscure objet du déni) et les métadonnées sensibles correspondantes étant alors déclarées incommunicables (là-aussi réalisable actuellement).

Conservation physique 

On indiquera ici si le document soit par ailleurs conservé de façon physique, ainsi que sa durée de conservation sous ce format et s’il s’agisse d’une copie ou d’un original.

Ces informations sont cruciales afin de définir la stratégie de sécurité à appliquer au document conservé sous format électronique, cette stratégie pouvant évoluer avec le temps, si l’archive physique soit à conserver moins longtemps que celle électronique, par exemple.

Niveaux de risque 

On établira ici, sur une échelle prédéfinie, allant de 0 à 5 par exemple, une trop grande catégorisation étant fastidieuse et contre-productive, le niveau de risque juridique en cas de perte de la donnée.

Là encore, ce niveau peut être variable dans le temps. Si fréquemment ce risque soit élevé en début de cycle de vie et s’estompe ensuite, surtout à long ou à très long terme, de par la forte probabilité de contentieux ou de recours pénal en cette période, il n’est pas exclu que ce risque puisse atteindre son climax à une période intermédiaire du cycle de vie, voire même à la fin.

Possiblement, on indiquera donc éventuellement plusieurs niveaux à durées différentes.

Niveaux de sécurité 

On indiquera ici le niveau de sécurité à attribuer à la donnée, sur une échelle prédéfinie, allant de 0 à 5 par exemple, une trop grande catégorisation étant fastidieuse et contre-productive.

Ce niveau, synthèse de tout ce qui ait été défini précédemment, indique sur quel SAE ou sur quel volume de conservation sécurisée stocker la donnée. À nouveau, ce niveau peut s’avérer variable dans le temps, compte-tenu de tous les paramètres vus précédemment.

Possiblement, on indiquera donc éventuellement plusieurs niveaux à durées différentes.

Nommage des dossiers et des fichiers

Cette dernière règle n’est pas anodine, bien que trop souvent ignorée. En effet, la pérennité des données passe aussi par l’assurance de pouvoir y accéder.

Or, les systèmes d’information (SI), qu’ils soient des systèmes de gestion électronique de documents (GED) ou des systèmes d’archivage électronique (SAE), de même que les systèmes d’exploitation (Windows, Linux…) ne supportent, actuellement, parfois pas et, dans un avenir plus ou moins proche, assurément plus du tout certains particularismes linguistiques, tels les accents ou les caractères particuliers, le contexte linguistique informatique étant inexorablement anglophone. Il en va de même des espaces en blanc.

Des chartes de nommage des fichiers et des dossiers doivent donc être établies dans les organismes et se retrouver, logiquement, dans les calendriers de conservation d’archives.

Il faut aussi avoir à l’esprit que les chemins d’accès à des fichiers en informatique soient conditionnés par un nombre limité de caractères (255) au-delà duquel l’accès soit corrompu et qu’il soit dès lors impossible d’accéder aux documents, voire aux objets d’archives ou même aux archives. Ceci étant par ailleurs à prendre en compte avec la différence de chemin racine du système d’exploitation de production du document, d’avec celui du tiers-de-télétransmission responsable éventuellement du versement vers le SAE et du SAE lui-même. À cela s’ajoute l’impérieuse nécessité d’assurer cette cohérence par la suite, sur d’autres SAE à l’exploitation, par définition, encore inconnue…

À titre d’exemple, voici ce que pourrait donner le chemin d’accès à une archive sur un SAE :

<racine/SAE#/backstore#/ServiceArchives#/AAAA/ArchivalAgreement#/Archive#/ArchiveObject#/Document#.pdf> soit déjà 101 caractères

La réalité donnerait plutôt :

<racine/SAE#/backstore#/SIREN_Archives_#/AAAA/Organisation_Flux_#/Marche_###/Candidature_Offres_Non_Retenues/Entreprise_0_El/01-Acte engagement et clauses marché Numérisations 15 août 2002.pdf> soit au mieux 191 caractères, notamment à cause de noms de fichiers considérablement longs (on aurait pu le résumer à <01-AE.pdf>)…

Or, quelle utilité en définitive, dans un contexte électronique, de raconter le contenu du document dans le nom du fichier, alors qu’en définitive ce soient les métadonnées qui soient essentielles à la bonne gouvernance de l’information ? Sans parler par ailleurs de ces noms avec des coquilles rendant toute exploitation impossible… Une simple cote suffirait donc aux dossiers et aux fichiers pour les différencier, les recherches sur un SAE se faisant via le moteur de recherches interne au système.

De même, si l’utilité d’un plan de rangement sur le SAE soit utile techniquement parlant, la pertinence des plans ou des cadres de classement dans le contexte dématérialisé est fortement remise en cause, là encore par l’exploitation des métadonnées. C’est ainsi, qu’un dossier de marché ou qu’un DPI se retrouve, certes, dématérialisé au sein du volume de conservation sécurisé, mais qu’il soit possible de le consulter ou de le communiquer intégralement par une simple recherche sur la seule métadonnée « Identifiant du marché » ou « Identifiant du patient ». Il devient dès lors tout à fait possible de verser les éléments constitutifs d’un dossier actif sur du long terme, au fil de l’eau, sans pour autant s’encombrer d’un plan de classement pour le retrouver dans son intégralité.

 

Une réflexion sur “Dématique et SAE (19) : Le Calendrier de conservation dans un contexte d’archivage électronique

  1. Pingback: Dématique et SAE (19) : Le Calendrier de conservation dans un contexte d’archivage électronique | Veille juridique

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s