Il est nécessaire de rappeler certains principes relatifs à la représentation de l’information. Sont reprises infra les définitions de certains termes utilisés, ainsi que leur interconnexion.
1. CONTENU D’INFORMATION
Si on se réfère au modèle OAIS, un contenu d’information (Content Information) est un ensemble d’informations constituant l’objet principal de la pérennisation dévolue au SAE. Il est composé d’un objet contenu de données (Content Data Object) et de son information de représentation (Representation Information).
Un objet contenu de données est un objet numérique (Digital Object), objet constitué d’une suite de bits, prenant la forme d’un fichier électronique généré dans un format donné (image, texte…).
L’information de représentation (Representation Information) est l’information traduisant un objet contenu en des concepts plus explicites. Il s’agit, par exemple, de la définition et de la description du format image dans lequel a été généré le fichier et qui permet de convertir la séquence de bits dont il se compose sous une forme intelligible par l’utilisateur.
Cette information de représentation est soit fournie par le Service versant, avec l’objet contenu de données, soit gérée séparément par le Service Archives, dans une base de connaissances. Dans ce dernier cas, le Service Archives a la charge de contrôler, lors des transferts entrants, l’existence de la documentation correspondante dans sa base de connaissances.
Par exemple spécifiquement français, dans le cadre de délibérations transmises par les collectivités aux préfectures pour le contrôle de légalité (flux ACTES), la correspondance avec les définitions précédentes est la suivante :
2. INFORMATION DE PÉRENNISATION
Afin qu’un contenu d’information soit correctement conservé, il est accompagné d’une information de pérennisation (Preservation Description Information – PDI) se décomposant de la façon suivante :
- information de provenance (Provenance Information), documentant l’historique du contenu d’information. Elle renseigne sur l’origine ou sur la source du contenu d’information, sur toute modification intervenue depuis sa création (conservation sécurisée, manipulation, migration des données…) et sur ceux en ayant eu la responsabilité (nom du principal responsable de l’enregistrement des données…)
- information de contexte (Context Information), décrivant les liens entre un contenu d’information et son environnement. Elle inclut, entre autres, les raisons de la création de ce contenu d’information et son rapport avec d’autres objets contenus de données
- information d’identification (Reference Information), identifiant et, si nécessaire, décrivant le ou les mécanismes d’attribution des identificateurs au contenu d’information. Elle inclut aussi les identificateurs permettant à un système externe de se référer, sans équivoque, à un contenu d’information particulier (International Standard Book Number – ISBN…)
- information d’intégrité (Fixity Information), décrivant les mécanismes et les clés d’authentification, garantissant que le contenu d’information n’ait pas subi de modification, sans que celle-ci ait été tracée (code de contrôle de redondance cyclique [CRC] pour un fichier, calcul d’empreinte…).
3. PAQUET D’INFORMATION – PI (L’ARCHIVE)
D’après l’OAIS, l’ensemble des échanges d’informations effectués entre le SAE et l’extérieur s’effectuent par l’intermédiaire de PI.
Un PI (Information Package) est l’association du contenu d’information et de son information de pérennisation (PDI). À ce PI est aussi associée une information d’empaquetage, permettant de relier et d’identifier les composants d’un PI.
On distingue ainsi trois types de paquets :
Un PI diffusé est ainsi constitué :
4. INFORMATION DE DESCRIPTION
Enfin, l’information de description (Descriptive Information) est un ensemble d’informations, extraites de l’information de représentation et des informations de pérennisation, constituées principalement de descriptions de paquets et permettant aux utilisateurs de rechercher, de commander et de récupérer des données du SAE.