Préservation et conservation/Théorie et principes

Dématique et SAE (13) : Principes relatifs à la représentation de l’information

Il est nécessaire de rappeler certains principes relatifs à la représentation de l’information. Sont reprises infra les définitions de certains termes utilisés, ainsi que leur interconnexion.

Représentation générale de l'information

Représentation générale de l’information

1. CONTENU D’INFORMATION

Si on se réfère au modèle OAIS, un contenu d’information (Content Information) est un ensemble d’informations constituant l’objet principal de la pérennisation dévolue au SAE. Il est composé d’un objet contenu de données (Content Data Object) et de son information de représentation (Representation Information).

Contenu d'information

Contenu d’information

Un objet contenu de données est un objet numérique (Digital Object), objet constitué d’une suite de bits, prenant la forme d’un fichier électronique généré dans un format donné (image, texte…).

L’information de représentation (Representation Information) est l’information traduisant un objet contenu en des concepts plus explicites. Il s’agit, par exemple, de la définition et de la description du format image dans lequel a été généré le fichier et qui permet de convertir la séquence de bits dont il se compose sous une forme intelligible par l’utilisateur.

Information_Contenu_API

Cette information de représentation est soit fournie par le Service versant, avec l’objet contenu de données, soit gérée séparément par le Service Archives, dans une base de connaissances. Dans ce dernier cas, le Service Archives a la charge de contrôler, lors des transferts entrants, l’existence de la documentation correspondante dans sa base de connaissances.

Par exemple spécifiquement français, dans le cadre de délibérations transmises par les collectivités aux préfectures pour le contrôle de légalité (flux ACTES), la correspondance avec les définitions précédentes est la suivante :

Contenu d'information : exemple basé sur le flux ACTES

Contenu d’information : exemple basé sur le flux ACTES

2. INFORMATION DE PÉRENNISATION

Afin qu’un contenu d’information soit correctement conservé, il est accompagné d’une information de pérennisation (Preservation Description Information – PDI) se décomposant de la façon suivante :

  • information de provenance (Provenance Information), documentant l’historique du contenu d’information. Elle renseigne sur l’origine ou sur la source du contenu d’information, sur toute modification intervenue depuis sa création (conservation sécurisée, manipulation, migration des données…) et sur ceux en ayant eu la responsabilité (nom du principal responsable de l’enregistrement des données…)
  • information de contexte (Context Information), décrivant les liens entre un contenu d’information et son environnement. Elle inclut, entre autres, les raisons de la création de ce contenu d’information et son rapport avec d’autres objets contenus de données
  • information d’identification (Reference Information), identifiant et, si nécessaire, décrivant le ou les mécanismes d’attribution des identificateurs au contenu d’information. Elle inclut aussi les identificateurs permettant à un système externe de se référer, sans équivoque, à un contenu d’information particulier (International Standard Book Number – ISBN…)
  • information d’intégrité (Fixity Information), décrivant les mécanismes et les clés d’authentification, garantissant que le contenu d’information n’ait pas subi de modification, sans que celle-ci ait été tracée (code de contrôle de redondance cyclique [CRC] pour un fichier, calcul d’empreinte…).
Information de pérennisation

Information de pérennisation

3. PAQUET D’INFORMATION – PI (L’ARCHIVE)

D’après l’OAIS, l’ensemble des échanges d’informations effectués entre le SAE et l’extérieur s’effectuent par l’intermédiaire de PI.

Un PI (Information Package) est l’association du contenu d’information et de son information de pérennisation (PDI). À ce PI est aussi associée une information d’empaquetage, permettant de relier et d’identifier les composants d’un PI.

Paquet d'information

Paquet d’information

On distingue ainsi trois types de paquets :

Typologie des paquets d'information

Typologie des paquets d’information

Un PI diffusé est ainsi constitué :

Exemple de constitution d'un paquet d'information diffusé (PID)

Exemple de constitution d’un paquet d’information diffusé (PID)

4. INFORMATION DE DESCRIPTION

Enfin, l’information de description (Descriptive Information) est un ensemble d’informations, extraites de l’information de représentation et des informations de pérennisation, constituées principalement de descriptions de paquets et permettant aux utilisateurs de rechercher, de commander et de récupérer des données du SAE.

Information de description

Information de description : exemple basé sur le flux ACTES

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s