Innovations

Production participative dans les archives

par Eric Brulotte, étudiant à l’EBSI, Université de Montréal

En ces temps de restrictions budgétaires, les organismes gérant les biens culturels, et particulièrement ceux chargés du traitement et de la diffusion de documents historiques, ont vu dans le Web un canal de diffusion inexploité qui pourrait être mis à contribution pour diffuser une partie du contenu de leurs voûtes. Et en invitant tout un chacun à participer et à contribuer à la démocratisation du patrimoine commun, ils furent en grande partie responsables de l’essor que connaît la production participative. On peut dès lors se questionner  sur la forme qu’elle adopte et les mécanismes en jeu impliqués dans ce phénomène encore récent, et de quelle manière il affecte les archivistes et les archives.

En 2006, Jeff Howe, à qui on attribue la copaternité de ce néologisme, définissait le « crowdsourcing » ainsi : « Crowdsourcing is the act of taking a job traditionally performed by a designated agent (usually an employee) and outsourcing it to an undefined, generally large group of people in the form of an open call ». Cette définition pourrait très bien s’appliquer à l’appel lancé au public par James Murray en 1879, afin de documenter l’histoire et l’usage de mots pour le Oxford English Dictionnary.1

Les projets faisant appel au public à une époque où le Web n’existait pas encore ne sont pas aussi rares que l’on pourrait le penser.2 Contribuer à un projet d’archives n’est pas quelque chose de nouveau et uniquement attribuable à l’existence du Web, mais sa portée reste limitée.

Depuis la définition fournie par Howe en 2006, le concept de production participative a évolué et est mieux défini. Ainsi, le Grand dictionnaire fournit cette définition qui résume bien ce que ce mode de production est devenu de nos jours :

Pratique qui consiste, pour une organisation, à externaliser une activité par l’entremise d’un site Web, en faisant appel à la créativité, à l’intelligence et au savoir-faire de la communauté des internautes pour créer du contenu, développer une idée, résoudre un problème ou réaliser un projet innovant, et ce, à moindre coût.3

Cet énoncé mentionne plusieurs éléments dont le dernier, « à moindre coût », est sans doute le premier qui vient à l’esprit. Que la production participative s’applique aux archives ou à tout autre domaine de recherche, les institutions qui l’utilisent le font avant tout parce que le temps, les moyens financiers et les ressources humaines mis à leur disposition sont limités alors que le nombre de projets proposés pour l’émancipation des documents historiques, lui, ne l’est pas. Ainsi, parmi les bénéfices amenés par la production participative énumérés dans la liste dressée par Rose Holley, de la National Library of Australia, en 2010, apparaît en tête de liste : « Achieving goals the library would never have the time, financial or staff resource to achieve on its own ».4

Les sites de production participative ont principalement été développés par les GLAM (acronyme pour : galleries, libraries, archives, and museums) en exploitant la participation du public afin de combler les besoins de ces institutions qui ne sauraient l’être à l’interne, faute de moyens. Que ce soit au bénéfice d’organismes gérant des archives ou des collections, il est devenu rapidement évident qu’il fallait compter non seulement sur la participation du public, mais également sur l’intérêt de celui-ci envers un projet ou un autre.5 Ainsi, il s’agit avant tout de rejoindre une communauté d’intérêts, c’est-à-dire d’individus motivés et possédant une expertise ou un savoir-faire dans un domaine directement lié au projet mis de l’avant. Très souvent, ces tâches peuvent être relativement simples comme le marquage (tagging) et l’identification d’éléments de photographies. Le site « crowdcrafting », par exemple, demande au participant d’identifier des individus sur des photos.6, Mais la tâche peut s’avérer plus complexe. Le projet Stardust@home de la NASA demande à ses participants d’identifier des particules de poussière interstellaire, d’un diamètre de un micron, emprisonnées dans un aérogel. Ils ont ainsi accès à un assemblage de photographies constituées des archives photographiques produites par la sonde Stardust en janvier 2006 et qui ont été agrandies à l’aide d’un microscope.7 Ailleurs, le projet New York Library Map Warper demandera à ses participants d’aligner des cartes géographiques historiques avec leur équivalent moderne.8

Très souvent, les projets portent sur des archives textuelles et relèvent de la transcription de documents anciens ou historiques mis à la disposition des participants sur le Web. C’est le cas, par exemple, de la National Archives of Australia avec sa plateforme « arcHive » dont la mission est d’augmenter le nombre de documents mis à la disposition des chercheurs sur son portail RecordSearch.9 Cette opération, selon Zoey D’Arcy, se fait à faible coût et avec peu de risques, et permet de combler le retard de l’institution dans la description des documents contenus dans ses collections.10 L’auteur mentionne toutefois avoir considérer l’utilisation de OCR (Optical character recognition (ou ROC : reconnaissance optique de caractères) pour lire les documents et en faire la transcription. Son efficacité et sa fiabilité ont notamment été critiquées, particulièrement pour les documents manuscrits. Ce qui n’empêche pas, cependant, son utilisation pourvu que les transcriptions produites par ce type de logiciel soient revues par des participants à l’intérieur même du projet de production participative. C’est le cas du projet National Library of Australia’s Newspapers11 qui numérise ainsi des milliers de pages de journaux, validés par ses participants, et qu’elle pourra ensuite placés sur le TROVE qui réunis les journaux numérisés australiens.12

Plus près de nous, le projet Co-Lab de Bibliothèque et archives Canada invite les usagers à transcrire, étiqueter, traduire et décrire des documents numérisés de sa collection pour la rendre plus « accessible et utile à tous ceux qui utilisent le site Web de Bibliothèque et Archives Canada ».13

La variété de projets est telle que leur nombre justifie maintenant d’être regroupés sur des plates-formes telles que Zooniverse où l’on a accès à une variété de projets, pour ainsi dire, à la carte.14

Outre l’élargissement des collections de documents pouvant être mis à la disposition des usagers et des chercheurs, il existe d’autres enjeux cruciaux, telles la validité des résultats obtenus ou l’inquiétude initiale que cette pratique suscite au sein de la communauté archivistique au sens large. Cette communauté d’institutions est bien au fait de la primordialité du volet validité de l’information mise en ligne. Même si chaque projet se dote de règles à suivre, de tutoriels ou d’autres outils pour bien équiper ses participants, des erreurs peuvent survenir. Mais la mise en place de processus de révision finale et l’autocorrection inter pares des participants semblent suffisants pour en assurer la fiabilité.

Le succès de ces projets repose en grande partie sur la participation volontaire et non rémunérée d’individus souvent motivés par un esprit de communauté et de participation à un projet beaucoup plus grand qu’eux et qui leur permet de mettre leurs connaissances et leurs habiletés au service de la communauté, du pays. Et les archivistes et autres consorts ont vite compris que le phénomène du « crowdsourcing » n’était pas une menace, mais plutôt un outil complémentaire à leur travail.

La grande partie des bénéfices énumérés dans la liste de Rose Holley en 2010, un standard dans le domaine, concerne d’ailleurs directement l’implication de la communauté au sens large et les utilisateurs qui en tirent les bénéfices.15 On relève, entre autres :

-Utilising the knowledge, expertise and interest of the community.

-Making data discoverable in different ways for a more diverse audience (e.g. by tagging).

-Demonstrating the value and relevance of the library in the community by the high level of public involvement.

-Encouraging a sense of public ownership and responsibility towards cultural heritage collections, through user’s contributions and collaborations.

Holley fait ainsi appel aux valeurs philanthropiques des individus. C’est la conclusion à laquelle Trevor Owens est arrivé :

These projects succeed by inviting participation from engaged members of the public. The success is built upon a long-standing tradition of volunteerism and involment of public good.16

On a traduit « crowdsourcing » par « production participative ». Le terme « crowdsourcing » est un néologisme anglo-saxon, mais, tout comme « production participative », il exprime un concept. Alors que le « crowdsourcing » utilise la participation volontaire et engagée de la communauté comme réservoir d’expertises ou d’habiletés, la « production participative » utilise un concept tiré des sciences économiques (production) pour l’associer au bénévolat (participative). Ce serait donc du travail volontaire, ce qui n’est pas sans rappeler certaines des belles années de l’ère soviétique. 17 Que ces deux approches du même phénomène soient si éloignées l’une de l’autre est révélateur. Après quelques recherches en bibliothèque et sur le Web, on constate  rapidement que les institutions utilisatrices du « crowdsourcing » proviennent en très grande partie de l’univers anglo-saxon. L’Angleterre, l’Australie, la Nouvelle-Zélande, les États-Unis et le Canada en sont les clients principaux. Par le truchement de leurs institutions, galleries d’art institutionnelles, bibliothèques, musées publics ou privés, et archives historiques, ils en sont aussi les créateurs. Et ce sont les GLAM, ces expressions ostentatoires de l’héritage culturel qui en retirent les bénéfices qu’elles partagent ensuite avec la communauté au sens large. D’ailleurs, les expressions « community-sourcing », « targeted crowd sourcing » et « micro- volunteering » sont parfois utilisées pour désigner le même phénomène.18 C’est l’expression d’une forme nouvelle de philanthropie dont la portée grandissante a été rendue possible grâce à l’existence du Web.

Les documents mis en ligne dans les projets de production participative ont toujours valeur d’archives, souvent de valeurs historiques, et constituent l’assise de l’héritage culturel d’une communauté. La production participative serait donc un outil développé par des archivistes et autres professionnels de l’héritage patrimonial oeuvrant dans des institutions culturelles afin de remplir leur mission première, la diffusion des archives. En tablant sur l’implication d’usagers dans le processus de description, de transcription et d’identification de contenu, les GLAM remplissent déjà une partie de leur mandat en faisant connaître leurs collections et en démocratisant le traitement des documents historiques et des fonds d’archives tout en augmentant la visibilité de leurs collections sur le Web.

Nous conclurons avec notre propre définition du crowdsourcing puisqu’il est si intimement lié au domaine archivistique : outil de traitement d’archives, souvent historiques, développé et utilisé par les institutions culturelles anglo-saxonnes et fondées sur l’implication et la participation non rémunérée d’individus motivés par des valeurs philanthropiques, en exploitant leur expertise et savoir-faire, dans le but d’augmenter la visibilité et l’accès à l’héritage culturel d’une communauté, en utilisant le Web.

***

* Ce texte est une version révisée d’un travail pratique réalisé dans le cadre du cours ARV1050 Introduction à l’archivistique – donné au trimestre d’automne 2018 par Isabelle Dion à l’EBSI, Université de Montréal.

1 Murray, James, Appeal to the English-speaking and English-reading public, 1879. Repéré à                 https://public.oed.com/history/archives/april-1879-appeal/

2 Les projets élaborés au fil de son existence par le Smithsonian Institute à Washington en son un exemple probant. Repéré à https://siarchives.si.edu/blog/smithsonian-      crowdsourcing-1849

3 Office Québécois de la langue française. (2014). Production participative. Dans Le Grand dictionnaire terminologique, repéré à                 http://www.granddictionnaire.com/ficheOqlf.aspx?Id_Fiche=26540536

4 Holley, Rose, D-Lib Magazine, March/April 2010, Vol. 16, Number 3/4. Repéré à http://www.dlib.org/dlib/march10/holley/03holley.html

5 D’Arcy, Zoey, « The Hive » : Crowdsourcing the Description of Collections (2004). Zoey D’Arcy,    National Archives of Australia, in Description : Innovative Practices for Archives and Special    Collections. Ed. by Kate Theimer, p.1

6 Crowdcrafting, repéré à https://crowdcrafting.org/project/taggingpictures/

7 Stardust@home, repéré à https://www.nasa.gov/content/stardusthome-0; http://stardustathome.ssl.berkeley.edu

8 New York Library Map Warper , repéré à http://maps.nypl.org/warper/

9 « arcHive » repéré à http://transcribe.naa.gov.au. RecordSearch repéré à http://www.naa.gov.au/collection/search

10 D’Arcy, Zoey (2004), op. cit. p.1

11 National Library of Australia’s Newspapers, repéré à www.nla.gov.au/content/newspaper-digitisation-program

12 TROVE, repéré à https://trove.nla.gov.au

13 Co-Lab, repéré à https://co-lab.bac-lac.gc.ca/fra

14 https://www.zooniverse.org/projects?discipline=history&page=1&status=live

15 Holley, Rose ( 2010), op. cit.

16 Owens, Trevor (2014). Making Crowdsourcing Compatible with the Missions and Values of         Cultural Heritage Organisations. Dans Crowdsourcing our Cultural heritage, (p. 269-270). Ed. by        Mia Ridge, Digital Research in the Arts and Humanities series, Ashgate.

17 D’ailleurs, pour Henk Van Hess, plus tranchant, « crowdsourcing is exploiting nice people » (repéré à https://www.slideshare.net/searchbistro/harvesting- knowledge-how-to-    crowdsource-in-2010, p. 7 du diaporama). On consultera « Production participative. Origine du terme », repéré à https://fr.wikipedia.org/wiki/Production_participative.

18 Rigde, Mia (2014). Crowdsourcing Our Cultural Heritage : Introduction in Crowdsourcing ou       Cultural heritage. Dans Crowdsourcing our Cultural heritage (p. 4), ed. by Mia Ridge, Digital                Research in the Arts and Humanities series, Ashgate.

Bibliographie

« arcHive », repéré à http://transcribe.naa.gov.au. Co-Lab, repéré à https://co-lab.bac-lac.gc.ca/fra

Crowdcrafting, repéré à https://crowdcrafting.org/project/taggingpictures/

Holley, Rose, D-Lib Magazine, March/April 2010, Vol. 16, Number 3/4, repéré à http://www.dlib.org/dlib/march10/holley/03holley.html

Office Québécois de la langue française. (2012). Production participative. Dans Le Grand dictionnaire terminologique, repéré à http://www.granddictionnaire.com/ficheOqlf.aspx?Id_Fiche=26540536

Murray, James (1879). Appeal to the English-speaking and English-reading public, 1879, repéré à https://public.oed.com/history/archives/april-1879-appeal/

National Library of Australia’s Newspapers, repéré à www.nla.gov.au/content/newspaper-digitisation-program

New York Library Map Warper, repéré à http://maps.nypl.org/warper/

Owens, Trevor (2014). Making Crowdsourcing Compatible with the Missions and Values of Cultural Heritage Organisations. Dans Crowdsourcing our Cultural heritage, ed. by Mia Ridge, Digital Research in the Arts and Humanities series, Ashgate.

Production participative, repéré à https://fr.wikipedia.org/wiki/Production_participative

RecordSearch, repéré à http://www.naa.gov.au/collection/search

Rigde, Mia (2014). Crowdsourcing Our Cultural Heritage : Introduction in Crowdsourcing ou Cultural heritage. Dans Crowdsourcing our Cultural heritage, ed. by Mia Ridge, Digital Research in the Arts and Humanities series, Ashgate.

Smithsonian Institute Archives, repéré à

https://siarchives.si.edu/blog/smithsonian-crowdsourcing-1849

Stardust@home, repéré à https://www.nasa.gov/content/stardusthome-0; http://stardustathome.ssl.berkeley.edu

TROVE, repéré à https://trove.nla.gov.au

Van Hess, Henk, repéré à https://www.slideshare.net/searchbistro/harvesting- knowledge-how-to-crowdsource-in-2010

Laisser un commentaire