Les données de la recherche
Afin de répondre à ses obligations légales concernant la sauvegarde des données produites par des opérations scientifiques financées par des fonds publics, l’Ifao a mis en place un protocole de gestion des archives scientifiques en se fondant sur les arrêtés du 16 et 27 septembre 2004 émis par le Ministère de la Culture (NOR : MCCB0400762A et MCCB0400702A). Les objectifs fixés sont de collecter annuellement les données traitées des missions archéologiques et d’en assurer l’archivage pérenne, c’est-à-dire la conservation à long terme et leur accessibilité, tout en préservant leur intelligibilité.
Le système qui a été mis en place doit permettre au chercheur d’analyser en détail son processus de production de données, et le cas échéant de l’améliorer ou le reconfigurer. L'objectif est que le service des archives collecte des données traitées, c’est-à-dire des données organisées (classement) et identifiées (enrichissement des métadonnées) qui respectent la cohérence des principes de classement établis par le service des archives pour l'ensemble de ses fonds et qui puissent être intégrables dans ses logiciels de gestion. Le système de gestion des données a été élaboré de manière à ce que les documents versés puissent répondre aux principes FAIR[1], c’est-à-dire être afin qu’ils soient trouvables, accessibles, interopérables et réutilisables. La question de la pérennité technique des formats et des supports est encore à l’étude.
Les étapes du système de gestion des données
Dans le cadre d’une opération de terrain, quatre étapes rythment le cycle de vie des données :
- La planification : phase préparatoire pendant laquelle le responsable d’opération rédige ou fixe les règles pour la création et la gestion des données qui seront produites sur le chantier et en informent les membres de sa mission.
- La collecte des données : opération réalisée sur le chantier de fouille durant laquelle le responsable de la mission, ou un référent, regroupe les données et s’assure que les membres de sa mission suivent et appliquent les règles qui ont été fixées.
- L’analyse des données : étape charnière importante préalable au versement des données au service des archives. Le référent archives prépare le versement. Il met les données en forme et s’assure que leur contexte de production est préservé.
- Le dépôt des données : transfert de responsabilité des données produites au service des archives de l’Ifao. Les archives physiques et numériques doivent être envoyées au service à la fin de la mission. Le transfert est matérialisé par la signature des deux parties d’un bordereau de versement décrivant dans les grandes lignes les archives qui ont été transmises.
Pour chacune des étapes 2 à 4, une procédure fixe les modalités de leur application. Elles sont décrites dans un guide de classement, d’enregistrement et de versement des données de la recherche qui a été rédigé en conformité avec les textes de loi en concertation avec les acteurs de la recherche à l'Ifao et en s’inspirant des pratiques éprouvées par d’autres institutions nationales confrontées aux mêmes enjeux. Un référent archives, désigné par le responsable d'une opération archéologique, sera le relai entre la mission et le service des archives. C'est lui qui s'assurera que toutes les étapes de la procédure sont respectées.
Le schéma ci-dessous présente le cycle de vie des données produites par les opérations archéologiques en expliquant les étapes de leur traitement après versement au service des archives de l’Ifao.
Les outils
Le guide de classement, d’enregistrement et de versement des données de la recherche est un mode d’emploi qui explique aux chercheurs les fondements du système mis en place qui s'appuie sur :
- Un plan de classement et de catalogage unifié permettant aux responsables d’opérations scientifiques de codifier la production et le classement de leurs données. Le système retenu privilégie un rangement et une description par support, puis par type de document, afin de faciliter le stockage (les documents papier ne sont pas stockés de la même façon que les documents électroniques) et l’enregistrement des données (par exemple, les documents photographiques ne sont pas identifiés de la même manière que les documents topographiques), puis par la nature de l’information contenue dans le document. Le guide explique comment les documents physiques doivent être reconditionnés et comment les fichiers numériques doivent être organisés dans une arborescence. Il décrit comment convertir ses documents dans un format pérenne pour l'archivage.
- Un enregistrement avec un code identifiant unique. Chaque document versé qu’il soit physique ou numérique devra être identifié grâce à un code identifiant unique intelligible et harmonisé avec les cotes utilisées pour les archives conservées à l’Ifao. Ce numéro est l’élément qui permettra de faire le lien entre le document lui-même et les informations d’identification. Il est construit à partir de plusieurs éléments de référence, dont le plus important est le numéro unique Ifao de l’opération scientifique telle qu’elle est référencée sur l’intranet de l’Ifao auquel ont accès les chefs de mission.
- Un système d’aide à la structuration des données et l’enregistrement des données numériques. Le responsable du site et les chercheurs pourront compter sur un éventail de ressources pour réaliser le versement de leurs données au service des archives et collections. Tout d’abord grâce à un kit regroupant fiches, tutoriels et vidéos sur la manière de structurer les données et les porter dans des formats s’approchant au plus des formats pertinents pour la conservation de longue durée. L’idée est qu’à chaque étape, et quelle que soit l’affinité à l’informatique du chercheur ou référent archive choisi, la conversion et l’enrichissement des métadonnées puisse se réaliser dans les meilleures conditions possibles. Vient ensuite la phase finale de versement, grâce au logiciel ArchiveHelper qui permet notamment, après avoir sélectionner les fichiers retenus pour le versement avec l’interface de générer automatiquement l’arborescence archive correspondant aux choix du référent archives et de renommer les fichiers en fonction du code de classement établi par les archives et collections. Le logiciel inscrit aussi les métadonnées descriptives sommaires, prérentrées ou importées sur les photos. L’ensemble du processus qui s’appuie sur les normes archivistiques en vigueur concernant la description des archives, a été pensé dans l’optique d’accompagner le chercheur, en alternant aide et automatisation de certaines tâches.
Le dépôt sur les serveurs de l’IFAO, après validation du service des Archives et Collections, permettra la conservation et la confidentialité des données versées.
En annexe du guide, les textes de lois relatifs à la gestion et l'archivage des données de la recherche ont été réunis pour indiquer au chercheur ses obligations et e cadre légal de ses versements.
Des fiches pratiques, présentent dans le kit d’aide numérique, permettent de fournir à chacun, selon sa spécialité et la typologie de données s’y rapportant une aide à la structuration de la donnée produite, dans un format qui se veut pérenne. Cette liste est amenée à évoluer au gré de l'apparition de nouveaux formats utilisés dans le cadre de la mise en application de techniques innovantes d'acquisition des données.
[1] L’acronyme FAIR pour Findable, Accessible, Interoperable, Reusable, définit les principes qui ont pour objectif de guider le partage et la publication des données en explicitant les caractéristiques qu’elles doivent présenter pour être faciles à trouver et utiliser aussi bien par les humains et les machines.