Humanités numériques, numérisations, portails... Les usages numériques se multiplient et se diversifient dans le
domaine patrimonial.
Dans un paysage en évolution (futur schéma EAD3, accroissement des usages de la TEI et développements menés par l’Equipex Biblissima, refonte de BnF
Archives et Manuscrits), des réflexions concomitantes ont été engagées à la fois par la BnF et l’Enseignement supérieur sur l’avenir de leurs outils de signalements
d’archives et de manuscrits, et se sont prolongées dans le cadre d’un groupe de travail interministériel en vue d’un dispositif national de production de données en EAD.
Cette session reviendra sur les différentes facettes des réflexions en cours : périmètres documentaires et institutionnels, base d’autorités nationale, insertion des outils de production et de publication dans des chaînes de traitement documentaires plus globales, interopérabilité des données EAD.
2. Au sommaire
• Contexte et existant : usages et outils EAD
dans les bibliothèques françaises
• Convergences BnF-ABES :
– bonnes pratiques EAD
– hypothèse d’outil national EAD
– données : interopérabilité de l’EAD et dialogue
avec d’autres communautés usagères
2
4. • Intérêt de l’EAD pour décrire certaines collections
majeures conservées en France
• Du point de vue des fonds
• Du point de vue des usages
• Une pratique désormais bien implantée en France et à
l’étranger
• Nécessité d’un dispositif de signalement à la hauteur de
cette « maturité » de l’EAD.
L’EAD, pour quoi faire ?
5. Jalons historiques : avant EAD
5
• Informatisation précoce en bibliothèques : besoin de décrire
des corpus documentaires organisés
1983 : norme APPM (Archives, personal papers and
manuscripts)
1986 : format MARC AMC (Archives and Manuscript
Control) pour décrire des corpus (uniquement de manière
globale)
• Normalisation plus tardive en archives
1993 - 1998 : groupe de travail SAA (Society of American
Archivists), choix du métalangage SGML
EAD V 1.0 (SGML) publiée en 1998
EAD V. 2.0 (XML) en 2002, respect complet de la norme
ISAD(G)
6. Jalons historiques : EAD
• Naissance d’une DTD :
– 1993 - 1995 : projet mené à la Bibliothèque de l’Université
de Californie à Berkeley par un groupe informel d’experts
– 1998 : première version
– 2002 : deuxième version, actuellement utilisée
• Arrivée en France :
– 1999 : premiers tests dans les services d’archives
– 2002 : en archives, recommandations de la DAF sur XML et
EAD ; en bibliothèques, choix de l'EAD pour la conversion
du CGM (Catalogue Général des Manuscrits des
bibliothèques publiques de France)
7. L’EAD aujourd’hui
• Maintenance technique : par la Bibliothèque du congrès
– Héberge le site officiel de l’EAD
http://www.loc.gov/ead/
– Met à disposition les outils nécessaires pour travailler en EAD:
– fichiers correspondant à la DTD
– dictionnaire des balises en anglais
– liste de diffusion, etc.
• Maintenance intellectuelle : par le sous-comité technique EAD de
la Société des archivistes américains (SAA) : mises à jour de l’EAD
• En France : le groupe AFNOR de l’EAD :
– Correspondant national du sous-comité EAD de la SAA
– Traduit la documentation
8. Projets pionniers en France :
rétroconversions CGM et Palme
• CGM : Catalogue général des
manuscrits des bibliothèques
publiques de France
– 106 tomes en 116 volumes
(1849-1993)
– 72 000 pages : 182 000 notices,
près d’1 million d’entrées d’index
– 519 institutions représentées :
BM, BU, grands établissements,
dépôts d’archives
• Palme : Base bibliographique
des manuscrits littéraires
français du 20ème siècle
– 122 000 notices rendues en 461
fichiers (pour 439 institutions),
dont 1/3 ESR (42 775 notices) 8
Cliché BnF
9. L’outillage EAD existant
(BnF, ABES…)
- Pixml et BnF Archives & Manuscrits
- Calames, double interface
- Le CCFr (Manuscrits)
- Autres usages d’EAD : interfaces de
publication Pleade, Arkheia, ICA-Atom, prise
en compte de l’EAD par certains SIGB…
- Usages d’EAD par certaines bibliothèques
numériques (mnesys, e-corpus)
9
10. Un « triptyque » numérique issu
de la rétroconversion du CGM :
1. CCFr Manuscrits
http://www.ccfr.bnf.fr
(portail d’interrogation fédérée
national)
…
2. BnF Archives et Manuscrits
http://archivesetmanuscrits.bnf.fr
…
3. Calames
http://www.calames.abes.fr/pub/
11. ESR : le projet et l’application
Calames
• Projet Calames lancé début 2006 (commande SDBIS)
• Conception et développements : mars 2006 – nov. 2007
• Ouverture du catalogue en ligne : déc. 2007
• Mise en service de l’outil de catalogage : avril 2008
• Fin de la phase projet : 2009
• Adaptations et développements post-projets (liens
numérisation, interfaces personnalisées, exports
professionnels, service OAI-PMH, version anglaise,
exports PDF)
• Calames Plus : comptes, commentaires, dépôts et
visionneuse d’images (juin 2012)
• Un réseau : 50 éts. déployés
12. Calames aujourd’hui
• Etude sur l’avenir de l’EAD à la BnF (2013)
• Echanges avec l’Equipex Biblissima (immersion avril
2014)
• Etude Calames « Bilan et perspectives » et journée du
réseau Calames (27 mai 2014)
• Lancement d’un GT Outil national EAD (19 juin 2014)
• Evolutions du Sudoc (étude Sudoc 2)… ?
Réflexions communes BnF – ABES sur l’avenir de l’EAD en
leurs seins, intensification du dialogue ABES-BnF sur des
projets communs ou à mutualiser (ex. référentiel
d’autorités national)
19. • De plus en plus de producteurs
• De plus en plus d’utilisateurs
• Passage d’un outil expérimental à un
catalogue
• Mais les outils ont peu évolué dans leur
structure depuis la période expérimentale
BAM aujourd’hui
20. • Des orientations fortes actées fin 2013
– Une étude de référence
– Des arbitrages clairs, portés au contrat de performance
– Une mise en œuvre nécessairement phasée
• Des investissements programmés au plan de développement logiciel
– Maintenance des applications existantes
– La refonte de l’outil de consultation
– Un outil national pour la production?
• Une communauté de pratiques à animer
– Des enjeux de plus long terme
– Une organisation et des pratiques à développer
• Intégrer l’EAD et ses outils plutôt que les isoler
– Dans l’architecture informatique et dans l’organisation
– Dans des réseaux de coopération et de données
BnF : Un engagement stratégique
21. • … Un petit avant-goût ?
– Index :
tous mots, titres d’œuvres, intitulés de dossiers, noms
propres, toponymes, sujets, types de documents,
langues, dates, cotes
– Introduction de facettes
– Éditorialisation : état des fonds, les nouveautés du
mois, mise en avant des outils de valorisation
Refondre BAM
23. Encoder en convergeant
- Convergence des pratiques : Rédaction (2007-
2013) d’un guide national « Bonnes pratiques
EAD en bibliothèques françaises »
- Convergence des outils : Etude de faisabilité
d’un outil national EAD (2014-2015 : en cours)
groupes de travail interministériels
- Convergence des données : Web de données,
données d’autorité
23
24. Bonnes pratiques EAD
24
• Groupe AFNOR constitué en 2000
- Dictionnaire des balises (2004)
- Manuel d’encodage d’un inventaire en EAD (2005,
rév. 2009)
• EAD s’est imposé comme le standard de description
des archives et des manuscrits, et s’étend parfois aux
collections muséales, iconographiques…
• Besoin particulier d’harmonisation des usages
pour un partage efficace des données en
bibliothèques :
- Guide des bonnes pratiques EAD en bibliothèque
(publié début 2013)
- Règles suivies et complétées par le manuel du
réseau Calames et le guide du catalogueur de la BnF
27. GT Outil national EAD
- Réunion de lancement et déclaration d’intention
(19/06/2014)
- Définition de 7 catégories de besoins fonctionnels :
- imports et exports de données
- ergonomie et convivialité, facilité d'installation
- gestion des droits d’utilisation de l’outil
- contrôle XML, DTD et bonnes pratiques
- gestion commune des autorités
- gestion des unités physiques (informations internes et vie
des documents, numérisations…)
- gouvernance et maintenance, assistance et formation
27
28. GT Outil national EAD
- Des acteurs aux besoins divers et un phasage à
définir
- Plusieurs outils d’édition en lice (XMetal dont le
plugin est partagé par BnF et ABES, XmlMind,
oXygen)
- Comité de pilotage en septembre 2015
28
29. • Utilisation d’un outil
XML développé par la
MRSH de Caen (XXE)
• Besoin premier : édition
numérique
• Utilisable en EAD et en
TEI
• Outil d’interrogation de
VIAF
• Souplesse d’utilisation :
formulaire ou XML natif
30. Convergence des données
- Parler aux archivistes : les enjeux de l’EAD 3
- Parler au monde de la recherche : les enjeux
des humanités numériques et l’exemple de
Biblissima
- Parler aux utilisateurs du Web : les enjeux du
Web de données et l’exemple de data.bnf.fr
- Un levier : les données d’autorité
- Entrées et sorties de données EAD : exemple
de Calames
30
31. Productions et réexploitations
des données de Calames
31
Base de catalogage
(encodage EAD +
indexation IdRef)
Imports XML (encodages
oXygen, ICA-Atom… /
moulinettes XML)
OAI-DC
CERL Portal
Portails d’éts.
(BDIC)
Exports
professionnels
Bibliothèques
numériques (MNHN)
SIGB du réseau
Unimarc
Natifs (EAD)
Autres portails
gérant l’EAD
(Flora, Pleade…)
RDFa
Isidore
CCFr
Web services natifs
Indexation :
catalogue public
Rétroconversions nationales
(CGM, Palme)
Catalogage natif
(443.000 <c> créés
en 2008-2013)
Moissonnages
32. Calames : exporter et
réexploiter des données
• Exports professionnels (natif, html, Marc) : l’instance
EAD stockée est l’unité de base
– question des arborescences Calames (liaisons/inclusions)
• Service OAI-PMH : niveaux descriptifs publiés
transformés à la volée en Dublin Core (sets :
établissements)
– appauvrissement et mise à plat des données EAD
• Calames et le web :
– Référencement par les moteurs : sitemap
– Web services natifs de l’interface publique, réutilisés par le
CCFR manuscrits pour moissonnage
– Usage encore expérimental de RDFa 32
33. Calames : importer des
données
• Fonction « Importer » de l’outil de catalogage
• Transformer des données Marc, Excel… en EAD ?
– Via des schémas XML ad hoc
– Nombreuses limites
• Co-gestion Calames – systèmes locaux (portails, bases
Pleade…)
circuit de création et de migration des données à définir
dans chaque établissement
33
34. Vers l’EAD 3
Cohérence sémantique de l’EAD avec
d’autres langages (ex : EAC-CPF)
Structuration renforcée des éléments
Mais logique de la base de données
• Finalisation en cours par le
TS-EAD international
• Publication prévue à
l’occasion du congrès
annuel de la SAA en août
• Question de la conversion
des notices en EAD 2002
• Question de l’application en
France
« Améliorer l’efficience de l’EAD
comme standard de représentation
électronique de description
archivistique et comme outil pour la
préservation et la présentation de ces
données et de leur échange entre
systèmes »
35. • Les corpus de données
préexistants :
– Projets de numérisation
et d’encodage des
sources utilisables par
les chercheurs
– => aligner des entrepôts
de métadonnées et
d’images numériques
existants
L’observatoire Biblissima :
Création d’un système de gestion
et d’analyse d’informations historiques
permettant de comprendre les
circonstances et les modalités
de la diffusion des connaissances,
à travers l’étude de la transmission
des livres et de leurs mouvements
Entrepôt d’images numériques
Cluster de bases de données
39. EAD et le Web de données
- Problématiques de l’EAD voisines de celles du
MARC :
- Format structuré
- Dans des silos de données
- Spécifique à une communauté donnée
40. Catalogue général (15,3
M)
Collections numérisées (3 M) Pages Web pour les
Humains
Données structurées
Pour les machines (RDF)
Instruments de
recherche (EAD)
Pages Web pour les humains et les machines
Traitements automatiques :
alignements, regroupements
43. Utiliser les données d’autorité
comme levier
• Pour un rapprochement vers les archives :
– Les potentialités de l’EAC-CPF
• Pour un rapprochement entre les
bibliothèques, les archives, l’interprofession
du livre
– Le projet d’un référentiel national commun
45. • Un projet de données d’autorité de type archivistiques
• Norme de contenu des notices :
ISAAR(CPF) – Norme internationale sur
les Autorités archivistiques: collectivités, personnes, familles
• Modèle de données et format de saisie :
EAC-CPF Contexte archivistique encodé : collectivités, personnes et familles (un
schéma XML)
• S’inscrit dans la réflexion sur le périmètre des données
d’autorité
• Notion de « contexte »
Projet « Bibliothèque 1368-2015 » 45
Données d’autorités contextuelles
46. Conçu comme une étape vers le web de données
http://eac.staatsbibliothek-berlin.de
• ISAAR-CPF est centré sur la notion de provenance (producteur de
fonds d’archives)
• EAC-CPF s’applique à toutes les personnes mentionnées dans les
instruments de recherche
(information contextuelle nécessaire à la compréhension du
contexte)
• Deux points majeurs:
• La question de l’identité (identifier correctement les personnes)
• Rendre explicites les relations (dans un contexte donné)
• Orienté données
• Identifiants
• Autres espaces de noms
46
48. ses lieux de vie, de passage…ses amis
ses archives
ses romans
ses enregistrements
ses compositions
ses interprétations
des images sur…
des adaptations de ses oeuvres
des critiques de ses oeuvres
des oeuvres sur…
les textes de ses chansons
des émissions sur…
les interprétations de
ses compositions
ses peintures
…etc.
Intégrer et interconnecter l’information
Que veut-on faire avec l’EAC-CPF ?
49. bibliothèques et musées oeuvrent pour:
archives se préoccupent de mettre:
l’intégration, la médiation et l’échange de l’information bibliographique et muséale
réalisation d’un modèle orienté-objet "FRBRoo"
les relations
au cœur des systèmes d’information
Documents
d’archives
Personnes
Collectivité
s
Familles
Fonctions
exercent
sont produits et
gérés par
sont créés en
exerçant des
Intégrant toute l’Information sur le patrimoine culturel
souci d’interopérabilité interdomaine
…mais sans renoncer à l’originalité de chaque domaine !
Toiles d’informations
50. • La BnF, ses entités successives, ses unités constitutives ont
une histoire
• à mettre en lumière
• à rendre accessible aux chercheurs
• à relier avec d’autres ressources/projets à la BnF et à l’extérieur
(national, international)
• Réaliser un outil d’aide
• à la gestion de la production documentaire
• et à son archivage à la BnF
Projet « Bibliothèque 1368-2015 » 50
Ex. d’utilisation de l’EAC : le projet
«Bibliothèque 1368-2015»
52. • Croiser les données décrivant les producteurs
de fonds de la BnF et des Archives nationales :
– Alignements utilisant des identifiants communs
(ISNI)
– Autour d’un format commun (EAC-CPF)
• Projet d’un prototype de visualisation dans un
graphe des données d’autorité produites par
la BnF et par les AN se rapportant à la même
personne ou collectivité
…pour s’intégrer dans un projet
plus large : Proto-AN (2016)
56. • L’existant :
– Des puits de données multiples
– Un rapprochement normatif
– Des alignements déjà faits entre la BnF et l’ABES (VIAF,
ISNI)
– Outils nationaux de production (EAD)
• Le projet à terme : un référentiel national de
production de données d’autorités
• Une première étape : rapprochement BnF-ABES-
autres partenaires (DILA, SGDL…)
Vers un référentiel national ?