Biblissima +

Observatoire des cultures écrites anciennes, de l’argile à l’imprimé

Biblissima+ est un équipement d’excellence financé dans le cadre du PIA 3 sur 8 ans (2021-2029). C’est une infrastructure numérique multipolaire de recherche fondamentale et de service consacrée à l’histoire de la transmission des textes anciens, de l’Antiquité à la Renaissance en Orient comme en Occident.

Porteurs scientifiques :

Direction scientifique : Anne-Marie Turcan-Verkerk

Biblissima+ est construit et soutenu par 16 institutions et leurs équipes de recherche ainsi qu’une micro-entreprise : le Campus Condorcet, le CNRS, l’Université PSL, avec l’Ecole nationale des Chartes, L’École normale supérieure et l’École Pratique des Hautes Études, l’EHESS, l’ENS de Lyon, le Museum national d’histoire naturelle, le Service interministériel des Archives de France, l’université d’Avignon, l’université de Caen Normandie, l’université Jean Moulin Lyon 3, l’université Lumière Lyon 2, l’université de Poitiers, l’université de Tours, l’entreprise TEKLIA.

Pôle de l’université de Caen Normandie : CRAHAM et MRSH

Parmi les membres du CRAHAM, titulaires ou contractuels, participent au projet :

  • Pierre Bauduin
  • Thierry Buquet
  • Thibault Cardon
  • Paul Chaffenet
  • Grégory Combalbert
  • Louis Chevalier
  • Brigitte Gauvin
  • Pierre-Marie Guihard
  • Barbara Jacob
  • Catherine Jacquemard
  • Laurence Jean-Marie
  • Stéphane Lecouteux
  • Marie-Agnès Lucas-Avenel
  • Lény Retoux

Biblissima+ est une infrastructure numérique multipolaire de recherche fondamentale et de service consacrée à l’histoire de la transmission des textes anciens, des premières tablettes d’argile mésopotamiennes, il y a 3 000 ans, aux premiers livres imprimés, quels que soient les supports et les langues. Biblissima+ concerne l’ensemble des collections patrimoniales transmettant des textes anciens, y compris les sources archéologiques, les sceaux et monnaies, mais aussi les archives d’érudits modernes et de chercheurs contemporains. Ainsi, le projet vise à développer les résultats et les partenariats construits par l’équipex Biblissima (2012-2020), mais en élargissant considérablement le périmètre de recherche et en s’appuyant un plus grand nombre d’équipes fondatrices.

Biblissima+ crée un portail national réalisant l’interopérabilité de ressources numériques hétérogènes totalement open source, et donnant ainsi un accès facilité à la documentation écrite originale, à la bibliographie et aux archives de la recherche. Il y ajoute un environnement de travail exceptionnel proposant des chaînes d’outils numériques de pointe pour enrichir, partager, réutiliser les corpus selon les principes FAIR.

Un système d’appels à projets annuel ouvert à tous, destiné à produire de nouveaux jeux de données interopérables et de nouveaux outils, permet d’intégrer progressivement de nouvelles données et de nouvelles communautés. Un volet de l’appel à projets est international. Le portail Biblissima+ accentue cette ouverture internationale, à travers son moteur de recherche IIIF Collections, conçu pour interroger ensemble toutes les bibliothèques numériques interopérables du monde.

Biblissima+ se construit en 5 ans, et consacre les 3 dernières années à la mise en interopérabilité de tous les jeux de données produits, à la mise à jour constante de l’environnement de traitement des données et à l’enrichissement de la chaîne d’outils via les projets partenariaux.

A. Le premier volet décrit les mécanismes d’agrégation de nouveaux bassins de données dans le portail Biblissima+, via les référentiels Biblissima+

L’agrégation des données se fait autour d’un enrichissement massif des référentiels data.biblissima, qui seront mis à la disposition du FNE (Fichier national d’entités) et des grands acteurs du monde de la conservation et de la diffusion scientifique, afin de leur permettre d’affiner la fouille de données dans la documentation qu’ils mettent à disposition des usagers. En retour, Biblissima+ agrège autour de ses identifiants la numérisation des sources anciennesles ressources documentaires (catalogues en ligne, bases de données, archives de la recherche numérisées), la bibliographie (éditions électroniques, articles et ouvrages archivés, publications vivantes). On verra s’articuler et s’enrichir mutuellement différents outils nationaux de grande envergure sur une thématique large et variée, qui se trouve à la base de toute histoire de la culture. Ainsi d’importants bassins de données deviendront interopérables, comme le souhaitent les utilisateurs.

B. Le second volet est centré sur l’utilisateur et concerne le portail de consultation et l’environnement d’enrichissement des données fournissant des outils de traitement innovants

Les briques proposées par les pôles de compétence ont permis d’identifier 7 grands domaines à la pointe de l’innovation, qui forment autant de clusters regroupant chercheurs, conservateurs et ingénieurs.

Les 7 clusters sont organisés selon le cycle de vie des données :

  1. Acquisition des corpus de sources interopérables
  2. Prise en compte et cherchabilité des données d’analyse des matériaux
  3. Intelligence artificielle, reconnaissance de formes et d’écritures manuscrites
  4. Traitement approfondi des systèmes graphiques et analyse des documents
  5. Édition de sources en TEI
  6. Défis du patrimoine musical
  7. Interopérabilité et analyse des textes

Chaque cluster rassemble la communauté des chercheurs intéressés par son domaine de compétence et produit des outils génériques et mutualisables. Il est coordonné par un (ou des chercheurs), qui organise les journées annuelles du cluster et interagit avec l’équipe Biblissima+. Celle-ci travaille avec les coordinateurs au dialogue entre clusters et au chaînage des outils, au plus près des utilisateurs. Les outils sont accessibles via le portail Biblissima+ simplifié, qui permet de constituer des jeux de données, et de rebondir vers la galaxie des outils.

Le Craham s’est engagé sur deux grands types de livrables :

L’enrichissement des référentiels d’auteurs, œuvres, noms de personnes, noms de lieux, matières (en particulier via la création et le développement des notices de Thesauri) et avec des traits liés à la numismatique

La réalisation d’éditions en XML-TEI de sources appartenant à une typologie variée, et la participation à la réflexion pour la création du laboratoire de sources textuelles dans le cadre du cluster 5. Les différents programmes du laboratoire sur les éditions savantes de sources anciennes et médiévales (chartes, coutumiers, historiographie, poésie médiévales, hagiograhie, textes scientifiques et liturgiques) alimenteront la réflexion sur les bonnes pratiques à adopter, et les textes étudiés dans ces programmes pourront faire l’objet des expérimentations nécessaires à la conception d’outils communs, génériques, au plus près des besoins des utilisateurs.

La formation à la recherche sur l’édition savante numérique a lieu dans le cadre du séminaire « Erudition et numérique »

Pour en savoir plus : https://projet.biblissima.fr/fr

voir aussi le livre blanc téléchargeable sur la page « projet » su site : https://projet.biblissima.fr/fr/projet/presentation