Contexte

L’établissement public Campus Condorcet (EPCC) recrute dans le cadre de l’ÉquipEx+ Biblissima+ un.e ingénieur.e pour assurer le traitement et l’intégration de ressources bibliographiques dans le portail Biblissima. La bibliographie est l’un des axes principaux d’enrichissement du portail mis en avant dans le livre blanc Biblissima+, et c’est un chantier crucial pour la bonne articulation entre des ressources et infrastructures nationales proposée par le projet Biblissima+.

Créé en 2012, l’établissement public Campus Condorcet (EPCC), constructeur et gestionnaire du Campus Condorcet (www.campus-condorcet.fr), développe ses activités de coordination scientifique, en application de son nouveau décret statutaire du 8 octobre 2021. Il est notamment coordonnateur de l’ÉquipEx+ Biblissima+ (biblissima.fr).

Biblissima+ (Observatoire des cultures écrites, de l’argile à l’imprimé) fait partie des équipements structurants pour la recherche ÉquipEx+ sélectionnés en 2020 dans le cadre des Investissements d’avenir. Il prend le relais de l’ÉquipEx Biblissima (Bibliotheca bibliothecarum novissima : observatoire du patrimoine écrit du Moyen Âge et de la Renaissance, 2012-2021). Biblissima+ est porté par le Campus Condorcet, piloté par Anne-Marie Turcan-Verkerk (AOROC, EPHE-PSL) avec François Bougard (IRHT, CNRS), Marie-Agnès Lucas-Avenel (CRAHAM, Université de Caen) et Emmanuelle Morlock (HiSoMa, CNRS). Le programme bénéficie d’une aide de l’État gérée par l’Agence nationale de la Recherche. Il s’achèvera le 30 juin 2029.

Biblissima+ fédère 16 établissements et une entreprise privée, réunis en un consortium et agissant par l’intermédiaire de leurs services ou d’unités de recherche ou de service placées sous leur tutelle. Avec leurs équipes, Biblissima+ crée une infrastructure numérique multipolaire de recherche fondamentale et de service consacrée à l’histoire de la transmission des textes anciens, des premières tablettes d’argile mésopotamiennes aux premiers livres imprimés, sur tous les supports et dans toutes les langues.

Dates clés

– CDD 12 mois à temps plein
– Date limite pour candidater : 20 février 2024
– Poste à pourvoir dès que possible

Missions

Sous la responsabilité hiérarchique de la responsable scientifique et technique de Biblissima+ et sous l’autorité fonctionnelle directe du responsable de l’équipe portail Biblissima+, l’ingénieur.e en traitement de données bibliographiques aura pour mission d’enrichir le portail en y intégrant les ressources bibliographiques, à la fois celles transmises via les bases partenaires de Biblissima+ et celles ajoutées au fil du traitement des données, afin de proposer sur les différentes pages du portail des rebonds vers des sources secondaires pertinentes pour l’étude de tel manuscrit, de telle personne, de telle oeuvre etc.

Pour mener à bien la première phase de ce chantier, l’ingénieur.e se verra confier les tâches suivantes :
1/ un travail préalable de traitement massif des références bibliographiques existantes : nettoyage et dédoublonnage, extraction des entités auteur et titre ;
2/ un alignement des entités auteur avec des référentiels externes tels que BnF, IDRef, Persée, Wikidata, HAL etc.

Les données bibliographiques ainsi traitées et, autant que possible, alignées seront ensuite intégrées dans une plateforme de gestion et de publication basée sur le logiciel Wikibase et créée au préalable par l’équipe portail.

La seconde phase de ce chantier consiste à enrichir ces données bibliographiques avec des liens vers des numérisations et publications en ligne (ouvrages, articles de revue, comptes rendus, catalogues imprimés etc.) disponibles sur diverses plateformes telles que HAL, Open Edition, Persée, Gallica ou Internet Archive. Ce travail impliquera d’exploiter différentes API et de mettre en place des procédures d’interrogation, d’extraction et de matching de données à partir de celles-ci.

Sur l’ensemble de ces tâches, l’ingénieur.e bénéficiera de l’appui de l’équipe portail Biblissima+, tant sur le plan de la méthodologie que sur les aspects techniques (prise en main de Wikibase, usages avancés d’OpenRefine, développement de scripts…).

Dans le cadre de la réalisation de ces missions, la personne recrutée aura également à fournir un travail de gestion, de documentation et de mise à disposition des livrables associés, respectant les préconisations du plan de gestion des données de Biblissima (cf. https://zenodo.org/record/7081674) qui traduit la manière dont le projet s’inscrit dans une dynamique de Science ouverte et de gestion des données conformes aux principes de qualité FAIR.