
En informatique, l’interopérabilité se caractérise par la capacité de plusieurs systèmes à communiquer entre eux grâce à un protocole commun.
Il existe plusieurs niveaux d’interopérabilité répondant à des normes spécifiques. Au-delà des protocoles techniques d’échange de données, les systèmes d’information documentaire se sont de longue date intéressée aux enjeux sémantiques de l’interopérabilité à travers la mise au point de thésaurus et de vocabulaires contrôlés. Ces derniers reposent sur des logiques d’Autorités et d’identification pérennes qui trouvent aujourd’hui une place majeure dans les développements du web de données moteur de la transition bibliographique.
À la sémantique s’ajoute également un enjeu juridique, permettant, à travers l’adoption progressive des licences ouvertes, de consolider la dimension légale de ce cadre d’interopérabilité que représente aujourd’hui le web de données.
Mapping
Le mapping des données consiste à mettre en correspondance les champs de plusieurs bases de données. C’est la première étape pour faciliter la migration puis l’intégration des données d’un SIGB à un autre.
Les tables de correspondance/de conversion sont les outils principaux du mapping. Elles consistent en une liste des valeurs contenues dans certains champs-sources des notices du SIGB d’origine, à laquelle on fait correspondre une liste des champs-cibles du SIGB d’accueil, dans lesquels les données d’origine devront être reprises ou converties. Dans le cadre d’une migration d’un SIGB à l’autre, ce sont particulièrement les notices d’exemplaires qui feront l’objet de ces tables de conversion.
PID, registres et autorités
Définitions générales
Données permettant d’identifier, de manière univoque et pérenne, les entités qui contrôlent la description des ressources et l’accès à celles-ci. Les données d’autorité comprennent : les points d’accès autorisés et rejetés, les identifiants pérennes relatifs à l’entité décrite et des données d’information et de source.
Projet lancé en 2017, co-piloté par l’ABES et la BnF, ayant pour objet la mise en place d’une plate-forme de production mutualisée d’entités, données d’autorité structurées selon le modèle IFLA LRM, entre la BnF et les réseaux d’utilisateurs des produits de l’ABES. En juin 2023, le Comité Stratégique Bibliographique (CSB) a réaffirmé ‘l’importance stratégique de l’ambition du FNE mais a pris la décision d’en reporter la réalisation, en tenant compte des projets importants déjà en cours de réalisation à la BnF et de ceux à venir à l’Abes d’une part, et de l’impossibilité d’utiliser Wikibase comme socle technique d’autre part.
Un référentiel est une liste d’éléments formant un système de référence participant de la bonne interopérabilité des systèmes d’information.
Appliqué aux données, il s’agit d’une base ou d’un ensemble de bases permettant la collecte, la gestion et le stockage, à des fins de réutilisation ou d’analyse, d’un ensemble de données servant de référence à un système d’information. Les données y sont décrites et définies de telle sorte à être interrogeables et utilisables par des applications chaque fois que nécessaire.
Un référentiel peut également désigner un ensemble d’informations techniques relatives à l’administration d’une base de données. Il vise alors à référencer des normes et standards relatifs aux formats, propriétés, conditions de mise ) jour etc. des données et applications d’un système d’information.
Un identifiant est un numéro ou une étiquette alphanumérique, opaque ou explicite, lisible par des machines et par des humains, permettant de désigner et de retrouver de manière univoque et pérenne un objet, un document, une personne, un lieu, un organisme, ou toute entité, dans le monde physique ou numérique. Pour faciliter l’accès à une entité numérique sur internet, l’identifiant est souvent associé à une URI (Uniform Resource Identifier), du type http(s)://url/identifiant. Un identifiant pérenne (Persistent identifier ou PID) est disponible et gérable à long terme ; il ne changera pas si l’objet est renommé ou déplacé (changement de site, d’entrepôts de données…).
Liste organisée de termes contrôlés et normalisés représentant les concepts d’un domaine de la connaissance. Les thésauri constituent une catégorie spécifique de langage documentaire. La norme ISO 25964 définit les thésauri et les conditions d’interopérabilité avec d’autres vocabulaires.
Documents et ressources
Format d’identifiant créé en 2001 par la California Digital Library (CDL) qui a vocation à identifier des ressources physiques, numériques ou même immatérielles (concepts). Son but est de fournir des identifiants adaptés aux besoins des producteurs et diffuseurs de données sur le web, mais également capables de durer sur le long terme.
Identifiant international régi par la norme ISO 26324, à la fois mécanisme de nommage des ressources et protocole de résolution des identifiants en adresses plus concrètes. Il identifie de manière univoque toute ressource stable, et en particulier de ressources numériques comme des articles scientifiques ou des rapports. L’attribution d’un DOI est le fait d’agences d’enregistrement : CrossRef pour les DOI des publications et DataCite pour les DOI des données scientifiques et des produits de la recherche (l’INIST est l’agence française des DOI DataCite).
Système global destiné à l’identification univoque d’objet, qui attribue un code-barre (le code EAN) à tout produit ayant vocation à entrer dans une chaîne logistique commerciale.
Identifiant international normalisé régi par les normes ISO 15706:2002 et ISO 15706-2. Il permet d’identifier de manière unique les œuvres audiovisuelles. Il est géré en France par l’Agence française ISAN.
Identifiant international normalisé régi par la norme ISO 2108. Il permet d’identifier de manière univoque une monographie quel qu’en soit le support de publication : imprimé ou multimédia. En France, l’ISBN est attribué par l’Agence Francophone pour la Numérotation Internationale du Livre (AFNIL).
Identifiant international normalisé, régi par la norme ISO 27730. Il permet d’identifier de manière unique les collections et fonds documentaires. Il est principalement destiné aux établissements de patrimoine culturel, tels que les bibliothèques, les musées et les services d’archives, aussi bien que d’autres organismes, tels que les maisons d’édition travaillant dans la chaîne de fourniture de biens culturels.
Identifiant international normalisé régi par la norme ISO 10957. Il permet d’identifier de manière unique les publications musicales imprimées. La Société des Éditeurs et Auteurs de Musique (SEAM) est agence française pour l’ISMN
Identifiant international normalisé régi par la norme ISO 3901. Il permet d’identifier de manière unique les enregistrements sonores et vidéo. La Société civile des producteurs phonographiques (SCPP) est agence française pour l’ISRC.
Identifiant international normalisé régi par la norme ISO 3297 : 2017. Il permet d’identifier de manière univoque et non ambiguë toute publication en série. L’e-ISSN s’applique plus spécifiquement aux publications numériques. Il est attribué pour les publications françaises par le Centre ISSN-France.
Identifiant international normalisé régi par la norme ISO 15707. Il permet d’identifier de manière unique les œuvres musicales. La Société des auteurs, compositeurs et éditeurs de musique (SACEM) est agence française pour l’ISWC.
Identifiant interne des notices gérées dans les bases utilisant la solution PICA d’OCLC. En France, il est particulièrement utilisé dans les notices Sudoc. On le retrouve notamment en affichage public dans l’URL des notices Sudoc.
Personnes
Identifiant attribué à toute notice d’autorité gérée via la plateforme IdREF développée par l’ABES. Stable, pérenne et ouvert, l’identifiant IdREF est interopérable avec les principaux identifiants internationaux (ISNI, VIAF, ORCID, …).
Identifiant international normalisé, défini par la norme ISO 27729:2012, servant à identifier de manière univoque les identités publiques des personnes ou des organismes impliqués dans la création, la production ou la gestion et la distribution de contenus intellectuels et artistiques.
Identifiant international, servant à identifier de manière équivoque les chercheurs et auteurs de contributions académiques et scientifiques. Mise en place en 2012, il est compatible avec la norme ISO 27729 et est géré par l’organisme à but non lucratif Orcid.
Fichier d’autorité international virtuel fédérant en un fichier unique des notices d’autorité (personnes, collectivités, noms géographiques, œuvres, expressions) issues des principaux fichiers nationaux. Il est mis en œuvre par OCLC. L’identifiant VIAF, généré par le système, constitue de fait un identifiant international stable et pérenne d’un cluster de notices d’autorités décrivant un même objet. VIAF est utilisé dans IdRef comme source de dérivation pour faire gagner du temps au catalogueur.
Structures
Identifiant propre à l’Abes et délivré à chaque établissement (ou regroupement administratif d’établissement) ayant signé une convention et doté d’un même SGB, au moment de son déploiement dans le réseau Sudoc. Il sert principalement dans le cadre des échanges de données entre le Sudoc et les réseaux locaux. Il constitue de fait un identifiant national stable et pérenne.
Identifiant international normalisé, reposant sur la norme ISO 15511:2019, identifiant les bibliothèques et les organismes apparentés. L’ABES est agence d’enregistrement ISIL pour la France : la structure de l’ISIL en France reprend le numéro RCR précédé de « FR-»
Ce répertoire, administré par l’ABES, recense les composantes documentaires des établissements de France et de l’étranger déployés dans l’un ou l’autre des réseaux coordonnés par l’ABES. L’identifiant RCR, délivré par l’ABES , constitue de fait un identifiant national stable et pérenne.
Ce répertoire, administré par le ministère chargé de la recherche, référence les structures de recherche publiques et privées au niveau national. L’identifiant RNSR, généré par le système, constitue de fait un identifiant national stable et pérenne.
Ce registre, administré par l’Université de Southampton, référence les plateformes institutionnelles d’archives ouvertes. L’identifiant ROAR, généré par le système, constitue de fait un identifiant international stable et pérenne.
Concepts
Langage d’indexation matière utilisé, en France, par la Bibliothèque nationale de France, les bibliothèques universitaires, de nombreuses bibliothèques de lecture publique ou de recherche ainsi que plusieurs organismes privés. Il est élaboré depuis 1980, de façon autonome, en relation avec le « Répertoire de vedettes-matière » de l’Université Laval à Québec, et avec la liste de vedettes-matière de la Bibliothèque du Congrès (Library of Congress Subject Headings). Le langage d’indexation précoordonné RAMEAU se compose d’un vocabulaire de termes reliés entre eux et d’une syntaxe indiquant les règles de construction des vedettes-matière à l’indexation. L’ensemble des notices d’autorité – dont le noyau est formé de noms communs et de noms géographiques – constitue les autorités RAMEAU. Elles sont complétées par un Guide d’indexation RAMEAU qui en assure le bon usage.
Web sémantique, Web de données
Évolution du web qui permet une plus grande interopérabilité et une meilleure compréhension par les machines des ressources présentes sur le web et de leurs relations. Il est basé sur une structuration et une mise en relation de données ouvertes (open data) et permet entre autres une meilleure visibilité des catalogues de bibliothèque sur le web. Voir Emmanuelle Bermès, Le web sémantique en bibliothèque
Langage du web sémantique et un modèle de graphe. Il structure des données sous forme de triplets (Voir Triplets) afin de décrire des ressources web ainsi que leurs métadonnées. Le but est que ces données soient lisibles et exploitables par les machines.
Structurés sous la forme sujet-prédicat-objet, les triplets permettent de définir les ressources et leurs propriétés suivant le modèle RDF. Chacun des 3 éléments est une URI (Voir URI) extraite d’un référentiel, comme par exemple celui de Wikidata.
Sujet | Prédicat | Objet |
Mona Lisa | a pour créateur | Léonard de Vinci |
https://www.wikidata.org/entity/Q12418 | https://www.wikidata.org/prop/direct/P170 | https://www.wikidata.org/entity/Q762 |
Base de données qui stocke et permet de récupérer des données RDF décrites sous forme de triplets. Exemple : data.idref.fr, data.ixtex.fr,
Le langage SPARQL permet de réaliser des requêtes sur des réservoirs de données décrites en RDF, comme les triplestores. Les réservoirs mettent souvent à disposition des endpoints afin que les utilisateurs puissent les interroger, comme ici : http://data.bnf.fr/sparql/
URI : identifiant qui permet de localiser de manière unique et pérenne un document ou une ressource sur Internet. Attention, l’URL pour sa part est un type d’URI. Voir aussi : DOI, ARK.
Une ontologie est un modèle de données contenant les concepts d’un domaine et leurs relations, dans un langage adapté aux machines. L’ontologie RDA-FR permet de définir les règles qui vont structurer l’information contenu dans les notices et qui seront ensuite comprises et utilisées par les programmes informatiques. D’autres ontologies existent : SKOS (thésaurus), FOAF (personnes)…
This work is licensed under CC BY-NC 4.0