En informatique, l’interopérabilité se caractérise par la capacité de plusieurs systèmes à communiquer entre eux grâce à un protocole commun.

Il existe plusieurs niveaux d’interopérabilité répondant à des normes spécifiques. Au-delà des protocoles techniques d’échange de données, les systèmes d’information documentaire se sont de longue date intéressée aux enjeux sémantiques de l’interopérabilité à travers la mise au point de thésaurus et de vocabulaires contrôlés. Ces derniers reposent sur des logiques d’Autorités et d’identification pérennes qui trouvent aujourd’hui une place majeure dans les développements du web de données moteur de la transition bibliographique.

À la sémantique s’ajoute également un enjeu juridique, permettant, à travers l’adoption progressive des licences ouvertes, de consolider la dimension légale de ce cadre d’interopérabilité que représente aujourd’hui le web de données.

Dupont et Dupont, les personnages de Tintin, évoquent des éléments de vocabulaires spécifiques aux Autorités (au sens bibliothèques

Mapping

Mapping

Le mapping des données consiste à mettre en correspondance les champs de plusieurs bases de données. C’est la première étape pour faciliter la migration puis l’intégration des données d’un SIGB à un autre.

Correspondance/Conversion

Les tables de correspondance/de conversion sont les outils principaux du mapping. Elles consistent en une liste des valeurs contenues dans certains champs-sources des notices du SIGB d’origine, à laquelle on fait correspondre une liste des champs-cibles du SIGB d’accueil, dans lesquels les données d’origine devront être reprises ou converties. Dans le cadre d’une migration d’un SIGB à l’autre, ce sont particulièrement les notices d’exemplaires qui feront l’objet de ces tables de conversion.

PID, registres et autorités

Définitions générales

Autorité (données d’)

Données permettant d’identifier, de manière univoque et pérenne, les entités qui contrôlent la description des ressources et l’accès à celles-ci. Les données d’autorité comprennent : les points d’accès autorisés et rejetés, les identifiants pérennes relatifs à l’entité décrite et des données d’information et de source.

Pour en savoir plus

FNE (Fichier national d'entités)

Projet lancé en 2017, co-piloté par l’ABES et la BnF, ayant pour objet la mise en place d’une plate-forme de production mutualisée d’entités, données d’autorité structurées selon le modèle IFLA LRM, entre la BnF et les réseaux d’utilisateurs des produits de l’ABES. En juin 2023, le Comité Stratégique Bibliographique (CSB) a réaffirmé ‘l’importance stratégique de l’ambition du FNE mais a pris la décision d’en reporter la réalisation, en tenant compte des projets importants déjà en cours de réalisation à la BnF et de ceux à venir à l’Abes d’une part, et de l’impossibilité d’utiliser Wikibase comme socle technique d’autre part.

Pour en savoir plus

Référentiel

Un référentiel est une liste d’éléments formant un système de référence participant de la bonne interopérabilité des systèmes d’information.

Appliqué aux données, il s’agit d’une base ou d’un ensemble de bases permettant la collecte, la gestion et le stockage, à des fins de réutilisation ou d’analyse, d’un ensemble de données servant de référence à un système d’information. Les données y sont décrites et définies de telle sorte à être interrogeables et utilisables par des applications chaque fois que nécessaire.

Un référentiel peut également désigner un ensemble d’informations techniques relatives à l’administration d’une base de données. Il vise alors à référencer des normes et standards relatifs aux formats, propriétés, conditions de mise ) jour etc. des données et applications d’un système d’information.

PID (Persistant Identifier)

Un identifiant est un numéro ou une étiquette alphanumérique, opaque ou explicite, lisible par des machines et par des humains, permettant de désigner et de retrouver de manière univoque et pérenne un objet, un document, une personne, un lieu, un organisme, ou toute entité, dans le monde physique ou numérique. Pour faciliter l’accès à une entité numérique sur internet, l’identifiant est souvent associé à une URI (Uniform Resource Identifier), du type http(s)://url/identifiant. Un identifiant pérenne (Persistent identifier ou PID) est disponible et gérable à long terme ; il ne changera pas si l’objet est renommé ou déplacé (changement de site, d’entrepôts de données…).

Thésaurus

Liste organisée de termes contrôlés et normalisés représentant les concepts d’un domaine de la connaissance. Les thésauri constituent une catégorie spécifique de langage documentaire. La norme ISO 25964 définit les thésauri et les conditions d’interopérabilité avec d’autres vocabulaires.

Documents et ressources

ARK (Archival Resource Key)

Format d’identifiant créé en 2001 par la California Digital Library (CDL) qui a vocation à identifier des ressources physiques, numériques ou même immatérielles (concepts). Son but est de fournir des identifiants adaptés aux besoins des producteurs et diffuseurs de données sur le web, mais également capables de durer sur le long terme.

Pour en savoir plus

DOI (Digital object identifier)

Identifiant international régi par la norme ISO 26324, à la fois mécanisme de nommage des ressources et protocole de résolution des identifiants en adresses plus concrètes. Il identifie de manière univoque toute ressource stable, et en particulier de ressources numériques comme des articles scientifiques ou des rapports. L’attribution d’un DOI est le fait d’agences d’enregistrement : CrossRef pour les DOI des publications et DataCite pour les DOI des données scientifiques et des produits de la recherche (l’INIST est l’agence française des DOI DataCite).

EAN (European Article Numbering)

Système global destiné à l’identification univoque d’objet, qui attribue un code-barre (le code EAN) à tout produit ayant vocation à entrer dans une chaîne logistique commerciale.

ISAN (International Standard Audiovisual Number)

Identifiant international normalisé régi par les normes ISO 15706:2002 et ISO 15706-2. Il permet d’identifier de manière unique les œuvres audiovisuelles. Il est géré en France par l’Agence française ISAN.

Pour en savoir plus

ISBN (International Standard Book Number)

Identifiant international normalisé régi par la norme ISO 2108. Il permet d’identifier de manière univoque une monographie quel qu’en soit le support de publication : imprimé ou multimédia. En France, l’ISBN est attribué par l’Agence Francophone pour la Numérotation Internationale du Livre (AFNIL).

Pour en savoir plus

ISCI (International Standard Identifier for Collections)

Identifiant international normalisé, régi par la norme ISO 27730.  Il permet d’identifier de manière unique les collections et fonds documentaires. Il est principalement destiné aux établissements de patrimoine culturel, tels que les bibliothèques, les musées et les services d’archives, aussi bien que d’autres organismes, tels que les maisons d’édition travaillant dans la chaîne de fourniture de biens culturels.

ISMN (International Standard Music Number)

Identifiant international normalisé régi par la norme ISO 10957. Il permet d’identifier de manière unique les publications musicales imprimées. La Société des Éditeurs et Auteurs de Musique (SEAM) est agence française pour l’ISMN

Pour en savoir plus

ISRC (International Standard Recording Code)

Identifiant international normalisé régi par la norme ISO 3901. Il permet d’identifier de manière unique les enregistrements sonores et vidéo. La Société civile des producteurs phonographiques (SCPP) est agence française pour l’ISRC.

Pour en savoir plus

ISSN (International Standard Serial Number)

Identifiant international normalisé régi par la norme ISO 3297 : 2017. Il permet d’identifier de manière univoque et non ambiguë toute publication en série. L’e-ISSN s’applique plus spécifiquement aux publications numériques. Il est attribué pour les publications françaises par le Centre ISSN-France.

Pour en savoir plus

ISWC (International Standard Musical Work Code)

Identifiant international normalisé régi par la norme ISO 15707. Il permet d’identifier de manière unique les œuvres musicales. La Société des auteurs, compositeurs et éditeurs de musique (SACEM) est agence française pour l’ISWC.

Pour en savoir plus

PPN (Pica production number)

Identifiant interne des notices gérées dans les bases utilisant la solution PICA d’OCLC. En France, il est particulièrement utilisé dans les notices Sudoc. On le retrouve notamment en affichage public dans l’URL des notices Sudoc.

Personnes

IdRef

Identifiant attribué à toute notice d’autorité gérée via la plateforme IdREF développée par l’ABES. Stable, pérenne et ouvert, l’identifiant IdREF est interopérable avec les principaux identifiants internationaux (ISNI, VIAF, ORCID, …).

Pour en savoir plus

ISNI (International Standard Name Identifier)

Identifiant international normalisé, défini par la norme ISO 27729:2012, servant à identifier de manière univoque les identités publiques des personnes ou des organismes impliqués dans la création, la production ou la gestion et la distribution de contenus intellectuels et artistiques.

Pour en savoir plus

ORCID (Open Researcher and Contributor ID)

Identifiant international, servant à identifier de manière équivoque les chercheurs et auteurs de contributions académiques et scientifiques. Mise en place en 2012, il est compatible avec la norme ISO 27729 et est géré par l’organisme à but non lucratif Orcid.

Pour en savoir plus

VIAF (Virtual international Authority File)

Fichier d’autorité international virtuel fédérant en un fichier unique des notices d’autorité (personnes, collectivités, noms géographiques, œuvres, expressions) issues des principaux fichiers nationaux. Il est mis en œuvre par OCLC. L’identifiant VIAF, généré par le système, constitue de fait un identifiant international stable et pérenne d’un cluster de notices d’autorités décrivant un même objet. VIAF est utilisé dans IdRef comme source de dérivation pour faire gagner du temps au catalogueur.

Pour en savoir plus


Structures

ILN (Internal Library Number)

Identifiant propre à l’Abes et délivré à chaque établissement (ou regroupement administratif d’établissement) ayant signé une convention et doté d’un même SGB, au moment de son déploiement dans le réseau Sudoc. Il sert principalement dans le cadre des échanges de données entre le Sudoc et les réseaux locaux. Il constitue de fait un identifiant national stable et pérenne.

Pour en savoir plus

ISIL (International Standard Identifier for Libraries and Related Organizations)

Identifiant international normalisé, reposant sur la norme ISO 15511:2019, identifiant les bibliothèques et les organismes apparentés. L’ABES est agence d’enregistrement ISIL pour la France : la structure de l’ISIL en France reprend le numéro RCR précédé de « FR-»

Pour en savoir plus

RCR (Répertoire des centres de ressources)

Ce répertoire, administré par l’ABES, recense les composantes documentaires des établissements de France et de l’étranger déployés dans l’un ou l’autre des réseaux coordonnés par l’ABES. L’identifiant RCR, délivré par l’ABES , constitue de fait un identifiant national stable et pérenne.

Pour en savoir plus

RNSR (Répertoire national des structures de recherche)

Ce répertoire, administré par le ministère chargé de la recherche, référence les structures de recherche publiques et privées au niveau national. L’identifiant RNSR, généré par le système, constitue de fait un identifiant national stable et pérenne.

Pour en savoir plus

ROAR (Registry of open access repositories)

Ce registre, administré par l’Université de Southampton, référence les plateformes institutionnelles d’archives ouvertes. L’identifiant ROAR, généré par le système, constitue de fait un identifiant international stable et pérenne.

Pour en savoir plus


Concepts


RAMEAU (Répertoire d’autorité-matière encyclopédique et alphabétique unifié)

Langage d’indexation matière utilisé, en France, par la Bibliothèque nationale de France, les bibliothèques universitaires, de nombreuses bibliothèques de lecture publique ou de recherche ainsi que plusieurs organismes privés. Il est élaboré depuis 1980, de façon autonome, en relation avec le « Répertoire de vedettes-matière » de l’Université Laval à Québec, et avec la liste de vedettes-matière de la Bibliothèque du Congrès (Library of Congress Subject Headings). Le langage d’indexation précoordonné RAMEAU se compose d’un vocabulaire de termes reliés entre eux et d’une syntaxe indiquant les règles de construction des vedettes-matière à l’indexation. L’ensemble des notices d’autorité – dont le noyau est formé de noms communs et de noms géographiques – constitue les autorités RAMEAU. Elles sont complétées par un Guide d’indexation RAMEAU qui en assure le bon usage.

Pour en savoir plus


Web sémantique, Web de données

Web sémantique, web de données

Évolution du web qui permet une plus grande interopérabilité et une meilleure compréhension par les machines des ressources présentes sur le web et de leurs relations. Il est basé sur une structuration et une mise en relation de données ouvertes (open data) et permet entre autres une meilleure visibilité des catalogues de bibliothèque sur le web. Voir Emmanuelle Bermès, Le web sémantique en bibliothèque

RDF

Langage du web sémantique et un modèle de graphe. Il structure des données sous forme de triplets (Voir Triplets) afin de décrire des ressources web ainsi que leurs métadonnées. Le but est que ces données soient lisibles et exploitables par les machines.

Triplets

Structurés sous la forme sujet-prédicat-objet, les triplets permettent de définir les ressources et leurs propriétés suivant le modèle RDF. Chacun des 3 éléments est une URI (Voir URI) extraite d’un référentiel, comme par exemple celui de Wikidata.

Triple store

Base de données qui stocke et permet de récupérer des données RDF décrites sous forme de triplets. Exemple : data.idref.fr, data.ixtex.fr,

SPARQL

Le langage SPARQL permet de réaliser des requêtes sur des réservoirs de données décrites en RDF, comme les triplestores. Les réservoirs mettent souvent à disposition des endpoints afin que les utilisateurs puissent les interroger, comme ici : http://data.bnf.fr/sparql/

URI

URI : identifiant qui permet de localiser de manière unique et pérenne un document ou une ressource sur Internet. Attention, l’URL pour sa part est un type d’URI. Voir aussi : DOI, ARK.

Ontologie

Une ontologie est un modèle de données contenant les concepts d’un domaine et leurs relations, dans un langage adapté aux machines. L’ontologie RDA-FR permet de définir les règles qui vont structurer l’information contenu dans les notices et qui seront ensuite comprises et utilisées par les programmes informatiques. D’autres ontologies existent : SKOS (thésaurus), FOAF (personnes)…

recevez tous les mois les dernières nouvelles de l'adbu !

  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.