Les 20 et 21 juin 2017, l’ADBU organisait les premiers ateliers Bibliovizz à l’Anticafé Olympiades.
L’objectif ? Permettre à ses participants de paramétrer par groupe de 6 personnes des prototypes d’interfaces de visualisation de jeux de données proposés par des bibliothèques universitaires disposant d’un projet précis.
Le second volet des restitutions finales de ces ateliers est consacré au projet de la Bulac :
Réalisé avec l’outil Tableau (The Information Lab)
Pour aller plus loin > nous vous proposons de découvrir le compte-rendu de l’atelier :
Objectif
Dans le cadre de Bibliovizz, la BULAC a présenté un projet reposant sur des données issues du SIGB Koha. L’objectif était de produire un outil de visualisation aidant au pilotage des acquisitions et à la communication à destination des lecteurs au sujet des nouvelles entrées.
Description du jeu de données
Les données dont nous disposions comprenaient notamment les informations suivantes :
- nombre d’exemplaires reçus
- aire géo-linguistique du document.
Cette donnée se décompose sous trois angles différents : aire (exemple : Europe balkanique, centrale et orientale), région (exemple : Europe orientale), et pays (exemple : Russie) - thématique du document
- langue du document
- catégorie de prêt du document (empruntable, consultable sur place uniquement…)
- localisation du document : rez-de-jardin (recherche), rez-de-chaussée (étude), réserve, magasins
Déroulement de l’atelier
1ère demi-journée : présentation de Bibliovizz et des projets
La journée débute par la présentation des différents projets retenus. Les participants se répartissent ensuite en groupes de travail. Nous serons trois à travailler sur les données de la Bulac en utilisant l’outil “Tableau”.
2e demi-journée : découverte et prise en main de l’outil Tableau
L’outil est assez ergonomique, et la prise en main du logiciel se fait rapidement grâce à la présentation et à la grande disponibilité des formateurs. Quoique relativement simple à utiliser (glisser/déposer, interface très visuelle..), Tableau permet de produire des visualisations complexes, en associant des données variées.
Dès le chargement des données dans l’outil, nous constatons qu’il n’est pas possible de travailler dessus en l’état. En effet, de nombreux éléments ne sont pas renseignés, les données sont parfois incomplètes ou insuffisamment normalisées. Un premier nettoyage des données doit être réalisé avant de pouvoir entamer la production des visualisations à proprement parler. L’utilisation d’un outil de nettoyage des données serait nécessaire pour un usage courant du logiciel.
3e demi-journée : travail sur les données
Une fois le set de données nettoyé, nous lui associons un autre tableur comprenant la hiérarchie de la classification géo-linguistique BULAC. Combiné avec le référentiel géographique déjà présent dans le logiciel Tableau, ce tableur permet d’associer automatiquement des alias aux données codées extraites du SIGB.
Une dernière reprise des données est ensuite effectuée dans Tableau pour regrouper des ensembles de données similaires et attribuer des alias aux codes thématiques et aux codes langues.
Afin d’aboutir à un résultat lisible, deux types de visualisation différentes sont envisagés :
- une carte, pour mettre en valeur le travail d’acquisition en liant les informations géographiques et thématiques au nombre de documents entrés dans les collections (communication institutionnelle et à destination du public)
- un tableau de bord permettant un pilotage fin des acquisitions par domaine géo-linguistique (du niveau “aire” jusqu’au niveau“pays”), avec croisement des données de localisation des exemplaires dans la bibliothèque, de catégorie de prêt, de langue et de thématique (pilotage de la politique documentaire)
4e demi-journée : production des visualisations
Certaines idées de visualisation qui s’avèrent finalement peu adaptées sont abandonnées durant la constitution des tableaux de bord. Les conseils des formateurs Tableau permettent d’avancer rapidement pour concrétiser nos idées.
L’interactivité du tableau de bord permet de définir une visualisation maître qui détermine un filtre agissant sur l’ensemble des visualisation du dashboard, et modifie les données présentées selon les éléments sélectionnés. Cette fonctionnalité paraît très pertinente dans la perspective d’une utilisation collective à différents niveaux d’intervention, du chargé de collection au responsable de pôle. Par ailleurs, la définition de niveaux de permissions permet de limiter l’accès et la modification du tableau de bord à certains profils.
La présentation de la version publique et gratuite de Tableau nous incite à considérer que les besoins pourraient être couverts par cet outil en ligne.
Retour sur les différents projets
La présentation des visualisations réalisées avec les différents outils est convaincante. Le travail de Prévu autour des données de Rennes 2 extraites de Koha a retenu notre attention et pourrait aussi servir de base à un travail sur les données de la BULAC. Les deux journées ont été particulièrement enrichissantes et ont permis de produire des visualisations claires et lisibles, qui pourront servir de support de démonstration pour les collègues en interne.
Conclusion
Ces deux journées Bibliovizz ont mis en lumière deux pré-requis pour mettre en place un outil utile dans le pilotage quotidien des acquisitions :
- le traitement et le nettoyage des données est un préalable nécessaire à la production de visualisations. Cette étape, très chronophage, doit être prise en compte dans le projet d’utilisation d’un outil de data visualisation au sein de l’établissement
- l’outil même de production des statistiques (le SIGB Koha, dans le cas de la BULAC) doit être adapté aux besoins du logiciel de data visualisation choisi, afin de permettre la récupération de données précises et fiables.
Par ailleurs, les différents projets présentés ont permis de mettre en valeur l’intérêt d’opter pour une stratégie globale de data visualisation, tant pour le travail interne, que pour la communication (rapports d’activité, communication à destination du public…).
Le choix d’un outil doit s’accompagner d’un engagement important de l’établissement (formation, affectation de ressources humaines…). La mise en place de tableaux de bord correspondant aux différents besoins est un investissement non négligeable dans un premier temps (spécifications pour la récupération de données, création des visualisations…), pour permettre par la suite un gain de temps et d’efficacité réel.
L’organisation de ces deux journées a été parfaite, l’ambiance très conviviale et productive, un sans faute !
Compte-rendu de Cécile Gobbo et Fanny Mion-Mouton, responsable et responsable adjointe du Pôle Flux et données – Bulac