À l’occasion du séminaire écrilecture du 12 mai 2015, Stéphane Pouyllau présentait Isidore, un service de visualisation et d’enrichissement des données de la recherche en Sciences Humaines et Sociales. D’un premier abord un peu difficile à cerner, le moteur Isidore se révèle un précieux allié pour les chercheurs, offrant un point d’entrée unifié et enrichi sémantiquement à de nombreuses ressources essentielles des SHS.
Isidore, une plateforme d’accès aux données numériques des SHS
Le constat du difficile accès aux données et ressources de la recherche
Tout chercheur en SHS a déjà été confronté à ce problème : il existe de multiples portails qui proposent des accès à des ressources utiles à ses travaux (articles, annonces de colloques, sources numérisées…). Tous ces portails ont des périmètres plus ou moins étendus, des moteurs de recherche spécifiques et des modalités d’accès aux contenus (licences…) divers. Certains portails moissonnent et regroupent le contenu de plusieurs bases, mais en excluent d’autres. Il est rare qu’un chercheur connaisse parfaitement le périmètre des sites qu’il utilise, ou qu’il ait une vision globale de la qualité et de la quantité des ressources proposées.
Faute de connaissances aussi précises, la recherche se fait parfois au petit bonheur la chance : « j’utilise telle base ou telle bibliothèque parce que je la connais, son interface est pratique« . On exclut tel site, parce que l’on n’apprécie pas la présentation des résultats, ou encore, on trouve que tel portail renvoie des résultats moins pertinents que tel autre, sans vraiment en comprendre la raison… et ce ne sont pas de bonnes pratiques !
Une solution: Isidore, moissonner, enrichir et visualiser les ressources disponibles
Face à cette multitude de ressources et de points d’accès mais aussi aux disparités qualitatives des métadonnées, HumaNum a développé une plateforme, Isidore, qui moissonne des ressources provenant de différentes sources, enrichit leur description et les présente dans une interface qui se veut la plus pratique possible. Pour résumer, Isidore est une plateforme qui fédère l’accès aux données numériques des SHS.
Avant de continuer, un point de vocabulaire, qui facilitera les développements suivants.
- une métadonnée : c’est une donnée sur la donnée. En d’autres termes, il s’agit d’une information qui décrit une ressource. Par exemple, la date de prise de vue d’une photographie est une métadonnée qui nous renseigne sur la photographie.
- moissonner : c’est interroger un fournisseur de données (une base, un gisement) pour collecter les métadonnées qu’il conserve. Par exemple, Gallica, que vous connaissez bien, moissonne les contenus de diverses bibliothèques numériques partenaires, comme celle de l’INHA.
- un gisement de données : un entrepôt où sont stockées des données (par exemple une base de données).