Tag Archives: Méthodologie

Isidore, moissonner et enrichir les ressources en SHS

À l’occasion du séminaire écrilecture du 12 mai 2015, Stéphane Pouyllau présentait Isidore, un service de visualisation et d’enrichissement des données de la recherche en Sciences Humaines et Sociales. D’un premier abord un peu difficile à cerner, le moteur Isidore se révèle un précieux allié pour les chercheurs, offrant un point d’entrée unifié et enrichi sémantiquement à de nombreuses ressources essentielles des SHS. 

Logo Isidore

Isidore, une plateforme d’accès aux données numériques des SHS

Le constat du difficile accès aux données et ressources de la recherche

Tout chercheur en SHS a déjà été confronté à ce problème : il existe de multiples portails qui proposent des accès à des ressources utiles à ses travaux (articles, annonces de colloques, sources numérisées…). Tous ces portails ont des périmètres plus ou moins étendus, des moteurs de recherche spécifiques et des modalités d’accès aux contenus (licences…) divers. Certains portails moissonnent et regroupent le contenu de plusieurs bases, mais en excluent d’autres. Il est rare qu’un chercheur connaisse parfaitement le périmètre des sites qu’il utilise, ou qu’il ait une vision globale de la qualité et de la quantité des ressources proposées.
Faute de connaissances aussi précises, la recherche se fait parfois au petit bonheur la chance : « j’utilise telle base ou telle bibliothèque parce que je la connais, son interface est pratique« . On exclut tel site, parce que l’on n’apprécie pas la présentation des résultats, ou encore, on trouve que tel portail renvoie des résultats moins pertinents que tel autre, sans vraiment en comprendre la raison… et ce ne sont pas de bonnes pratiques !

Une solution: Isidore, moissonner, enrichir et visualiser les ressources disponibles

Face à cette multitude de ressources et de points d’accès mais aussi aux disparités qualitatives des métadonnées, HumaNum a développé une plateforme, Isidore, qui moissonne des ressources provenant de différentes sources, enrichit leur description et les présente dans une interface qui se veut la plus pratique possible. Pour résumer, Isidore est une plateforme qui fédère l’accès aux données numériques des SHS. 

Page d'accueil d'Isidore

Page d’accueil d’Isidore

Avant de continuer, un point de vocabulaire, qui facilitera les développements suivants.

  • une métadonnée : c’est une donnée sur la donnée. En d’autres termes, il s’agit d’une information qui décrit une ressource. Par exemple, la date de prise de vue d’une photographie est une métadonnée qui nous renseigne sur la photographie.
  • moissonner : c’est interroger un fournisseur de données (une base, un gisement) pour collecter les métadonnées qu’il conserve. Par exemple, Gallica, que vous connaissez bien, moissonne les contenus de diverses bibliothèques numériques partenaires, comme celle de l’INHA.
  • un gisement de données : un entrepôt où sont stockées des données (par exemple une base de données).

Comment ça fonctionne ?

Continue reading

Par dessus l’épaule de l’écrivain, les archives de Roland Barthes

Mardi 5 mai, j’ai visité l’exposition Les écritures de Roland Barthes. Exposition sans autre habit que les archives, nues dans leur vitrine.

Brouillon de Fragments d'un discours amoureux

Brouillon de Fragments d’un discours amoureux

Longtemps, je n’ai pas trouvé d’intérêt aux expositions d’archives — ou aux archives dans les expositions. Des documents manuscrits ou des papiers dactylographiés, des feuillets jaunis, des encres passées, une ambiance poussiéreuse… Que nous disent les archives dans les expositions sinon que le producteur a beaucoup produit et que le chercheur a beaucoup cherché ?

Ce n’est que récemment que j’ai compris pourquoi ces archives-là — au-delà de la matérialisation de la recherche — étaient intéressantes, sinon passionnantes. Il y a mille choses à extraire des archives, cent façons de les lire, les parcourir, les exposer, les comprendre.
Il y a un point, en particulier, qui me frappe chaque jour davantage : ce que l’archive du chercheur d’hier peut apprendre au chercheur d’aujourd’hui, sur le plan de la méthodologie.
Nous sommes tous — la première fois que nous nous confrontons à la recherche — face à un problème épineux, qui nous paraît presque insoluble : comment gérer l’immense masse de notes que nous engrangeons, les centaines de références que nous accumulons, les documents que nous compilons ? Il y a des outils certes, mais quelle méthode infaillible adopter ? Quelle stratégie suivre ? Pour cela, il n’existe aucun manuel, les secrets d’atelier sont bien gardés : un voile pudique recouvre ce que la recherche a de fastidieux, d’ingrat. Le savoir-faire vient avec l’expérience, dit-on.

La dactylographie corrigée de Fragements d'un discours amoureux

La dactylographie corrigée de Fragements d’un discours amoureux

Dans cette quête méthodologique, les archives des plus grands sont la meilleure école. Je crois que je l’ai compris bien tard — en lisant un fascicule publié par l’INHA sur le fonds Roger Marx que la bibliothèque conserve, parmi d’autres archives d’historiens, critiques, marchands.

Continue reading

Élaborer le plan du mémoire

L’élaboration du plan est la première étape dans la conception du mémoire de stage : un moment crucial car, sans plan solide, la suite des opérations pourrait s’avérer très problématique. Au moment où j’élabore le plan, le stage touche à sa fin et j’ai fini de rassembler toute la documentation nécessaire à l’exercice de rédaction.

Faire le point : bilan du stage et relecture des notes

Avant de commencer à réfléchir au mémoire, j’ai consacré quelques heures à relire mes notes, classer la documentation et rédiger un court bilan du stage. Deux objectifs derrière cet exercice : rafraîchir la mémoire (le mois d’avril est loin !) et vérifier que les attentes du stage ont été remplies. Ainsi, j’ai retrouvé mon état d’esprit alors que je découvrais les guides de Paris et les enjeux de l’annotation et pu mesurer le chemin parcouru depuis. Cela m’a aussi permis d’avoir une vision d’ensemble des problématiques et points à traiter dans le mémoire.

Trouver une problématique globale et une ébauche de plan

Lister les idées

La « remise en mémoire » effectuée, j’ai listé les idées qui me venaient, sans chercher à les organiser. Elles étaient très diverses : certaines se rapportaient au corpus des guides de Paris, d’autres à ma mission de stage, aux outils d’annotation, d’autres encore résultaient d’une réflexion sur les Digital Humanities. À ce stade, avec un matériau si hétéroclite et décousu, aucun plan cohérent ne me sautait aux yeux.

J’ai donc essayé de les regrouper par catégories au moyen de techniques telles que le mind-mapping. Le résultat (illustré ici par deux brouillons) étant relativement peu concluant, j’ai donc décidé d’attaquer le problème par l’autre bout.

Comprendre les enjeux du mémoire

 L’autre bout, c’est s’interroger sur la nature de l’exercice et les attentes de mon école et de la structure qui m’a accueillie en stage. Pour cela, j’ai relu la fiche d’offre de stage, les consignes de l’école, les notes de mes premiers rendez-vous avec mes tuteurs et quelques mémoires d’anciens élèves (que je remercie de m’avoir confié leur production !).

Quelques questions  :

  • De quoi dois-je parler dans le mémoire ? Qu’est-ce qui est attendu de moi ? 
  • Comment rendre compte de mon travail pendant ces quatre mois sans tomber dans le rapport de stage linéaire ? 
  • Comment articuler ma mission de stage avec une réflexion plus générale sur les Digital Humanities et l’histoire de l’art ?

Réorganiser les idées, tirer des fils et des dynamiques

En répondant à ces questions, mes idées se sont réorganisées d’elles-mêmes autour de grands pôles et lignes dynamiques. J’ai distingué deux niveaux de réflexion :

  • celui du stage : problématiques liées à l’édition des guides de Paris et à l’utilisation d’un outil d’annotation dans la chaîne de production
  • celui plus général des Digital Humanities : où en est l’histoire de l’art dans l’utilisation des outils numériques ? Qu’est-ce que l’édition numérique des sources peut apporter à la discipline ? Quels outils sont disponibles ?

J’en ai déduit un titre (provisoire) qui délimite les contours de mon sujet :

 Les enjeux des environnements de travail outillés pour la production et l’exploitation des corpus textuels en histoire de l’art : l’exemple des Guides de Paris, implémentation d’un outil d’annotation

Ce titre à rallonge n’est bien sûr pas destiné à être définitif, mais à ce stade du travail, il m’assure un cadre bien délimité.

elaboration_plan_memoire (4)

Premier plan (bancal) et problématique

J’ai ensuite bâti un premier plan, qui accordait à peu près toutes les grandes idées que j’avais listées.

1.Editer les guides de Paris, un projet du Labex les passés dans le présent     1.1. Présentation du corpus des Guides de Paris
    1.2. Une source et un objet historiques. Approche historiographique des guides
    1.3. Rééditer les guides de Paris, les enjeux du numérique
2.L'annotation, pierre d'angle des corpus outillés?
    2.1. Corpus textuels et DH : la place de l'annotation
    2.2. L'annotation et internet
    2.3. Outils d'annotation disponibles : état de l'art et benchmarking de 6 outils
3. Scénario d'usages : l'annotation pour redécouvrir les guides de Paris
    3.1. Méthodologie d'édition
    3.2. Fonctionnalités des outils d'annotation et leur usage dans le projet
    3.3. Prescriptions et perspectives d'évolution

Si la problématique générale me convenait (l’outil d’annotation peut-il être la pierre d’angle d’une édition électronique d’une source textuelle?), le plan ne me satisfaisait pas tout à fait : le déroulé me semblait illogique et les parties déséquilibrées. Ce qui m’a été confirmé par mon tuteur de stage : cette ébauche de plan ne laissait pas assez de place au travail effectué durant le stage.

Rééquilibrage du plan

Ensemble, nous avons repris mon brouillon de plan pour lui donner plus de consistance. Ça a été l’occasion de revoir les enjeux du stage et les attentes concernant le mémoire.

Différentes ébauches au brouillon

Différentes ébauches au brouillon

Seconde version du plan du mémoire

1.Editer les guides de Paris, un projet du Labex les présents dans le Passé
    1.1. Présentation du corpus des Guides de Paris
      1.1.1. Présentation du corpus
      1.1.2. Une source et un objet historiques. Approche historiographique.
    1.2. Rééditer les guides de Paris, les enjeux du numérique
      1.2.1. Rendre le corpus accessible / outiller le corpus
      1.2.2. Redécouvrir les guides de Paris
      1.2.3. Méthodologie de l'édition
    1.3. Les outils d'annotation et les DH
      (sous-parties à détailler: comment travaille-t-on collectivement sur un texte...)
2. Les outils d'annotation
    2.1. Les outils d'annotation et le web
     2.1.1. Historique / Recherche
     2.1.2. Une grande diversité d'outil
     2.1.3. Standards et interopérabilité
   2.2. Comparatif de 6 outils d'annotation
     2.2.1. Critères de choix
     2.2.2. Critères d'évaluation
     2.2.3. Comparatif des outils : synthèse
   2.3. Pundit et Annotator, test de deux outils d'annotation
     sous-parties à détailler : spécificités des outils, installation...
3. Scénario d'usages : l'annotation pierre d'angle d'une édition électronique
   Sous-parties à détailler : approche par scénario ou par fonctionnalités ? 

Ainsi formulé, le plan tient mieux la route. Certaines parties, notamment la troisième, nécessitent d’être plus fouillées : les idées sont là, nombreuses, mais je ne les ai pas encore structurées.

Entre rapport de stage et mémoire de recherche appliquée

Toute la difficulté du plan consiste à équilibrer la réponse aux attentes : le mémoire ne doit être ni un rapport de stage ni un mémoire de recherche. Il doit rendre compte de la mission effectuée durant le stage tout en apportant une réflexion plus large sur les Digital Humanities. Il témoigne de la capacité de l’étudiant à comprendre les enjeux scientifiques du projet dans lequel il était impliqué et à fournir une réponse technique et informatique adaptée.

Dans mon cas, la première partie (éditer les guides de Paris) est une synthèse des enjeux du projet porté par le laboratoire. Je devrai montrer que je les ai bien compris et que je suis en mesure de les exprimer de façon limpide et concise. La deuxième partie consacrée aux outils d’annotation (et le 1.3.) restitue le travail que j’ai effectué durant le stage : je dois y présenter les outils d’annotation, les problématiques propres à l’annotation en ligne, puis expliquer ma démarche et mes critères de benchmarking. Cette partie se doit de témoigner de mes aptitudes techniques. La dernière partie (les cas d’usages) analyse l’apport que pourraient fournir les deux outils étudiés, Pundit et Annotator dans le cadre de l’édition des guides de Paris. Il s’agit de démontrer mes capacités en tant que chef de projet en Digital Humanities : suis-je capable d’envisager un usage scientifique pertinent des outils numériques que je propose de mettre en place ? Pour l’institution qui m’a accueillie en stage, c’est une partie capitale, puisque je dois formuler des recommandations qui orienteront les choix techniques à venir.

élaborer un plan de mémoire : notes de méthodologie

Suite à plusieurs discussions avec des amis ou camarades d’étude, je liste là quelques conseils/pistes pour élaborer un plan de mémoire. Il s’agit d’une note temporaire, faute de temps pour rédiger quelque chose de plus élaboré. 

Comprendre l’exercice

  • S’assurer qu’on a bien compris en quoi consistait l’exercice (mémoire, rapport, dossier, exposé) et être capable de l’expliquer
    • quels sont les critères d’évaluation ? 
    • à quoi cela sert-il ? 
  • Lire/consulter d’autres travaux
    • d’étudiants de la même formation/avec le même directeur
    • sur le même sujet

Rassembler les idées

  • lister toutes les idées : question, problématiques, arguments, exemples
  • utiliser des codes couleurs pour distinguer les idées (question, problématique, argument, exemple)
  • utiliser des flèches pour souligner les liens entre les idées

Organiser les idées

  • ne pas faire des plans linéaires tout de suite!
  • préférer les mind-mapping : rassembler les idées, les organiser logiquement par mise en relation. A faire au brouillon, avec des post-it ou grâce à un logiciel adapté
  • -> De là devrait commencer à se dessiner un plan

Affiner le plan / identifier les difficultés

  • continuer à travailler au brouillon avec des éléments mobiles (les post-it sont adaptés)
  • pour chaque partie/sous-partie/sous-sous-partie, se demander :
    • quel est l’objectif de ce morceau? quelle est sa problématique principale? que voulez-vous y montrer?
    • à quoi sert ce morceau dans la logique du mémoire ? S’intègre-t-il logiquement dans le déroulé du mémoire ? Quel lien entretient-il avec les autres parties ?
    • quelles idées principales sont à exposer ? quels exemples/contre-exemples peuvent les appuyer ?
    • Discutez-vous suffisamment ces idées ?
    • Y’a-t-il des termes complexes ou pivots à expliciter ?
    • Quelles sont les principales sources ? Avez vous fait le tour de la bibliographie sur chaque point?
    • Quels sont les risques identifiés dans la démonstration (ambiguïtés sur les termes, idée controversée, partie-pris, point de vue personnel) ?
  • penser à TOUT noter au brouillon. Utiliser des couleurs pour s’y retrouver.

Avant de rédiger une partie/sous partie

  • S’assurer qu’on sait où l’on va, c-a-d avoir un plan précis de l’enchaînement de chaque paragraphe
  • Vérifier que chaque partie à sa raison d’être (une problématique / expose des idées / est illustrée par des exemples)
  • Vérifier qu’on dispose bien de sources pour étayer le discours (référence bibliographique, source archivistique, observation de terrain).