Élaborer le plan du mémoire

L’élaboration du plan est la première étape dans la conception du mémoire de stage : un moment crucial car, sans plan solide, la suite des opérations pourrait s’avérer très problématique. Au moment où j’élabore le plan, le stage touche à sa fin et j’ai fini de rassembler toute la documentation nécessaire à l’exercice de rédaction.

Faire le point : bilan du stage et relecture des notes

Avant de commencer à réfléchir au mémoire, j’ai consacré quelques heures à relire mes notes, classer la documentation et rédiger un court bilan du stage. Deux objectifs derrière cet exercice : rafraîchir la mémoire (le mois d’avril est loin !) et vérifier que les attentes du stage ont été remplies. Ainsi, j’ai retrouvé mon état d’esprit alors que je découvrais les guides de Paris et les enjeux de l’annotation et pu mesurer le chemin parcouru depuis. Cela m’a aussi permis d’avoir une vision d’ensemble des problématiques et points à traiter dans le mémoire.

Trouver une problématique globale et une ébauche de plan

Lister les idées

La « remise en mémoire » effectuée, j’ai listé les idées qui me venaient, sans chercher à les organiser. Elles étaient très diverses : certaines se rapportaient au corpus des guides de Paris, d’autres à ma mission de stage, aux outils d’annotation, d’autres encore résultaient d’une réflexion sur les Digital Humanities. À ce stade, avec un matériau si hétéroclite et décousu, aucun plan cohérent ne me sautait aux yeux.

J’ai donc essayé de les regrouper par catégories au moyen de techniques telles que le mind-mapping. Le résultat (illustré ici par deux brouillons) étant relativement peu concluant, j’ai donc décidé d’attaquer le problème par l’autre bout.

Comprendre les enjeux du mémoire

 L’autre bout, c’est s’interroger sur la nature de l’exercice et les attentes de mon école et de la structure qui m’a accueillie en stage. Pour cela, j’ai relu la fiche d’offre de stage, les consignes de l’école, les notes de mes premiers rendez-vous avec mes tuteurs et quelques mémoires d’anciens élèves (que je remercie de m’avoir confié leur production !).

Quelques questions  :

  • De quoi dois-je parler dans le mémoire ? Qu’est-ce qui est attendu de moi ? 
  • Comment rendre compte de mon travail pendant ces quatre mois sans tomber dans le rapport de stage linéaire ? 
  • Comment articuler ma mission de stage avec une réflexion plus générale sur les Digital Humanities et l’histoire de l’art ?

Réorganiser les idées, tirer des fils et des dynamiques

En répondant à ces questions, mes idées se sont réorganisées d’elles-mêmes autour de grands pôles et lignes dynamiques. J’ai distingué deux niveaux de réflexion :

  • celui du stage : problématiques liées à l’édition des guides de Paris et à l’utilisation d’un outil d’annotation dans la chaîne de production
  • celui plus général des Digital Humanities : où en est l’histoire de l’art dans l’utilisation des outils numériques ? Qu’est-ce que l’édition numérique des sources peut apporter à la discipline ? Quels outils sont disponibles ?

J’en ai déduit un titre (provisoire) qui délimite les contours de mon sujet :

 Les enjeux des environnements de travail outillés pour la production et l’exploitation des corpus textuels en histoire de l’art : l’exemple des Guides de Paris, implémentation d’un outil d’annotation

Ce titre à rallonge n’est bien sûr pas destiné à être définitif, mais à ce stade du travail, il m’assure un cadre bien délimité.

elaboration_plan_memoire (4)

Premier plan (bancal) et problématique

J’ai ensuite bâti un premier plan, qui accordait à peu près toutes les grandes idées que j’avais listées.

1.Editer les guides de Paris, un projet du Labex les passés dans le présent     1.1. Présentation du corpus des Guides de Paris
    1.2. Une source et un objet historiques. Approche historiographique des guides
    1.3. Rééditer les guides de Paris, les enjeux du numérique
2.L'annotation, pierre d'angle des corpus outillés?
    2.1. Corpus textuels et DH : la place de l'annotation
    2.2. L'annotation et internet
    2.3. Outils d'annotation disponibles : état de l'art et benchmarking de 6 outils
3. Scénario d'usages : l'annotation pour redécouvrir les guides de Paris
    3.1. Méthodologie d'édition
    3.2. Fonctionnalités des outils d'annotation et leur usage dans le projet
    3.3. Prescriptions et perspectives d'évolution

Si la problématique générale me convenait (l’outil d’annotation peut-il être la pierre d’angle d’une édition électronique d’une source textuelle?), le plan ne me satisfaisait pas tout à fait : le déroulé me semblait illogique et les parties déséquilibrées. Ce qui m’a été confirmé par mon tuteur de stage : cette ébauche de plan ne laissait pas assez de place au travail effectué durant le stage.

Rééquilibrage du plan

Ensemble, nous avons repris mon brouillon de plan pour lui donner plus de consistance. Ça a été l’occasion de revoir les enjeux du stage et les attentes concernant le mémoire.

Différentes ébauches au brouillon

Différentes ébauches au brouillon

Seconde version du plan du mémoire

1.Editer les guides de Paris, un projet du Labex les présents dans le Passé
    1.1. Présentation du corpus des Guides de Paris
      1.1.1. Présentation du corpus
      1.1.2. Une source et un objet historiques. Approche historiographique.
    1.2. Rééditer les guides de Paris, les enjeux du numérique
      1.2.1. Rendre le corpus accessible / outiller le corpus
      1.2.2. Redécouvrir les guides de Paris
      1.2.3. Méthodologie de l'édition
    1.3. Les outils d'annotation et les DH
      (sous-parties à détailler: comment travaille-t-on collectivement sur un texte...)
2. Les outils d'annotation
    2.1. Les outils d'annotation et le web
     2.1.1. Historique / Recherche
     2.1.2. Une grande diversité d'outil
     2.1.3. Standards et interopérabilité
   2.2. Comparatif de 6 outils d'annotation
     2.2.1. Critères de choix
     2.2.2. Critères d'évaluation
     2.2.3. Comparatif des outils : synthèse
   2.3. Pundit et Annotator, test de deux outils d'annotation
     sous-parties à détailler : spécificités des outils, installation...
3. Scénario d'usages : l'annotation pierre d'angle d'une édition électronique
   Sous-parties à détailler : approche par scénario ou par fonctionnalités ? 

Ainsi formulé, le plan tient mieux la route. Certaines parties, notamment la troisième, nécessitent d’être plus fouillées : les idées sont là, nombreuses, mais je ne les ai pas encore structurées.

Entre rapport de stage et mémoire de recherche appliquée

Toute la difficulté du plan consiste à équilibrer la réponse aux attentes : le mémoire ne doit être ni un rapport de stage ni un mémoire de recherche. Il doit rendre compte de la mission effectuée durant le stage tout en apportant une réflexion plus large sur les Digital Humanities. Il témoigne de la capacité de l’étudiant à comprendre les enjeux scientifiques du projet dans lequel il était impliqué et à fournir une réponse technique et informatique adaptée.

Dans mon cas, la première partie (éditer les guides de Paris) est une synthèse des enjeux du projet porté par le laboratoire. Je devrai montrer que je les ai bien compris et que je suis en mesure de les exprimer de façon limpide et concise. La deuxième partie consacrée aux outils d’annotation (et le 1.3.) restitue le travail que j’ai effectué durant le stage : je dois y présenter les outils d’annotation, les problématiques propres à l’annotation en ligne, puis expliquer ma démarche et mes critères de benchmarking. Cette partie se doit de témoigner de mes aptitudes techniques. La dernière partie (les cas d’usages) analyse l’apport que pourraient fournir les deux outils étudiés, Pundit et Annotator dans le cadre de l’édition des guides de Paris. Il s’agit de démontrer mes capacités en tant que chef de projet en Digital Humanities : suis-je capable d’envisager un usage scientifique pertinent des outils numériques que je propose de mettre en place ? Pour l’institution qui m’a accueillie en stage, c’est une partie capitale, puisque je dois formuler des recommandations qui orienteront les choix techniques à venir.

Contexte – résumé du déroulé du stage

Mon mémoire s’inscrivant dans le prolongement de mon stage de fin d’études, en voici un résumé dans les grandes lignes. 

[À lire, le billet précédent où il était question du choix du stage de fin d’études]

Mon stage s’est déroulé du 1er avril au 31 juillet. Pendant les trois premiers mois, je n’y consacrais que 3/4 de ma semaine, ayant par ailleurs un job étudiant à mi-temps à l’INHA.

Ma mission lors de ce stage

Dans le cadre du projet « Guides de Paris », je suis chargée de produire un état de l’art des outils d’annotation numérique, de faire un benchmarking des outils disponibles qui semblaient appropriés à notre projet puis d’en tester deux ou trois. 

Ces prototypes me permettront de formuler plusieurs scénarios possibles d’utilisation des outils d’annotation dans le cadre du projet des Guides de Paris.

 Contrairement aux autres étudiants du master, mon stage ne débouche pas sur la réalisation d’un « produit fini » (base de données, édition encodée en XML/TEI, inventaire en EAD, exposition virtuelle) : mon travail ressemble plus à une étude de faisabilité et le mémoire est un des livrables que je dois rendre au Labex. 

Déroulé du stage

Au début du stage, nous avions fixé un calendrier assez strict pour le déroulé du stage… sur lequel j’ai rapidement pris du retard (le cumul d’un job et d’un stage n’est pas très évident).

Début avril : découvrir les guides de Paris

Dans un premier temps, je me suis familiarisée avec ce qu’on appelle les « guides de Paris » par un rapide survol bibliographique et la lecture de quelques travaux récents (Gilles Chabaud, Laurent Turcot, Daniel Roche…). Cela m’a permis de comprendre les enjeux autour de l’exploitation par les chercheurs de ce corpus. Les guides sont une source précieuse pour l’histoire de l’espace urbain, de l’art, de la société, mais également un objet d’étude à part entière, notamment comme forme littéraire ou phénomène éditorial. Les chercheurs qui s’intéressent aux guides de Paris sont issus de disciplines très diverses et les appréhendent avec des méthodologies très différentes. Le projet d’édition étant rattaché au laboratoire d’Histoire de l’art, nous interrogeons principalement le corpus sous cet angle, mais il est nécessaire de connaître les méthodes propres aux autres disciplines : d’une part, elles peuvent enrichir nos propres pratiques, d’autre part, l’édition ne doit pas se fermer aux besoins d’autres disciplines.

Mi-avril, un atelier de travail est venu conclure ce premier contact avec l’objet de l’édition. Marianne Cojeannot-Leblanc et Emmanuel Château organisaient un séminaire pour présenter le projet des Guides de Paris à leurs collègues et élèves du laboratoire HAR (histoire de l’art et des représentations). Il s’agissait d’expliquer les objectifs et la mise en œuvre de l’édition numérique, les enjeux, d’exposer les conclusions d’une première préfiguration faite par deux stagiaires du labo et surtout de recueillir les besoins, conseils, remarques de ceux que nous espérons être les futurs utilisateurs et contributeurs à l’édition.

Avril – début mai : comprendre ce qu’est une annotation, et comment le numérique appréhende l’annotation

Parallèlement, j’ai beaucoup lu sur la notion d’annotation et son renouvellement à l’ère d’internet. Il s’agissait surtout de comprendre les enjeux de l’annotation dans l’espace numérique : j’ai ainsi découvert que de nombreux chercheurs travaillaient sur cette question, que ce soit pour étudier les mécanismes de la lecture, d’appropriation du savoir, d’exploitation et de partage de ce dernier, ou pour prospecter sur les usages futurs, notamment en développant de nouveaux outils. Pour cette étape, le travail de Marc Jahjah, doctorant en sciences humaines, culture numérique et études littéraires, m’a été très précieux. En effet, Marc Jahjah a abordé à de nombreuses reprises la question de l’annotation sur son blog Marginalia : pratiques d’écriture et livre numérique. Il m’a également donné accès à son abondante documentation, ce dont je lui suis très reconnaissante.

Je me suis également intéressée aux travaux sur l’annotation avant l’ère numérique et à la manière dont les historiens l’avaient étudiée. Bien qu’un peu éloigné du cœur de mon stage, la lecture des travaux d’Anthony Grafton et la découverte des projets Annotated Books Online et « The Archaeology of Reading in Early Modern Europe » ont été très enrichissants.

Ces lectures m’ont permis de rédiger, début mai, une courte fiche sur l’annotation.

Mai-juin : panorama des outils d’annotation, benchmarking

J’ai d’abord essayé de lister tous les outils numériques permettant de faire de l’annotation en ligne. Rapidement le constat suivant s’est imposé : il en existe des centaines, et parmi eux, nombreux sont les outils obsolètes ou très limités. Beaucoup se contentent de reproduire, de façon très pauvre, le principe du stabilo ou du post-it, sans prendre en compte les spécificités de l’espace numérique (ne serait-ce que l’interopérabilité et le partage social…).

Ce travail de recensement, outre me donner une image d’ensemble des outils d’annotation, m’a permis de préciser mes critères de sélection. J’ai abondamment lu sur l’évaluation des outils d’annotation (il existe quelques articles sur la question) et je me suis beaucoup intéressée aux problématiques de normes et de standards d’annotation, sur lesquelles plusieurs groupes internationaux travaillent actuellement.

J’ai progressivement éliminé la plupart des outils pour me concentrer sur 6 outils à même (à première vue) de répondre à nos besoins. Il s’agissait d’Annotator, Annotation Studio, Annotopia, Domeo, Pundit et Textus. Après benchmarking (dont voici une très brève synthèse), nous avons décidé de retenir Pundit et Annotator pour les tests approfondis. Il aurait été intéressant d’y ajouter Annotopia, mais ce dernier n’est pas encore disponible.

De cette longue phase de travail, je vais tirer plusieurs livrables : un panorama général des outils d’annotation, une réflexion sur les critères d’évaluation et une présentation détaillée des 6 outils benchmarkés.

Juin-première quinzaine de juillet : installation de Pundit et d’Annotator

Cette phase a assurément été la plus difficile du stage : il s’agissait d’implémenter sur un serveur local Annotator et Pundit. Le premier n’a pas posé trop de problèmes (client javascript, serveur de stockage en python nécessitant elasticsearch), le second nous a en revanche donné beaucoup de fil à retordre (serveur Tomcat + java). Sans l’aide fréquente et patiente d’un proche dont l’informatique est le métier, j’aurais assurément échoué, tant les réglages sont délicats et les bugs nombreux.

Fin juillet, dernière phase : scénario d’utilisation

Les installations terminées, la dernière phase consiste à imaginer des scénarios d’utilisation de l’annotation dans le projet de recherche. Le test de Pundit et d’Annotator, en cours, est effectué sur quelques courts extraits des guides de Paris. Ils déboucheront sur la formulation de recommandations.

Il est maintenant temps de rédiger le mémoire ! 

élaborer un plan de mémoire : notes de méthodologie

Suite à plusieurs discussions avec des amis ou camarades d’étude, je liste là quelques conseils/pistes pour élaborer un plan de mémoire. Il s’agit d’une note temporaire, faute de temps pour rédiger quelque chose de plus élaboré. 

Comprendre l’exercice

  • S’assurer qu’on a bien compris en quoi consistait l’exercice (mémoire, rapport, dossier, exposé) et être capable de l’expliquer
    • quels sont les critères d’évaluation ? 
    • à quoi cela sert-il ? 
  • Lire/consulter d’autres travaux
    • d’étudiants de la même formation/avec le même directeur
    • sur le même sujet

Rassembler les idées

  • lister toutes les idées : question, problématiques, arguments, exemples
  • utiliser des codes couleurs pour distinguer les idées (question, problématique, argument, exemple)
  • utiliser des flèches pour souligner les liens entre les idées

Organiser les idées

  • ne pas faire des plans linéaires tout de suite!
  • préférer les mind-mapping : rassembler les idées, les organiser logiquement par mise en relation. A faire au brouillon, avec des post-it ou grâce à un logiciel adapté
  • -> De là devrait commencer à se dessiner un plan

Affiner le plan / identifier les difficultés

  • continuer à travailler au brouillon avec des éléments mobiles (les post-it sont adaptés)
  • pour chaque partie/sous-partie/sous-sous-partie, se demander :
    • quel est l’objectif de ce morceau? quelle est sa problématique principale? que voulez-vous y montrer?
    • à quoi sert ce morceau dans la logique du mémoire ? S’intègre-t-il logiquement dans le déroulé du mémoire ? Quel lien entretient-il avec les autres parties ?
    • quelles idées principales sont à exposer ? quels exemples/contre-exemples peuvent les appuyer ?
    • Discutez-vous suffisamment ces idées ?
    • Y’a-t-il des termes complexes ou pivots à expliciter ?
    • Quelles sont les principales sources ? Avez vous fait le tour de la bibliographie sur chaque point?
    • Quels sont les risques identifiés dans la démonstration (ambiguïtés sur les termes, idée controversée, partie-pris, point de vue personnel) ?
  • penser à TOUT noter au brouillon. Utiliser des couleurs pour s’y retrouver.

Avant de rédiger une partie/sous partie

  • S’assurer qu’on sait où l’on va, c-a-d avoir un plan précis de l’enchaînement de chaque paragraphe
  • Vérifier que chaque partie à sa raison d’être (une problématique / expose des idées / est illustrée par des exemples)
  • Vérifier qu’on dispose bien de sources pour étayer le discours (référence bibliographique, source archivistique, observation de terrain).

Contexte du mémoire – stage de fin d’études

Avant de commencer à publier ici les morceaux de mon mémoire « en construction », il est nécessaire de revenir sur le contexte dans lequel il s’inscrit. Ces notes serviront probablement à l’élaboration de l’avant-propos et de l’introduction. 

Master 2 « Technologies numériques appliquées à l’Histoire »

Cette année, j’étais étudiante du master 2 « Technologies numériques appliquées à l’Histoire » proposé par l’École des Chartes. Pour résumer un peu rapidement, ce master forme des étudiants issus de parcours en sciences humaines (histoire, littérature, histoire de l’art) ou d’archivistique aux outils de traitement numériques des sources (techniques de numérisation, description des collections, publication électronique, pérennisation de l’information…). Les débouchés sont assez variés : bibliothèques, archives, musées, milieu universitaire (ingénieur d’étude ou de recherche).

Ayant déjà une licence d’histoire de l’art, une licence d’histoire et un master de recherche en muséologie, j’ai directement intégré la seconde année du master, entièrement consacrée au numérique (alors que le M1 présente un parcours plus classique « bibliothèque », « archives » ou « histoire de l’art »).

Stage de fin d’études et mémoire de stage

La majorité des étudiants du master optent en master 2 pour le parcours « professionnalisant », qui comprend, au second semestre, un stage de trois à six mois, qui débouche sur la rédaction d’un mémoire de stage.

Ce travail est entre le rapport de stage et le mémoire de recherche. Il doit dépasser la simple narration du déroulé du stage pour en faire une synthèse problématisée, articulant clairement enjeux scientifiques et solutions méthodologiques et informatiques.

Début 2014, une quarantaine d’offres de stage ont été proposées aux étudiants du master. Les missions retenues illustrent la diversité et la richesse des profils des étudiants : encodage en EAD d’inventaires d’archives, réalisations d’expositions numériques, édition numérique de manuscrits médiévaux, archivage électronique dans des entreprises privées, mise en place ou refonte de sites internet (pour des institutions publiques ou des médias journalistiques)…

Pour ma part, après bien des hésitations (plusieurs stages m’intéressaient), j’ai opté pour celui proposé par le Labex les passés dans le présent, portant sur un projet d’édition des Guides de Paris des XVIIe et XVIIIe siècles.

Projet d’édition des guides de Paris des XVIIe et XVIIIe siècles

Lancé en 2013, le projet Guides de Paris (les historiens des arts et les corpus numériques) vise à produire une édition critique électronique d’un ensemble de guides de Paris publiés à l’époque moderne et à faciliter l’accès à ces sources précieuses pour les historiens. Cette édition numérique, accompagnée d’outils puissants d’exploitation des textes, doit offrir de nouvelles perspectives d’études sur ces ouvrages et leur contenu.

Le projet est porté par le labex (Laboratoire d’excellence) les passés dans le présent de l’université Paris X-Nanterre. Il s’attache « à comprendre les médiations de l’histoire à l’ère du numérique, les politiques de la mémoire, les appropriations sociales du passé en amont et en aval des politiques patrimoniales« . Une trentaine de projets lui sont rattachés.

Mission du stage

L’édition du corpus des guides de Paris ne constitue pas une simple mise en ligne d’un texte encodé en XML/TEI. Les porteurs du projet souhaitent l’équiper d’un ensemble d’outils facilitant l’exploitation des textes par les chercheurs. Il s’agit notamment implémenter un outil d’annotation, qui permette l’indexation des contenus et le rapprochement des textes avec des ressources externes (photographie d’œuvres, cartes, archives).

Le stage proposé portait donc sur l’élaboration d’un état de l’art des outils d’annotation disponibles, le test de certains d’eux, et l’élaboration de scénario d’exploitation dans le cadre du projet. Il doit déboucher sur un mémoire (l’objet de cette série de billets donc).


Août à l’ombre du mémoire – note d’intention

Dans quelques jours j’achève mon stage « de fin d’études » au Labex les Passés dans le Présent. Je dispose de tout le mois d’août pour rédiger le mémoire qui me permettra de valider mon master 2 pro. Sachant la solitude de la rédaction (c’est mon quatrième mémoire en trois ans!), je veux m’essayer à un exercice auquel j’avais échoué l’an dernier, celui de publier sur un blog mon travail quotidien. 

Il s’agit tout autant de « briser la solitude » que de mesurer l’avancement du travail (impossible de se mentir sur le retard accumulé dans la rédaction). Il s’agit aussi de susciter la conversation : lorsqu’on rédige de manière continue, il est fréquent de manquer de recul, et les réactions de lecteurs extérieurs aident à remettre les choses en perspective. Les remarques et conseils peuvent corriger des oublis, affiner une pensée mal dégrossie.

Je suis moi-même lectrice de carnets de recherche, et convaincue de la grande utilité de ceux-ci dans l’apprentissage de la recherche (pour le lecteur autant que pour le rédacteur). Cependant, entre la théorie et la mise en pratique, il existe un grand fossé. Ainsi, je me suis rendu compte, dans mes précédentes expériences, à quel point il était difficile d’exposer un travail inachevé, en construction, en devenir. Il faut prendre le risque d’écrire quelque chose sur quoi on n’a pas encore « tout » lu (du moins pas tout ce qu’on s’était fixé de lire), s’exposer à la critique parce qu’à ce stade du travail on est peut-être passé à côté d’une référence importante ou que la pensée n’est pas tout à fait mûre.

Une des grandes difficultés du blogging « scientifique » est bien là : accepter soi-même et faire comprendre au lecteur qu’il s’agit d’une publication d’entre-deux, c’est-à-dire présentant une pensée déjà élaborée, mais encore susceptible d’évolutions, d’enrichissements et de corrections, qui débouchera sur une forme plus définitive, le rendu (un mémoire, une thèse, un article, un livre). Par ailleurs, la tenue d’un carnet de recherche demeurant une forme de publication (le jargon la qualifie de « micropublication »), elle nécessite un certain soin (clarté de l’énonciation, orthographe, mise en page, citation des sources), ce qui en fait une activité chronophage. Activité chronophage dont le caractère optionnel fait qu’elle est facilement abandonnée dans l’urgence de la rédaction du mémoire ou de la thèse.

Je vais essayer de relever ce défi que je m’auto-inflige lance…


Lectures diverses sur l’expérience des carnets de recherche (j’en ai lu certaines il y a longtemps, d’autres viennent de m’être conseillées par Emilien Ruiz)

Installer le client Annotator – tutoriel

note : ce billet a été publié avant que je découvre la fonction « code » dans wordpress. Toutes mes excuses pour les captures d’écran d’une piètre qualité. [NB : voir ma présentation d’Annotator, publiée depuis]

Qu’est-ce qu’Annotator?

Annotator est un outil d’annotation, développé par l’Open Knowledge Foundation. Coté client, il se présente comme une librairie javascript. Les annotations produites sont stockées en Json soit sur les serveurs du web service AnnotateIt soit sur des serveurs indépendants.

Annotator-logo

Pour mes premiers tests, j’ai décidé de l’implémenter Annotator sur une page web toute simple en confiant à AnnotateIt le soin de stocker mes annotations.

Installer le client Annotator

Ma page de base

Au début, j’ai testé de suivre le tutoriel proposé sur la doc d’annotator, sans succès. J’ai donc pris le code source d’une page qui fonctionnait (la démo) et l’ai bidouillée jusqu’à bien comprendre le mécanisme.

Page_Texte_Brice

Appeler et lier la librairie d’Annotator.

La première chose à faire est d’appeler la librairie d’Annotator : il est possible d’appeler la bibliothèque hébergée sur les serveurs d’annotateIt ou de l’installer sur ses propres serveurs (il faut d’abord les télécharger, puis les placer sur le serveur).

Deux exemples :

Il vaut mieux héberger soit même la librairie afin de se prémunir d’un lien mort ou d’une panne de service.

Voici structure de mon répertoire :

La structure de mon répertoire www. Les deux fichiers HTML le test (en bas) + le dossier javascript dans lequel j'ai stocké les fichiers téléchargés : la bibliothèque annotator et sa css et la bibliothèque showdown.

La structure de mon répertoire www. Les deux fichiers HTML le test (en bas) + le dossier javascript dans lequel j’ai stocké les fichiers téléchargés : la bibliothèque annotator et sa css et la bibliothèque showdown.

Dans tous les cas, il est proposé plusieurs « package » : soit d’installer tout l’outil (noyau + plugin -> fonctionnalités optionnelles) soit le noyau seulement (et d’ajouter les plugins à la main). Ici, nous allons utiliser la version complète (annotator-full.min.js).

Pour appeler la librairie annotator, il faut ajouter la ligne de code suivante à la fin de body  :

Brice_appel

Mais pour fonctionner, la librairie annotator a besoin de la librairie JQuery (1.6 ou sup) : j’ajoute donc juste avant la ligne de code suivante :

Brice_JQuery

Il faut aussi que j’ajoute la feuille des style propre à la librairie Annotator. Cette ligne de code là doit être placée dans le header:

Brice_Header

Faire fonctionner annotator.

A ce stade, je n’ai fait qu’appeler les librairies, elles ne sont pas opérationnelles. Pour les faire fonctionner, je dois ajouter la ligne de code suivante entre l’appel des librairies et la balise fermante de body :

Brice_Script

Par cette commande, Annotator va pouvoir annoter le contenu situé dans des balises <div id= »content »> -> je les ajoute autour de mon corps de texte

Magique ça, fonctionne!

Annotator_demo

Code source commenté :

Page_Brice

Vous pouvez vous même tester ici: http://pecccadille.alwaysdata.net/BriceSaintGervais.html (mais il faut d’abord vous créer un compte sur AnnotateIt – gratuit)

Le programme HADOC

En 2014, j’ai assisté à plusieurs conférences  sur le programme HADOC (atelier à l’INHA et journée d’étude du Labex Les Passés dans le présent)  : voici une synthèse de mes notes. 

Une masse de ressources

Sous l’égide du Ministère de la Culture, les institutions françaises ont produit des milliers de ressources documentaires (bases de données, applications métiers), aujourd’hui disponibles en ligne. Ces ressources, si elles sont de très haute qualité et tendent à l’exhaustivité, ne sont pas toujours visibles (bases de données situées dans le web profond – non moissonné par les robots) ni tout simplement conçues dans un but de diffusion. En effet, de nombreuses données ont été produites dans des contextes « métiers », dans un but avant tout de gestion.

Nous avons donc à faire à une masse de ressources énorme, dont les contenus sont très divers. Étant donné que ces ressources ont été produites dans des modèles métiers différents, les vocabulaires, outils, schémas de métadonnées employés varient énormément d’une base à l’autre.

Le MCC est aujourd’hui confronté à de nouveaux enjeux, tant en terme de production que de diffusion :

  • En terme de diffusion :
    • proposer un accès unifié à l’ensemble des ressources (portails, métamoteurs, à l’exemple du moteur collections) avec une approche inter et transdisciplinaire
    • l’ouverture des données publiques : quelles données libère-t-on, sous quels formats et quelles licences ? Parfois, les données libres se trouvent dans des ressources documentaires qui sont, elles, soumises au droit d’auteur.
  • en terme de production :
    • comment rationaliser l’action publique (éliminer les ressaisies, la redondance informationnelle) ?
    • comment mieux piloter l’activité en disposant de données de référence (et à long terme améliorer les processus métiers) ?

Le programme HADOC est une réflexion sur ces enjeux de production et de diffusion.

Les enjeux des modèles de représentation dans le secteur culturel

Il est aujourd’hui nécessaire de concevoir et partager des modèles de représentation riches. Dublin core, très largement utilisé jusqu’ici pour présenter des métadonnées, ne représente plus une solution performante car son modèle est à plat. On souhaite disposer de modèles plus profonds. Des modèles orientés événements ont émergé, tels que CIDOC-CRM dans les bibliothèques et les archives, EDM ou FRBR.

Un modèle conceptuel dit « orienté événement » est conçu pour suivre la vie d’un objet, caractérisé par une succession d’événements (création, achat, classement, restauration, par exemple)

HADOC

Tout cela implique évidemment un effort de consolidation des données : d’une part les contenus doivent être riches et de qualité, d’autre part fixes et uniques, c’est-à-dire disposant d’une identification unique et pérenne. L’un des objectifs du programme HADOC est de déplacer cet effort le plus en amont possible dans le cycle de vie des données.

Le programme HADOC a été lancé en 2008. Il a commencé par un brainstorming très large, rassemblant des professionnels de métiers différents. Les pratiques métiers ont été analysés, notamment dans leurs modules fonctionnels. Une question primordiale a particulièrement été étudiée : « comment identifie-t-on un bien culturel ? » S’il est assez facile de remplir les cases pour un objet, il est plus compliqué de documenter une photo qui illustre un objet (par exemple, une photographie de la Tour Eiffel).

Nous sommes confrontés par ailleurs à différents problèmes :

  • les saisies multiples : plusieurs services créent des fiches pour un même artefact (exemple, pour un monument)
  • les formats multiples
  • la granularité (certaines fiches sont sommaires, d’autres sont très détaillées).

Par exemple, une même petite église peut être documentée sur une dizaine de base sous des appellations différentes ! Les informations sont lacunaires et les datations sont bancales. On comprend mieux pourquoi l’harmonisation des modèles de données est un enjeu prioritaire.

Au-delà de l’enjeu d’optimisation de la production, il y a celui de l’intégration sur le web sémantique : les robots du web ne sont pas en mesure de comprendre le texte libre. L’harmonisation ne peut pas se faire n’importe comment : ainsi, il n’est pas envisageable de créer un modèle métier unique ! La modélisation, l’alignement et l’harmonisation doivent d’abord concerner les données les plus partagées (format des dates, nomenclatures, formats de stockages des données…). Notons que le patrimoine et les musées sont moins normés que les archives et les bibliothèques.

Il faut par ailleurs harmoniser les contenus en partageant le même vocabulaire scientifique et technique. Cela implique dans un premier temps de clarifier les notions : qu’est-ce qu’un domaine ? Un support ? Un matériau ? Clarifier les données en les exprimant sous une forme commune et une sémantique commune. Exprimer sous une forme commune, une sémantique commune, clarifier les données. La question de l’identification est ici également cruciale. Nous avons une diversité de formes qui désignent une seule et même chose. Par exemple, les auteurs : il est indispensable d’avoir un référentiel d’auteur, avec un URI unique et pérenne. Cela préparera les données pour le web sémantique.

Comment HADOC fonctionne?

HADOC vise à engendrer un cadre normatif pour la production de données culturelles, via des modèles harmonisés, des référentiels partagés, des normes et des nomenclatures (standards). À terme, il faut faire émerger un référentiel des biens culturels qui serve à la fois à la production et à la diffusion. Une image pour mieux comprendre : il faut voir ces données comme la carte d’identité de l’objet. HADOC a été lancé en 2008. Les chantiers menés par le programme peuvent être perçus comme des briques : la brique « modèle de données », la brique « harmonisation des référentiels ». En 2013, une première version d’un modèle de données a été publiée. Notons que le modèle de production est très inspiré des modèles de diffusions tel le CIDOC CRM. Ce modèle a servi à la conversion d’un fonds pilote (la base Mérimée). Ce travail est encore en cours, ce qui n’a pas empêché ce modèle 1.0 (en UML) d’être utilisé lors de l’élaboration de la nouvelle base du MUCEM. Une seconde version est en préparation, car la confrontation à des cas concrets (Mérimée, archéologie) a enrichi le modèle. HADOC intègre déjà des relations « alignables », « mapables » pour la diffusion.

La seconde brique concerne la gestion des référentiels. Une centaine de vocabulaires sont présents dans les applications métiers. L’équipe les a exportés dans GINCO, un outil de gestion partagé. Un code ouvert a été développé sur la forge logicielle GITHUB afin de favoriser une démarche collaborative qui permet de traverser les métiers. À l’intérieur de GINCO, les vocabulaires ont été alignés (on ne fusionne pas les vocabulaires mais les aligne en créant des passerelles.) tout en respectant les normes et standards (ISO, SKOS, RDF).

Ce projet a été développé en an grâce à la méthode Agile : 15 jours de développement, une semaine d’application et ainsi de suite. Le résultat est accessible sur data.culture et peut s’intégrer à des applications métiers sous forme de briques de web-service. La version 2 intégrera l’alignement. Poursuite des chantiers de modélisation : description physique du bien numérique, ressource multimédia, production du schéma RDF, élaboration d’un référentiel d’acteurs. Le manque de personnel ralentit le travail.

Pour aller plus loin

Documentation

L’annotation, le texte et le web

Première conclusion de mes prospections sur l’annotation, publié début mai sur le blog de classe. 

Qu’est ce qu’une annotation?

Les dictionnaires donnent plusieurs définitions du mot annotation:

"Notes accompagnant un texte pour en fournir une explication ou une critique". 

( Dictionnaire de la langue française)

"Action de faire des remarques sur un texte pour l'expliquer ou le commenter ; ces remarques"

(Larousse)

"Remarques manuscrites notées en marge d'un texte."

(Dictionnaire du CNRTL)

Ces différentes définitions sont intéressantes en ce qu’elles divergent. Si tous s’accordent à designer l’annotation comme une remarque apposée en regard du texte, sa nature n’est pas bien claire. Sa forme tout d’abord : le CNRTL entend l’annotation comme une remarque manuscrite, tandis que le Larousse et le Dictionnaire de la langue française ne donnent pas de précision de cette nature. La note peut être en effet manuscrite (elle est apposée sur une exemplaire du livre) ou bien imprimée, dans le cas d’une édition critique par exemple. D’autre part, les trois dictionnaires n’appréhendent pas le contenu de la note de la même façon : le CNRLT ne dit rien de son contenu, tandis que le dictionnaire de la langue française et le Larousse s’essayent à le définir: une remarque d’explication ou de critique pour le premier, une remarque d’explication ou de commentaire pour le second.

Catherinas Ulysses photo : Henrik Berggren, licence CC BY-NC-SA 2.0

Catherinas Ulysses
photo : Henrik Berggren, licence CC BY-NC-SA 2.0

J’opterai temporairement pour une définition large qui mixe un peu les trois : « Remarques accompagnant un texte pour en fournir une explication ou un commentaire ».
Cette définition personnelle a des limites : l’explication n’est-elle pas un commentaire? Par ailleurs, elle appréhende l’annotation comme un texte apposé à un autre texte, excluant des pratiques d’inscription sur le texte, comme le surlignage, le soulignage ou l’apposition de signes, qui sont, à mon sens, des annotations, même si elles n’ont de sens que pour celui qui les traces et les relit.

L’annotation, un objet historique

La note en marge du texte, qu’elle soit imprimée ou manuscrite, n’est pas une chose insignifiante. Des gens s’y intéressent, font de la recherche à propos de la note, car elle porte les traces d’une histoire passionnante : celle de l’appropriation et de la circulation des savoirs, celle des pratiques de lecture.

L’annotation manuscrite, trace des pratiques de lecture

Les notes manuscrites dans les livres nous en apprennent beaucoup sur les manières de lire au passé. La lecture est une forme essentielle de l’appropriation des connaissances, de la construction des savoirs et de l’échange entre les intellectuels. Mais les pratiques de lecture ont été diverses et peu d’indices peuvent nous permettent de les appréhender. Les annotations sont une des plus précieuses sources car elles nous laissent deviner comment les lecteurs ont utilisés leur livres, les références qu’ils avaient en tête alors qu’ils lisaient…

Le projet de bibliothèque virtuelle Annotated Books Online (ABO) propose un espace de travail collaboratif pour les chercheurs qui étudient les livres annotés de l’époque moderne.

abo-screenshot-page

La note de bas de page

La note manuscrite, propre à un exemplaire et à un lecteur n’est pas la seule à intéresser les historiens du livre et du savoir. La note de bas de page aussi a beaucoup à raconter : les chercheurs y indiquent leurs sources (archives), une bibliographie indicative, qu’ils commentent parfois, revendiquent une appartenance à telle ou telle école, précisent l’historiographie du sujet qu’ils traitent… de façon plus ou moins subtile. Il existe tout un savoir faire et un savoir vivre de la note de bas de page.
Il y a, sur ce sujet, une référence incontournable, l’ouvrage d’Antony Grafton, « les origines tragiques de l’érudition, une histoire de la note en bas de page » que je lis actuellement.

Il me paraît indispensable d’avoir une vision de l’historiographie sur l’annotation pour appréhender au mieux mon stage. En effet, avec le numérique et le web, les pratiques d’annotation, comme celles de lecture, se renouvellent totalement. De ce fait, impossible de comprendre les usages de l’annotation dans l’univers numérique sans avoir un oeil dans le retro de l’histoire.

L’annotation à l’ère du numérique

Le numérique a totalement renversé et renouvelé les accès aux documents, les pratiques de lecture et bien sûr d’annotation.

Internet, le commentaire et la conversation

A l’heure du web 2.0, l’annotation a pris de nouvelles dimensions. L’internaute peut commenter un article de journal en ligne, un billet de blog… le commentaire, voici une forme d’annotation somme toute assez classique. Mais annoter sur le web prend de nouveaux biais: créer un lien entre deux ressources distinctes, géolocaliser une information, relayer une page sur les réseaux sociaux, voici d’autres manières d’annoter.

La dimension conversationnelle de l’annotation à l’ère du web est incontestable : le commentaire, la note sont vecteurs d’échanges. Pourtant, l’enrichissement des contenus que peuvent former les annotations sont encore peu ou mal exploitées (pas indexées par les moteurs de recherche, non interopérables, non récupérables)

Exemple d'annotations sur sobookonlines

Exemple d’annotations sur sobookonlines

L’annotation, l’avenir du commentaire

Nombreux sont ceux qui réfléchissent à l’amélioration du simple « commentaire » par des outils d’annotations plus puissants, capables de s’accrocher partout sur le net (sur un texte, une page, un fragment d’image) et offrant de nouveaux parcours de navigation. Si les outils se multiplient, aucune règle n’existe: les standards ne sont pas encore fixés. Une mission à laquelle le W3C travaille!

Présentation du stage

Au début de mon stage, j’avais, comme les autres étudiants de ma promotion, présenté succinctement au groupe mon stage, son cadre et ses objectifs. 

[Article publié en avril sur le blog de classe]

Éditer les guides de Paris

De la Renaissance à la Révolution a fleuri un genre littéraire particulier, celui des guides de Paris. Bavards ouvrages destinés à guider l’amateur ou le voyageur de passage dans les méandres de la capitale, ils sont à la fois répertoire topographique, comprenant la nomenclature des rues, un descriptif historique des monuments et une critique artistique des œuvres que la ville recèle. Ils forment de ce fait une source incomparable pour qui veut enquêter sur le Paris des XVIIe et XVIIIe siècles.

Bien que souvent cité, ce corpus demeure mal connu des chercheurs, car trop vaste et peu accessible. Ainsi, si le spécialiste des guides de Paris a établi une liste de 30 titres majeurs, ceux-ci ont donné lieu à quelques 300 éditions! Un même texte peut donc exister sous de multiples versions, enrichies, remaniées, corrigées par leur auteur ou par d’autres mains, parfois sur plusieurs décennies! De plus, ces ouvrages sont souvent découpés en plusieurs volumes de format modeste, ce qui en complexifie la consultation.

Deux pages de titre de Guides de Paris

Deux pages de titre de Guides de Paris

Face à une généalogie textuelle complexe et à des objets matériels peu maniables, les chercheurs se contentent souvent de ne consulter que les éditions les plus facilement accessibles (éditions numérisées, réimpressions modernes)…

En proposant une édition numérique de ces textes, le laboratoire souhaite donc les rendre plus accessibles et à renouveler l’approche qui en est faite.

Pistes de travail:

  • Les guides de Paris, quelle source pour les historiens? Comment une édition numérique pourrait-elle renouveler les approches? 
  • Les guides de Paris, un corpus complexe

Le Labex « Les passés dans le présent »

Le projet « Guides de Paris (les historiens des arts et les corpus numériques) » s’inscrit dans le LABEX « Les passés dans le présent«  de l’Université Paris X . Ce labex, qui s’attache « à comprendre les médiations de l’histoire à l’ère du numérique, les politiques de la mémoire, les appropriations sociales du passé en amont et en aval des politiques patrimoniales » porte une trentaine de projets, que vous pouvez découvrir en suivant ce lien.

Notre projet rassemble plusieurs partenaires.

  • La BnF, qui mène un programme de numérisation du fonds Z. Le Senne, consacré à l’histoire de Paris. C’est à partir de ces numérisations que les transcriptions et les encodages seront réalisés
  • Le laboratoire de linguistique MoDyCo, spécialisé dans le traitement automatique de la langue. Ce laboratoire va notamment apporter son expertise sur la reconnaissance des entités nommées, mais aussi sur les nouvelles formes d’éditorialisation.
  • Le projet MoDref également porté par le LABEX va collaborer à l’édition des guides: ce projet porte sur la modélisation et les référentiels, autant d’aspects auxquels nous serons confrontés.
  • Enfin, le laboratoire HAR (Histoire de l’art et des représentations), pilote le projet.

Des objectifs diversifiés

Le projet des « Guides de Paris » n’est pas seulement d’offrir une nouvelle édition de ces textes. Il s’agit aussi d’inventer une plateforme et des instruments numériques utiles et performants pour les chercheurs et de réfléchir plus largement aux apports du numérique à la discipline et à ses méthodes. En d’autres termes, comment le numérique fait évoluer le regard sur les textes, la manière de travailler des chercheurs.

Et ma mission dans tout cela ?

La mission qui m’a été confiée est double: d’une part, écrire un état de l’art des outils d’annotation et d’autre part proposer des scénarios d’usage de ces outils dans le cadre du projet d’édition des guides de Paris. Si le temps le permet, je devrais même développer un prototype!