Mon mémoire s’inscrivant dans le prolongement de mon stage de fin d’études, en voici un résumé dans les grandes lignes.
[À lire, le billet précédent où il était question du choix du stage de fin d’études]
Mon stage s’est déroulé du 1er avril au 31 juillet. Pendant les trois premiers mois, je n’y consacrais que 3/4 de ma semaine, ayant par ailleurs un job étudiant à mi-temps à l’INHA.
Ma mission lors de ce stage
Dans le cadre du projet « Guides de Paris », je suis chargée de produire un état de l’art des outils d’annotation numérique, de faire un benchmarking des outils disponibles qui semblaient appropriés à notre projet puis d’en tester deux ou trois.
Ces prototypes me permettront de formuler plusieurs scénarios possibles d’utilisation des outils d’annotation dans le cadre du projet des Guides de Paris.
Contrairement aux autres étudiants du master, mon stage ne débouche pas sur la réalisation d’un « produit fini » (base de données, édition encodée en XML/TEI, inventaire en EAD, exposition virtuelle) : mon travail ressemble plus à une étude de faisabilité et le mémoire est un des livrables que je dois rendre au Labex.
Déroulé du stage
Au début du stage, nous avions fixé un calendrier assez strict pour le déroulé du stage… sur lequel j’ai rapidement pris du retard (le cumul d’un job et d’un stage n’est pas très évident).
Début avril : découvrir les guides de Paris
Dans un premier temps, je me suis familiarisée avec ce qu’on appelle les « guides de Paris » par un rapide survol bibliographique et la lecture de quelques travaux récents (Gilles Chabaud, Laurent Turcot, Daniel Roche…). Cela m’a permis de comprendre les enjeux autour de l’exploitation par les chercheurs de ce corpus. Les guides sont une source précieuse pour l’histoire de l’espace urbain, de l’art, de la société, mais également un objet d’étude à part entière, notamment comme forme littéraire ou phénomène éditorial. Les chercheurs qui s’intéressent aux guides de Paris sont issus de disciplines très diverses et les appréhendent avec des méthodologies très différentes. Le projet d’édition étant rattaché au laboratoire d’Histoire de l’art, nous interrogeons principalement le corpus sous cet angle, mais il est nécessaire de connaître les méthodes propres aux autres disciplines : d’une part, elles peuvent enrichir nos propres pratiques, d’autre part, l’édition ne doit pas se fermer aux besoins d’autres disciplines.
Mi-avril, un atelier de travail est venu conclure ce premier contact avec l’objet de l’édition. Marianne Cojeannot-Leblanc et Emmanuel Château organisaient un séminaire pour présenter le projet des Guides de Paris à leurs collègues et élèves du laboratoire HAR (histoire de l’art et des représentations). Il s’agissait d’expliquer les objectifs et la mise en œuvre de l’édition numérique, les enjeux, d’exposer les conclusions d’une première préfiguration faite par deux stagiaires du labo et surtout de recueillir les besoins, conseils, remarques de ceux que nous espérons être les futurs utilisateurs et contributeurs à l’édition.
Avril – début mai : comprendre ce qu’est une annotation, et comment le numérique appréhende l’annotation
Parallèlement, j’ai beaucoup lu sur la notion d’annotation et son renouvellement à l’ère d’internet. Il s’agissait surtout de comprendre les enjeux de l’annotation dans l’espace numérique : j’ai ainsi découvert que de nombreux chercheurs travaillaient sur cette question, que ce soit pour étudier les mécanismes de la lecture, d’appropriation du savoir, d’exploitation et de partage de ce dernier, ou pour prospecter sur les usages futurs, notamment en développant de nouveaux outils. Pour cette étape, le travail de Marc Jahjah, doctorant en sciences humaines, culture numérique et études littéraires, m’a été très précieux. En effet, Marc Jahjah a abordé à de nombreuses reprises la question de l’annotation sur son blog Marginalia : pratiques d’écriture et livre numérique. Il m’a également donné accès à son abondante documentation, ce dont je lui suis très reconnaissante.
Je me suis également intéressée aux travaux sur l’annotation avant l’ère numérique et à la manière dont les historiens l’avaient étudiée. Bien qu’un peu éloigné du cœur de mon stage, la lecture des travaux d’Anthony Grafton et la découverte des projets Annotated Books Online et « The Archaeology of Reading in Early Modern Europe » ont été très enrichissants.
Ces lectures m’ont permis de rédiger, début mai, une courte fiche sur l’annotation.
Mai-juin : panorama des outils d’annotation, benchmarking
J’ai d’abord essayé de lister tous les outils numériques permettant de faire de l’annotation en ligne. Rapidement le constat suivant s’est imposé : il en existe des centaines, et parmi eux, nombreux sont les outils obsolètes ou très limités. Beaucoup se contentent de reproduire, de façon très pauvre, le principe du stabilo ou du post-it, sans prendre en compte les spécificités de l’espace numérique (ne serait-ce que l’interopérabilité et le partage social…).
Ce travail de recensement, outre me donner une image d’ensemble des outils d’annotation, m’a permis de préciser mes critères de sélection. J’ai abondamment lu sur l’évaluation des outils d’annotation (il existe quelques articles sur la question) et je me suis beaucoup intéressée aux problématiques de normes et de standards d’annotation, sur lesquelles plusieurs groupes internationaux travaillent actuellement.
J’ai progressivement éliminé la plupart des outils pour me concentrer sur 6 outils à même (à première vue) de répondre à nos besoins. Il s’agissait d’Annotator, Annotation Studio, Annotopia, Domeo, Pundit et Textus. Après benchmarking (dont voici une très brève synthèse), nous avons décidé de retenir Pundit et Annotator pour les tests approfondis. Il aurait été intéressant d’y ajouter Annotopia, mais ce dernier n’est pas encore disponible.
De cette longue phase de travail, je vais tirer plusieurs livrables : un panorama général des outils d’annotation, une réflexion sur les critères d’évaluation et une présentation détaillée des 6 outils benchmarkés.
Juin-première quinzaine de juillet : installation de Pundit et d’Annotator
Cette phase a assurément été la plus difficile du stage : il s’agissait d’implémenter sur un serveur local Annotator et Pundit. Le premier n’a pas posé trop de problèmes (client javascript, serveur de stockage en python nécessitant elasticsearch), le second nous a en revanche donné beaucoup de fil à retordre (serveur Tomcat + java). Sans l’aide fréquente et patiente d’un proche dont l’informatique est le métier, j’aurais assurément échoué, tant les réglages sont délicats et les bugs nombreux.
Fin juillet, dernière phase : scénario d’utilisation
Les installations terminées, la dernière phase consiste à imaginer des scénarios d’utilisation de l’annotation dans le projet de recherche. Le test de Pundit et d’Annotator, en cours, est effectué sur quelques courts extraits des guides de Paris. Ils déboucheront sur la formulation de recommandations.
Il est maintenant temps de rédiger le mémoire !