Tag Archives: stage

Contexte – résumé du déroulé du stage

Mon mémoire s’inscrivant dans le prolongement de mon stage de fin d’études, en voici un résumé dans les grandes lignes. 

[À lire, le billet précédent où il était question du choix du stage de fin d’études]

Mon stage s’est déroulé du 1er avril au 31 juillet. Pendant les trois premiers mois, je n’y consacrais que 3/4 de ma semaine, ayant par ailleurs un job étudiant à mi-temps à l’INHA.

Ma mission lors de ce stage

Dans le cadre du projet « Guides de Paris », je suis chargée de produire un état de l’art des outils d’annotation numérique, de faire un benchmarking des outils disponibles qui semblaient appropriés à notre projet puis d’en tester deux ou trois. 

Ces prototypes me permettront de formuler plusieurs scénarios possibles d’utilisation des outils d’annotation dans le cadre du projet des Guides de Paris.

 Contrairement aux autres étudiants du master, mon stage ne débouche pas sur la réalisation d’un « produit fini » (base de données, édition encodée en XML/TEI, inventaire en EAD, exposition virtuelle) : mon travail ressemble plus à une étude de faisabilité et le mémoire est un des livrables que je dois rendre au Labex. 

Déroulé du stage

Au début du stage, nous avions fixé un calendrier assez strict pour le déroulé du stage… sur lequel j’ai rapidement pris du retard (le cumul d’un job et d’un stage n’est pas très évident).

Début avril : découvrir les guides de Paris

Dans un premier temps, je me suis familiarisée avec ce qu’on appelle les « guides de Paris » par un rapide survol bibliographique et la lecture de quelques travaux récents (Gilles Chabaud, Laurent Turcot, Daniel Roche…). Cela m’a permis de comprendre les enjeux autour de l’exploitation par les chercheurs de ce corpus. Les guides sont une source précieuse pour l’histoire de l’espace urbain, de l’art, de la société, mais également un objet d’étude à part entière, notamment comme forme littéraire ou phénomène éditorial. Les chercheurs qui s’intéressent aux guides de Paris sont issus de disciplines très diverses et les appréhendent avec des méthodologies très différentes. Le projet d’édition étant rattaché au laboratoire d’Histoire de l’art, nous interrogeons principalement le corpus sous cet angle, mais il est nécessaire de connaître les méthodes propres aux autres disciplines : d’une part, elles peuvent enrichir nos propres pratiques, d’autre part, l’édition ne doit pas se fermer aux besoins d’autres disciplines.

Mi-avril, un atelier de travail est venu conclure ce premier contact avec l’objet de l’édition. Marianne Cojeannot-Leblanc et Emmanuel Château organisaient un séminaire pour présenter le projet des Guides de Paris à leurs collègues et élèves du laboratoire HAR (histoire de l’art et des représentations). Il s’agissait d’expliquer les objectifs et la mise en œuvre de l’édition numérique, les enjeux, d’exposer les conclusions d’une première préfiguration faite par deux stagiaires du labo et surtout de recueillir les besoins, conseils, remarques de ceux que nous espérons être les futurs utilisateurs et contributeurs à l’édition.

Avril – début mai : comprendre ce qu’est une annotation, et comment le numérique appréhende l’annotation

Parallèlement, j’ai beaucoup lu sur la notion d’annotation et son renouvellement à l’ère d’internet. Il s’agissait surtout de comprendre les enjeux de l’annotation dans l’espace numérique : j’ai ainsi découvert que de nombreux chercheurs travaillaient sur cette question, que ce soit pour étudier les mécanismes de la lecture, d’appropriation du savoir, d’exploitation et de partage de ce dernier, ou pour prospecter sur les usages futurs, notamment en développant de nouveaux outils. Pour cette étape, le travail de Marc Jahjah, doctorant en sciences humaines, culture numérique et études littéraires, m’a été très précieux. En effet, Marc Jahjah a abordé à de nombreuses reprises la question de l’annotation sur son blog Marginalia : pratiques d’écriture et livre numérique. Il m’a également donné accès à son abondante documentation, ce dont je lui suis très reconnaissante.

Je me suis également intéressée aux travaux sur l’annotation avant l’ère numérique et à la manière dont les historiens l’avaient étudiée. Bien qu’un peu éloigné du cœur de mon stage, la lecture des travaux d’Anthony Grafton et la découverte des projets Annotated Books Online et « The Archaeology of Reading in Early Modern Europe » ont été très enrichissants.

Ces lectures m’ont permis de rédiger, début mai, une courte fiche sur l’annotation.

Mai-juin : panorama des outils d’annotation, benchmarking

J’ai d’abord essayé de lister tous les outils numériques permettant de faire de l’annotation en ligne. Rapidement le constat suivant s’est imposé : il en existe des centaines, et parmi eux, nombreux sont les outils obsolètes ou très limités. Beaucoup se contentent de reproduire, de façon très pauvre, le principe du stabilo ou du post-it, sans prendre en compte les spécificités de l’espace numérique (ne serait-ce que l’interopérabilité et le partage social…).

Ce travail de recensement, outre me donner une image d’ensemble des outils d’annotation, m’a permis de préciser mes critères de sélection. J’ai abondamment lu sur l’évaluation des outils d’annotation (il existe quelques articles sur la question) et je me suis beaucoup intéressée aux problématiques de normes et de standards d’annotation, sur lesquelles plusieurs groupes internationaux travaillent actuellement.

J’ai progressivement éliminé la plupart des outils pour me concentrer sur 6 outils à même (à première vue) de répondre à nos besoins. Il s’agissait d’Annotator, Annotation Studio, Annotopia, Domeo, Pundit et Textus. Après benchmarking (dont voici une très brève synthèse), nous avons décidé de retenir Pundit et Annotator pour les tests approfondis. Il aurait été intéressant d’y ajouter Annotopia, mais ce dernier n’est pas encore disponible.

De cette longue phase de travail, je vais tirer plusieurs livrables : un panorama général des outils d’annotation, une réflexion sur les critères d’évaluation et une présentation détaillée des 6 outils benchmarkés.

Juin-première quinzaine de juillet : installation de Pundit et d’Annotator

Cette phase a assurément été la plus difficile du stage : il s’agissait d’implémenter sur un serveur local Annotator et Pundit. Le premier n’a pas posé trop de problèmes (client javascript, serveur de stockage en python nécessitant elasticsearch), le second nous a en revanche donné beaucoup de fil à retordre (serveur Tomcat + java). Sans l’aide fréquente et patiente d’un proche dont l’informatique est le métier, j’aurais assurément échoué, tant les réglages sont délicats et les bugs nombreux.

Fin juillet, dernière phase : scénario d’utilisation

Les installations terminées, la dernière phase consiste à imaginer des scénarios d’utilisation de l’annotation dans le projet de recherche. Le test de Pundit et d’Annotator, en cours, est effectué sur quelques courts extraits des guides de Paris. Ils déboucheront sur la formulation de recommandations.

Il est maintenant temps de rédiger le mémoire ! 

Contexte du mémoire – stage de fin d’études

Avant de commencer à publier ici les morceaux de mon mémoire « en construction », il est nécessaire de revenir sur le contexte dans lequel il s’inscrit. Ces notes serviront probablement à l’élaboration de l’avant-propos et de l’introduction. 

Master 2 « Technologies numériques appliquées à l’Histoire »

Cette année, j’étais étudiante du master 2 « Technologies numériques appliquées à l’Histoire » proposé par l’École des Chartes. Pour résumer un peu rapidement, ce master forme des étudiants issus de parcours en sciences humaines (histoire, littérature, histoire de l’art) ou d’archivistique aux outils de traitement numériques des sources (techniques de numérisation, description des collections, publication électronique, pérennisation de l’information…). Les débouchés sont assez variés : bibliothèques, archives, musées, milieu universitaire (ingénieur d’étude ou de recherche).

Ayant déjà une licence d’histoire de l’art, une licence d’histoire et un master de recherche en muséologie, j’ai directement intégré la seconde année du master, entièrement consacrée au numérique (alors que le M1 présente un parcours plus classique « bibliothèque », « archives » ou « histoire de l’art »).

Stage de fin d’études et mémoire de stage

La majorité des étudiants du master optent en master 2 pour le parcours « professionnalisant », qui comprend, au second semestre, un stage de trois à six mois, qui débouche sur la rédaction d’un mémoire de stage.

Ce travail est entre le rapport de stage et le mémoire de recherche. Il doit dépasser la simple narration du déroulé du stage pour en faire une synthèse problématisée, articulant clairement enjeux scientifiques et solutions méthodologiques et informatiques.

Début 2014, une quarantaine d’offres de stage ont été proposées aux étudiants du master. Les missions retenues illustrent la diversité et la richesse des profils des étudiants : encodage en EAD d’inventaires d’archives, réalisations d’expositions numériques, édition numérique de manuscrits médiévaux, archivage électronique dans des entreprises privées, mise en place ou refonte de sites internet (pour des institutions publiques ou des médias journalistiques)…

Pour ma part, après bien des hésitations (plusieurs stages m’intéressaient), j’ai opté pour celui proposé par le Labex les passés dans le présent, portant sur un projet d’édition des Guides de Paris des XVIIe et XVIIIe siècles.

Projet d’édition des guides de Paris des XVIIe et XVIIIe siècles

Lancé en 2013, le projet Guides de Paris (les historiens des arts et les corpus numériques) vise à produire une édition critique électronique d’un ensemble de guides de Paris publiés à l’époque moderne et à faciliter l’accès à ces sources précieuses pour les historiens. Cette édition numérique, accompagnée d’outils puissants d’exploitation des textes, doit offrir de nouvelles perspectives d’études sur ces ouvrages et leur contenu.

Le projet est porté par le labex (Laboratoire d’excellence) les passés dans le présent de l’université Paris X-Nanterre. Il s’attache « à comprendre les médiations de l’histoire à l’ère du numérique, les politiques de la mémoire, les appropriations sociales du passé en amont et en aval des politiques patrimoniales« . Une trentaine de projets lui sont rattachés.

Mission du stage

L’édition du corpus des guides de Paris ne constitue pas une simple mise en ligne d’un texte encodé en XML/TEI. Les porteurs du projet souhaitent l’équiper d’un ensemble d’outils facilitant l’exploitation des textes par les chercheurs. Il s’agit notamment implémenter un outil d’annotation, qui permette l’indexation des contenus et le rapprochement des textes avec des ressources externes (photographie d’œuvres, cartes, archives).

Le stage proposé portait donc sur l’élaboration d’un état de l’art des outils d’annotation disponibles, le test de certains d’eux, et l’élaboration de scénario d’exploitation dans le cadre du projet. Il doit déboucher sur un mémoire (l’objet de cette série de billets donc).