Tag Archives: annotation

Mise en ligne de mon mémoire sur les outils d’annotation

En septembre 2014, j’ai soutenu mon mémoire, somme de mes recherches sur les outils d’annotations pour l’édition scientifique de corpus textuels. Le texte et les planches de ce travail sont désormais en ligne. 

Memoire

 

La version numérique se compose de deux fichiers : le volume de texte et le volume de planches. Dans la version papier, ces dernières sont placées en regard du texte. La liste des annexes (à consulter en ligne sur Github) est adjointe au volume de planches, tout comme un tableau comparatif des 6 outils d’annotation testés.

Je précise qu’il s’agit d’une version corrigée : le texte a été nettoyé de quelques coquilles, deux graphiques ont été repris et la conclusion a été réécrite.

Pour en savoir plus sur mon mémoire, consultez la page dédiée.

Pour télécharger les fichiers ou les consulter en ligne sur Slideshare : 

Annotator – un outil d’annotation

Annotator est l’un des outils d’annotation que j’ai étudié dans le cadre de mon mémoire de fin d’études. Il s’agit d’une librairie JavaScript open source et extensible, qui peut être implémentée tel quel sur un site web ou servir au développement d’un environnement de travail. Le développement d’Annotator est soutenu par l’Open Knowledge Foundation et est utilisé dans de nombreux projets.

Annotator-logo

Fonctionnalités

Annotator est un outil d’annotation open source. Il s’agit d’une librairie JavaScript extensible grâce à des plug-ins et implémentable sur tout type de site web. Annotator permet de produire des annotations libres sur des ressources textuelles. Les annotations peuvent être taguées à l’aide d’étiquettes (folksonomie) et motivée par un typage conforme aux pré-spécifications de l’Open annotation Community group (via le plug-in « motivation »). Le plug-in « permission » permet de gérer les droits d’édition et d’affichage des annotations (affichage privé ou public, droit de lecture, modification ou suppression). Le plug-in « Annotorious », développé par l’Institut autrichien de la technologie étend les fonctionnalités à l’annotation d’images et de fragments d’images.

Test d'Annotator

Test d’Annotator

Continue reading

Installer le client Annotator – tutoriel

note : ce billet a été publié avant que je découvre la fonction « code » dans wordpress. Toutes mes excuses pour les captures d’écran d’une piètre qualité. [NB : voir ma présentation d’Annotator, publiée depuis]

Qu’est-ce qu’Annotator?

Annotator est un outil d’annotation, développé par l’Open Knowledge Foundation. Coté client, il se présente comme une librairie javascript. Les annotations produites sont stockées en Json soit sur les serveurs du web service AnnotateIt soit sur des serveurs indépendants.

Annotator-logo

Pour mes premiers tests, j’ai décidé de l’implémenter Annotator sur une page web toute simple en confiant à AnnotateIt le soin de stocker mes annotations.

Installer le client Annotator

Ma page de base

Au début, j’ai testé de suivre le tutoriel proposé sur la doc d’annotator, sans succès. J’ai donc pris le code source d’une page qui fonctionnait (la démo) et l’ai bidouillée jusqu’à bien comprendre le mécanisme.

Page_Texte_Brice

Appeler et lier la librairie d’Annotator.

La première chose à faire est d’appeler la librairie d’Annotator : il est possible d’appeler la bibliothèque hébergée sur les serveurs d’annotateIt ou de l’installer sur ses propres serveurs (il faut d’abord les télécharger, puis les placer sur le serveur).

Deux exemples :

Il vaut mieux héberger soit même la librairie afin de se prémunir d’un lien mort ou d’une panne de service.

Voici structure de mon répertoire :

La structure de mon répertoire www. Les deux fichiers HTML le test (en bas) + le dossier javascript dans lequel j'ai stocké les fichiers téléchargés : la bibliothèque annotator et sa css et la bibliothèque showdown.

La structure de mon répertoire www. Les deux fichiers HTML le test (en bas) + le dossier javascript dans lequel j’ai stocké les fichiers téléchargés : la bibliothèque annotator et sa css et la bibliothèque showdown.

Dans tous les cas, il est proposé plusieurs « package » : soit d’installer tout l’outil (noyau + plugin -> fonctionnalités optionnelles) soit le noyau seulement (et d’ajouter les plugins à la main). Ici, nous allons utiliser la version complète (annotator-full.min.js).

Pour appeler la librairie annotator, il faut ajouter la ligne de code suivante à la fin de body  :

Brice_appel

Mais pour fonctionner, la librairie annotator a besoin de la librairie JQuery (1.6 ou sup) : j’ajoute donc juste avant la ligne de code suivante :

Brice_JQuery

Il faut aussi que j’ajoute la feuille des style propre à la librairie Annotator. Cette ligne de code là doit être placée dans le header:

Brice_Header

Faire fonctionner annotator.

A ce stade, je n’ai fait qu’appeler les librairies, elles ne sont pas opérationnelles. Pour les faire fonctionner, je dois ajouter la ligne de code suivante entre l’appel des librairies et la balise fermante de body :

Brice_Script

Par cette commande, Annotator va pouvoir annoter le contenu situé dans des balises <div id= »content »> -> je les ajoute autour de mon corps de texte

Magique ça, fonctionne!

Annotator_demo

Code source commenté :

Page_Brice

Vous pouvez vous même tester ici: http://pecccadille.alwaysdata.net/BriceSaintGervais.html (mais il faut d’abord vous créer un compte sur AnnotateIt – gratuit)

L’annotation, le texte et le web

Première conclusion de mes prospections sur l’annotation, publié début mai sur le blog de classe. 

Qu’est ce qu’une annotation?

Les dictionnaires donnent plusieurs définitions du mot annotation:

"Notes accompagnant un texte pour en fournir une explication ou une critique". 

( Dictionnaire de la langue française)

"Action de faire des remarques sur un texte pour l'expliquer ou le commenter ; ces remarques"

(Larousse)

"Remarques manuscrites notées en marge d'un texte."

(Dictionnaire du CNRTL)

Ces différentes définitions sont intéressantes en ce qu’elles divergent. Si tous s’accordent à designer l’annotation comme une remarque apposée en regard du texte, sa nature n’est pas bien claire. Sa forme tout d’abord : le CNRTL entend l’annotation comme une remarque manuscrite, tandis que le Larousse et le Dictionnaire de la langue française ne donnent pas de précision de cette nature. La note peut être en effet manuscrite (elle est apposée sur une exemplaire du livre) ou bien imprimée, dans le cas d’une édition critique par exemple. D’autre part, les trois dictionnaires n’appréhendent pas le contenu de la note de la même façon : le CNRLT ne dit rien de son contenu, tandis que le dictionnaire de la langue française et le Larousse s’essayent à le définir: une remarque d’explication ou de critique pour le premier, une remarque d’explication ou de commentaire pour le second.

Catherinas Ulysses photo : Henrik Berggren, licence CC BY-NC-SA 2.0

Catherinas Ulysses
photo : Henrik Berggren, licence CC BY-NC-SA 2.0

J’opterai temporairement pour une définition large qui mixe un peu les trois : « Remarques accompagnant un texte pour en fournir une explication ou un commentaire ».
Cette définition personnelle a des limites : l’explication n’est-elle pas un commentaire? Par ailleurs, elle appréhende l’annotation comme un texte apposé à un autre texte, excluant des pratiques d’inscription sur le texte, comme le surlignage, le soulignage ou l’apposition de signes, qui sont, à mon sens, des annotations, même si elles n’ont de sens que pour celui qui les traces et les relit.

L’annotation, un objet historique

La note en marge du texte, qu’elle soit imprimée ou manuscrite, n’est pas une chose insignifiante. Des gens s’y intéressent, font de la recherche à propos de la note, car elle porte les traces d’une histoire passionnante : celle de l’appropriation et de la circulation des savoirs, celle des pratiques de lecture.

L’annotation manuscrite, trace des pratiques de lecture

Les notes manuscrites dans les livres nous en apprennent beaucoup sur les manières de lire au passé. La lecture est une forme essentielle de l’appropriation des connaissances, de la construction des savoirs et de l’échange entre les intellectuels. Mais les pratiques de lecture ont été diverses et peu d’indices peuvent nous permettent de les appréhender. Les annotations sont une des plus précieuses sources car elles nous laissent deviner comment les lecteurs ont utilisés leur livres, les références qu’ils avaient en tête alors qu’ils lisaient…

Le projet de bibliothèque virtuelle Annotated Books Online (ABO) propose un espace de travail collaboratif pour les chercheurs qui étudient les livres annotés de l’époque moderne.

abo-screenshot-page

La note de bas de page

La note manuscrite, propre à un exemplaire et à un lecteur n’est pas la seule à intéresser les historiens du livre et du savoir. La note de bas de page aussi a beaucoup à raconter : les chercheurs y indiquent leurs sources (archives), une bibliographie indicative, qu’ils commentent parfois, revendiquent une appartenance à telle ou telle école, précisent l’historiographie du sujet qu’ils traitent… de façon plus ou moins subtile. Il existe tout un savoir faire et un savoir vivre de la note de bas de page.
Il y a, sur ce sujet, une référence incontournable, l’ouvrage d’Antony Grafton, « les origines tragiques de l’érudition, une histoire de la note en bas de page » que je lis actuellement.

Il me paraît indispensable d’avoir une vision de l’historiographie sur l’annotation pour appréhender au mieux mon stage. En effet, avec le numérique et le web, les pratiques d’annotation, comme celles de lecture, se renouvellent totalement. De ce fait, impossible de comprendre les usages de l’annotation dans l’univers numérique sans avoir un oeil dans le retro de l’histoire.

L’annotation à l’ère du numérique

Le numérique a totalement renversé et renouvelé les accès aux documents, les pratiques de lecture et bien sûr d’annotation.

Internet, le commentaire et la conversation

A l’heure du web 2.0, l’annotation a pris de nouvelles dimensions. L’internaute peut commenter un article de journal en ligne, un billet de blog… le commentaire, voici une forme d’annotation somme toute assez classique. Mais annoter sur le web prend de nouveaux biais: créer un lien entre deux ressources distinctes, géolocaliser une information, relayer une page sur les réseaux sociaux, voici d’autres manières d’annoter.

La dimension conversationnelle de l’annotation à l’ère du web est incontestable : le commentaire, la note sont vecteurs d’échanges. Pourtant, l’enrichissement des contenus que peuvent former les annotations sont encore peu ou mal exploitées (pas indexées par les moteurs de recherche, non interopérables, non récupérables)

Exemple d'annotations sur sobookonlines

Exemple d’annotations sur sobookonlines

L’annotation, l’avenir du commentaire

Nombreux sont ceux qui réfléchissent à l’amélioration du simple « commentaire » par des outils d’annotations plus puissants, capables de s’accrocher partout sur le net (sur un texte, une page, un fragment d’image) et offrant de nouveaux parcours de navigation. Si les outils se multiplient, aucune règle n’existe: les standards ne sont pas encore fixés. Une mission à laquelle le W3C travaille!

Présentation du stage

Au début de mon stage, j’avais, comme les autres étudiants de ma promotion, présenté succinctement au groupe mon stage, son cadre et ses objectifs. 

[Article publié en avril sur le blog de classe]

Éditer les guides de Paris

De la Renaissance à la Révolution a fleuri un genre littéraire particulier, celui des guides de Paris. Bavards ouvrages destinés à guider l’amateur ou le voyageur de passage dans les méandres de la capitale, ils sont à la fois répertoire topographique, comprenant la nomenclature des rues, un descriptif historique des monuments et une critique artistique des œuvres que la ville recèle. Ils forment de ce fait une source incomparable pour qui veut enquêter sur le Paris des XVIIe et XVIIIe siècles.

Bien que souvent cité, ce corpus demeure mal connu des chercheurs, car trop vaste et peu accessible. Ainsi, si le spécialiste des guides de Paris a établi une liste de 30 titres majeurs, ceux-ci ont donné lieu à quelques 300 éditions! Un même texte peut donc exister sous de multiples versions, enrichies, remaniées, corrigées par leur auteur ou par d’autres mains, parfois sur plusieurs décennies! De plus, ces ouvrages sont souvent découpés en plusieurs volumes de format modeste, ce qui en complexifie la consultation.

Deux pages de titre de Guides de Paris

Deux pages de titre de Guides de Paris

Face à une généalogie textuelle complexe et à des objets matériels peu maniables, les chercheurs se contentent souvent de ne consulter que les éditions les plus facilement accessibles (éditions numérisées, réimpressions modernes)…

En proposant une édition numérique de ces textes, le laboratoire souhaite donc les rendre plus accessibles et à renouveler l’approche qui en est faite.

Pistes de travail:

  • Les guides de Paris, quelle source pour les historiens? Comment une édition numérique pourrait-elle renouveler les approches? 
  • Les guides de Paris, un corpus complexe

Le Labex « Les passés dans le présent »

Le projet « Guides de Paris (les historiens des arts et les corpus numériques) » s’inscrit dans le LABEX « Les passés dans le présent«  de l’Université Paris X . Ce labex, qui s’attache « à comprendre les médiations de l’histoire à l’ère du numérique, les politiques de la mémoire, les appropriations sociales du passé en amont et en aval des politiques patrimoniales » porte une trentaine de projets, que vous pouvez découvrir en suivant ce lien.

Notre projet rassemble plusieurs partenaires.

  • La BnF, qui mène un programme de numérisation du fonds Z. Le Senne, consacré à l’histoire de Paris. C’est à partir de ces numérisations que les transcriptions et les encodages seront réalisés
  • Le laboratoire de linguistique MoDyCo, spécialisé dans le traitement automatique de la langue. Ce laboratoire va notamment apporter son expertise sur la reconnaissance des entités nommées, mais aussi sur les nouvelles formes d’éditorialisation.
  • Le projet MoDref également porté par le LABEX va collaborer à l’édition des guides: ce projet porte sur la modélisation et les référentiels, autant d’aspects auxquels nous serons confrontés.
  • Enfin, le laboratoire HAR (Histoire de l’art et des représentations), pilote le projet.

Des objectifs diversifiés

Le projet des « Guides de Paris » n’est pas seulement d’offrir une nouvelle édition de ces textes. Il s’agit aussi d’inventer une plateforme et des instruments numériques utiles et performants pour les chercheurs et de réfléchir plus largement aux apports du numérique à la discipline et à ses méthodes. En d’autres termes, comment le numérique fait évoluer le regard sur les textes, la manière de travailler des chercheurs.

Et ma mission dans tout cela ?

La mission qui m’a été confiée est double: d’une part, écrire un état de l’art des outils d’annotation et d’autre part proposer des scénarios d’usage de ces outils dans le cadre du projet d’édition des guides de Paris. Si le temps le permet, je devrais même développer un prototype!