|

2.2.3.  Synthèse et comparaison des outils (1)

1 Commenter le paragraphe 1 0

2.2.3.1.  Présentation des outils benchmarkées

  • Annotator

2 Commenter le paragraphe 2 7 Soutenu par l’Open Knowledge Foundation, Annotator est un outil d’annotation open source. Il s’agit d’une librairie JavaScript extensible grâce à des plug-ins et implémentable sur tout type de site web. Annotator permet de construire de produire des annotations libres. Celles-ci peuvent être taguées ou motivées par un typage conforme aux pré-spécifications de l’Open Annotation (plug-in « motivation » : commentaire, indexation). Le plug-in « permission » gère de façon fine les droits d’édition et d’affichage des annotations. Le plug-in « Annotorious », développé par l’Institut autrichien de la technologie étend les fonctionnalités à l’annotation d’images ou de fragments d’images.

3 Commenter le paragraphe 3 1 Annotator repose sur une architecture modulaire facilement extensible. Côté client, il s’appuie sur les langages Json et sur la bibliothèque JQuery. Côté serveur, le langage employé est python. Les échanges entre le serveur et le client sont assurés par l’architecture REST.

4 Commenter le paragraphe 4 2 Annotator permet de traiter des ressources exposées en HTML. Les annotations générées sont stockées dans le format Json sur des serveurs distants hébergés par le web service AnnotateIt (qui repose lui-même sur Annotator) ou indépendants. Le pointage des fragments annotés se fait par XPATH.

5 Commenter le paragraphe 5 3 Annotator est le prolongement d’un outil développé dès 2009/2010 dans le cadre du projet Open Shakespeare. Il est soutenu par une communauté nombreuse et active et dispose d’une documentation abondante et de bonne qualité. L’outil est décliné sous forme de plug-in pour WordPress et Durpal (celui de WordPress est néanmoins défectueux). Il est diffusé de façon gratuite sous la licence MIT Open source.

6 Commenter le paragraphe 6 0 Sur le site officiel, une douzaine de projets reposant sur Annotator sont présentés. Beaucoup sont des outils développés dans le cadre pédagogique par le MIT, Harvard et Berkeley : il s’agit d’instruments pour la notation de travaux d’étudiants, pour la création de manuels et ressources scolaires ou encore pour la mise à disposition de cours gratuits. Annotator est employé dans des projets d’éditions en ligne comme WritingProd. Enfin, il est utilisé pour le commentaire sur des publications universitaires (Peerlibrary et Hypothes.is) et sur des sources textuelles. Ainsi, l’Institut Max Planck pour l’histoire des sciences soutient une série de projets d’annotation de livres, de textes et d’images numérisés.

  • Annotation Studio

8 Commenter le paragraphe 8 2 Développé par HyperStudio au MIT, Annotation Studio est un environnement de travail outillé qui comprend notamment une fonction d’annotation de texte. Il se présente comme un « cabinet d’annotation » par analogie avec le cabinet de l’humaniste. Il repose en grande partie sur le système Annotator, qu’il associe à d’autres outils. Cette application a été pensée pour la lecture et l’interprétation collaborative et en ligne de corpus textuels en sciences humaines, d’abord dans une perspective pédagogique, mais qui peut également être employé pour la recherche.

9 Commenter le paragraphe 9 2 Annotation Studio propose une plateforme dans laquelle il est possible d’héberger des textes et de les annoter. Comme dans Annotator, dont il dérive, il permet de créer des annotations libres, qui peuvent être taguées. De même, les droits d’accès et de modifications peuvent être finement gérés. Les utilisateurs peuvent charger dans la plateforme des ressources externes : vidéos, textes, images, liens et annoter ceux-ci.

10 Commenter le paragraphe 10 7 Annotation Studio présente une architecture modulaire. Coté clients, les langages employés sont HTML/CSS/JavaScript. Coté serveur, il s’agit de Ruby on Rail et d’une base de données en Postgre SQL. Annotation Studio encapsule des textes versés en world ou en format TXT. Les annotations sont encodées dans le format JSON. Le stockage de ces dernières s’effectue sur une base de donnée MangoDB par l’intermédiaire d’une API REST. La localisation des fragments commentés se fait par XPATH.

11 Commenter le paragraphe 11 3 La documentation disponible prend essentiellement la forme d’un tutoriel d’utilisation de la plateforme implémenté sur le site d’annotation studio, c’est-à-dire de sa version service web. En revanche, peu d’informations existent sur la façon de l’implémenter sur d’autres serveurs. Par ailleurs, l’activité de la communauté est assez faible, ce qui s’explique aisément : nous sommes en présence d’un service web dont les consommateurs sont des universitaires et des étudiants. Il existe un forum, mais celui-ci est peu fréquenté : il totalise une cinquantaine de messages seulement, dont moins de la moitié concernent l’implémentation ou le développement de l’outil. Annotation Studio est disponible gratuitement en open source sous la licence GPL2.

12 Commenter le paragraphe 12 2 En 2012, la plateforme a été testée dans deux classes de littérature du MIT : ces exemples sont documentés sur le site de HyperStudio. Au labex les passés dans le présent, la plateforme est testée dans le cadre de l’édition des registres de la Comédie Française.

  • Domeo

14 Commenter le paragraphe 14 2 Domeo (Document Metadata Exchange Organize) est une plateforme d’annotation développée entre 2010 et 2014 par le Massachusetts general Hospital. Il se présente comme une application web extensible pour créer et partager facilement des annotations basées sur des ontologies partagées.

15 Commenter le paragraphe 15 0 L’outil présente une interface de travail permettant de créer des annotations libres ou structurées. Il offre un système très poussé de contrôle des accès et droits sur les annotations. Parmi ses fonctionnalités, il offre d’annoter des textes comme des images, de gérer des informations bibliographiques. Enfin, il comprend un module d’annotation semi-automatique.

16 Commenter le paragraphe 16 0 Domeo présente une architecture modulaire très complexe, juxtaposant de nombreuses briques. Il permet d’annoter des ressources en HTML et XML. Les annotations produites sont stockées en RDF. Les ontologies convoquées doivent être exprimées en SKOS ou OWL. Domeo respecte les standards en cours de construction d’Open Annotation.

17 Commenter le paragraphe 17 0 Malheureusement, peu d’informations sont disponibles sur les aspects techniques de Domeo. La documentation est inaccessible et seuls sont disponibles des tutoriels vidéos d’utilisation. La licence de diffusion n’est pas connue et il semble impossible de tester l’outil en ligne.

18 Commenter le paragraphe 18 0 Cela s’explique aisément : Domeo a été développé activement entre 2010 et août 2013 (version 2 alpha). Depuis, le projet a été abandonné au profit d’un second, Annotopia, porté par la même équipe. En effet, l’équipe de développement avait conclu que Doméo, implémentant trop d’outils était devenu trop lourd. Ils cherchent donc à proposer une nouvelle architecture, plus modulaire et ouverte. Annotopia formera le serveur et Domeo le client.

19 Commenter le paragraphe 19 0 Paolo Circacess, principal acteur du projet est un membre actif d’Open Annotation. Il a publié à de nombreuses reprises à propos de Domeo et de Annotopia.

  • Annotopia

21 Commenter le paragraphe 21 0 Annotopia est un serveur d’annotation développé depuis 2014 par le Massachusetts General Hospital. Il reprend une grande partie des fonctionnalités de Domeo, auquel il est très lié : nous ne les réénumérons pas.

22 Commenter le paragraphe 22 1 Il permettra d’annoter du HTML, des PDF et des images. Les annotations seront stockées en json LD. Annotopia pourra fonctionner avec des clients tels qu’Annotator, Domeo ou Utopia. Le serveur est un troplestore plus elastic search. Pointage par URI.

23 Commenter le paragraphe 23 4 Il est à noter que Annotopia a reçu un important financement de deux ans par la Mellon Foundation et d’Elesevir. Alors que domeo était uniquement tourné vers les problématiques propres à la médecine et à la biologie, Annotopia entend être accessible à un plus grand nombre de projets. Cependant, il est à regretter que peu de documentation ne soit pour l’instant accessible. Le compte Github est régulièrement mis à jour. La version 3 d’Annotopia sera disponible fin 2014 sous une licence Appache 2.0.

  • Pundit

25 Commenter le paragraphe 25 0 Pundit est un système web d’annotation sémantique permettant aux utilisateurs d’annoter des pages web et de lier ces notes à d’autres pages ou objets web.

26 Commenter le paragraphe 26 0 Ne se contentant pas de proposer de simples annotations en texte libre, Pundit offre également de produire des annotations structurées riches et sémantisées, en incluant des vocabulaires contrôlés. Parmi ses nombreuses fonctionnalités, Pundit permet de typer les annotations, de gérer de façon très fine les droits d’accès et de modification, mais aussi d’annoter des images. Enfin, Pundit intègre un module de reconnaissance des entités nommées.

27 Commenter le paragraphe 27 0 Pundit présente une architecture modulaire. Elle comprend un client d’annotation en JavaScript qui communique avec un serveur de stockage via une API Rest. Le serveur de stockage repose sur les technologies Tomcat 6, Javaservlet et MySQL.

28 Commenter le paragraphe 28 1 Pundit peut annoter toutes sortes de formats : HTML, images, segments de RDFa exprimant des idXML. Le pointage s’effectue par URI et Xpointer. Tous les fragments de ressources sont copiés et stockés dans Pundit. Les annotations quant à elles sont exprimées sous forme de graphes RDF stockées dans un serveur triplestore Sesame.

29 Commenter le paragraphe 29 0 La gestion des référentiels s’effectue dans un autre module, Korbo. Ces référentiels peuvent être exprimés en Skos/OWL et RDFs.

30 Commenter le paragraphe 30 0 Pundit est développé par la PME italienne Net7 en partenariat avec l’université de Trente ( ?). Le projet bénéficie d’un financement européen dans le cadre du programme SEMLIB (« Sementi tools for digital librairies ») dont le but est de mettre au point des outils facilitant la publication, l’exploitation et la recherche au sein de corpus de données. De ce fait, le développement de Pundit a associé des techniciens et des chercheurs en SHS, parmi lesquels plusieurs historiens. L’outil est donc clairement orienté vers la recherche scientifique sur le patrimoine culturel.

31 Commenter le paragraphe 31 0 Pundit est encore en développement. Si le compte github n’a pas été mis à jour depuis février 2014, l’équipe de SemLib semble se concentrer actuellement sur le développement de Korbo. La documentation disponible sur l’outil d’annotation est relativement faible. En effet, s’il existe de nombreux tutoriels d’utilisation sur le site de Pundit, la documentation pour les développeurs reste limitée et complexe.

32 Commenter le paragraphe 32 1 Pundit est open source. Cependant, si le client est publié sous licence AGPL 3.0, le serveur Pundit est marqué d’un embargo : une licence commerciale sanctionne la version la plus récente pendant les 6 mois qui suivent sa parution.

  • Textus

34 Commenter le paragraphe 34 0 Textus est en environnement d’annotation conçu pour l’analyse collaborative autour des textes historiques et culturels. Conçu à des fins pédagogiques pour des étudiants en SHS, il peut-être utilisé par des chercheurs et des enseignants.

35 Commenter le paragraphe 35 2 Textus propose une plateforme dans laquelle héberger des textes et les annoter de façon libre.

36 Commenter le paragraphe 36 1 Reposant sur une architecture modulaire, Textus se divise en quatre briques : textus formatter, qui permet la conversion des textes dans un format json ; textus viewer, qui gère l’affichage des annotations ; textus frontend, qui permet l’implémentation dans wordpress et un magasin d’annotation (actuellement annotateit). Coté serveur, Textus fonctionne grâce à node.js et elasticsearch tandis que coté client, le langage employé est JavaScript.

37 Commenter le paragraphe 37 3 Les textes, versés par l’utilisateur sous format TXT dans la plateforme, sont enregistrés sous format json. La structuration et la typographie son géré à part, également en json. Les annotations sont dans le même format : le pointage se fait par comptage des caractères.

38 Commenter le paragraphe 38 0 Textus est disponible gratuitement sous la licence MIT.

39 Commenter le paragraphe 39 0 Cet outil est le résultat de 6 ans de développement sous l’égide de l’Open Knowledge foundation en associant des chercheurs et étudiants de plusieurs universités anglophones (parmi lesquelles Oxford et Goldsmiths). Bien que développé par l’OFK, Textus ne repose pas sur Annotator. L’équipe de Textus était très active en 2012, année où le projet avait reçue un financement de Jisc, un organisme encourageant l’utilisation des technologies numériques dans l’enseignement et la recherche au Royaume-Uni. L’année suivante, l’outil a connu une importante refonte de son architecture. Depuis, l’activité est assez faible (la dernière mise à jour du compte Github date de décembre 2013) et l’activité sur les listes de diffusion associée au projet est également très ralentie. La documentation du projet est abondante, mais présente deux gros défauts : elle n’est pas centralisée et n’a pas été mise correctement à jour au moment de la refonde de l’outil. Des documentations fragmentaires et contradictoires coexistent, sans être explicitement rattachées à l’une ou l’autre des versions du projet.

40 Commenter le paragraphe 40 0 Textus a été expérimenté sur plusieurs projets. En 2012, notamment, l’outil a été testé en bêta sur Open Philosophie. Actuellement, il n’est pas possible d’accéder au résultat (ajouter note).

Page 21

Source :http://johannadaniel.fr/memoire/?page_id=90