|

2.2.3.  Synthèse et comparaison des outils (2)

2.2.3.2. Synthèse du benchmarking

1 Commenter le paragraphe 1 3 Rassembler les informations sur chaque outil et documenter le tableau de benchmarking a formé un exercice long. Le résultat est peu satisfaisant du fait que de nombreuses réponses demeurent approximatives faute d’informations fiables. Il convient néanmoins d’en faire la synthèse.

2 Commenter le paragraphe 2 4 Tout d’abord, soulignons que le benchmarking a révélé que nous avions à faire à des outils très différents. Certains sont des outils d’annotation implémentable sur un site web ou utilisable comme bookmarklet intégré dans le navigateur (Pundit, Annotator). D’autres, comme Textus et Annotation Studio forment des environnements de travail dans lesquels l’usager verse ses textes afin de pouvoir les annoter : dans ce cas, un format pivot (markdown, TXT, PDF) et un affichage type sont souvent imposés. J’avais d’emblée écarté, au moment de la présélection en vue du benchmarking d’autres outils de ce type (Co-ment, E-margin), car ce mode de fonctionnement est plus adapté à un usage scolaire ou interne qu’à une publication électronique scientifique diffusée auprès du public, pour laquelle nous avons des exigences en matière de granularité de l’information et d’affichage.

3 Commenter le paragraphe 3 2 Il est à noter que chacun de ces outils a été développé dans des optiques différentes. Annotatorse veut une « mécanique » générique pour construire des outils d’annotation adaptés à différents usages. Annotation Studio et Textus sont adaptés à un travail scolaire (pédagogie) ou à des projets de recherche, mais uniquement à usage d’élaboration de la connaissance et non de publication définitive (usage interne et collaboratif). Domeo a été développé à des fins de recherche dans le domaine de la médecine et de la biologie. Annotopia en formera une version améliorée et réutilisable dans d’autres contextes disciplinaires. Enfin, Pundit est destiné à la recherche en sciences humaines et sociales. Il a été développé en étroite collaboration avec des historiens.

  • Fonctionnalités

5 Commenter le paragraphe 5 2 Annotator, Annotation studio et Texus ne permettent de produire que des annotations libres (commentaire simple) tandis qu’Annotopia, Domeo et Pundit offre la possibilité de bâtir des annotations structurées employant des référentiels. La seconde solution est bien évidemment plus riche et offre des perspectives plus intéressantes quant à l’ouverture sur le Linked Open Data.

6 Commenter le paragraphe 6 1 Si tous nos outils semblent proposer un typage des annotations (à l’exception de Textus et peut-être d’Annotation Studio, pour lequel ça n’est pas documenté), il semble que seul Annotator ait tenté de se conformer aux spécifications proposées par Open annotation Community group (classe oa : motivation et vocabulaire spécifique).

7 Commenter le paragraphe 7 0 Tous les outils proposent une fonction de tag (étiquette). Cependant, dans le cas d’Annotator, Annotation Studio et Textus, il s’agit d’un étiquetage libre, selon le modèle de la folksonomie. Seuls Pundit, Domeo et Annotopia proposent d’employer des référentiels, que ce soit dans le corps de l’annotation ou comme métadonnée. Là encore, les exploitations envisageables sont beaucoup plus riches.

8 Commenter le paragraphe 8 0 Concernant la gestion des référentiels, seule la documentation de Pundit apporte une réponse claire : la société qui porte Pundit développe également un logiciel de gestion de référentiels (Korbo), qui forme donc une brique du système d’annotation. Dans le cadre de ce stage, je n’ai malheureusement pas eu le temps d’étudier en détail le logiciel Korbo, laissant en suspens la question de la gestion avancée des référentiels (et notamment de la gestion des conflits). Il semble cependant qu’il soit possible, à travers Pundit d’enrichir les référentiels. La documentation d’Annotopia et Domeo n’aborde pas la question, mais il semble, au vu des ambitions du projet, qu’elle se pose.

9 Commenter le paragraphe 9 1 Tous les outils proposent une gestion des droits d’écriture et d’affichage des annotations produites. Cependant, la question de la validation des annotations (automatiquement ou par un modérateur) n’est pas clairement abordée. Elle est pourtant essentielle dans notre projet. Il semble qu’un processus de validation soit implémenté dans Domeo et Annotopia. Il est souhaité dans les cas d’usage de Textus, mais pas ne semble pas encore avoir été mis en œuvre. C’est également le cas dans Pundit.

10 Commenter le paragraphe 10 0 Concernant les fonctionnalités supplémentaires, la plupart des outils intègrent une possibilité d’annoter des images. Cependant, il faut distinguer la possibilité d’annotation d’une image ou d’un fragment d’image (l’image est là la « cible ») et la possibilité de joindre une image dans l’annotation (l’image fait partie du « corps » de l’annotation). La première solution, proposée par Annotator et Pundit, mais aussi Domeo et Annotopia est évidemment la plus riche. Dans le cas des images, il est souhaitable de pouvoir créer des annotations à multiples cibles (fragment de texte, fragment d’image) et à un ou aucun corps (body).

11 Commenter le paragraphe 11 1 En regard de notre projet, il m’avait semblé intéressant de noter si l’outil d’annotation proposait une gestion avancée des références bibliographiques (interopérabilité avec Zotero par exemple). Si cela semble être un critère désiré par les développeurs (dans le cas de Textus notamment) et discuté au sein d’Open Annotation Collaboration), aucun de nos outils ne semble l’intégrer sinon Domeo et Annotopia.

12 Commenter le paragraphe 12 1 Enfin, afin d’accélérer le processus d’annotation du corpus, il serait intéressant d’automatiser les tâches les plus ingrates, qui exigent le moins d’investissement intellectuel, comme la reconnaissance des entités nommées. Ainsi, j’ai examiné si les outils intégraient des processus d’automatisation, tels que le repérage des entités nommées ou la suggestion d’annotations appropriées à partir des référentiels. C’est le cas de Domeo, Pundit et Annotopia.

  • Acteurs, mises à jour, documentation

14 Commenter le paragraphe 14 5 Annotator et Textus sont deux projets portés par l’OFK. Le développement d’Annotator est ouvert et tout à chacun peut contribuer. Textus résulte d’un partenariat plus spécifique avec différentes universités, notamment britanniques. Les universités, principalement anglo-saxonnes, occupent en général une grande place dans le développement des outils d’annotation, comme notre prospection plus large l’a montré. Annotation Studio est une proposition d’Hyperstudio, un laboratoire de recherche appartenant au MIT, qui est d’ailleurs à l’origine de plusieurs autres outils pour les Digital Humanities. Domeo et Annotopia sont développés au sein de Massachusetts Hospital sous l’impulsion de Paolo Ciccarese, qui est par ailleurs coprésident du W3C Open Annotation Community Group. Pundit est le seul outil benchmarké qui soit développé par une entreprise privée (Net7), mais il bénéficie de financement de l’Union européenne et d’un partenariat étroit avec des universitaires. Du point de vue des acteurs, ce benchmarking n’est pas représentatif du paysage des outils d’annotation : en effet, de nombreuses starups se sont lancés, ces dernières années, avec plus ou moins de succès, dans le développement d’outils d’annotation : ceux-ci ne sont cependant pas adaptés aux usages spécifiques que nous formulons à travers le projet des guides de Paris.

15 Commenter le paragraphe 15 2 Point de vue communauté, seul Annotator rassemble pour son développement comme pour son usage de nombreuses personnes, enclines à contribuer au développement de l’outil : cela est manifeste au regard de la liste de diffusion mail. Les autres outils bénéficient d’une communauté moins dynamique, essentiellement constituée d’utilisateurs de l’outil et non de développeurs.

16 Commenter le paragraphe 16 0 La documentation disponible sur les outils est dans l’ensemble assez faible : difficile d’accès, fragmentaire, incomplète ou non mise à jour. Seule celle d’Annotator se distingue véritablement. La documentation de Pundit est très complète en ce qui concerne l’API mais beaucoup plus floue dès lors qu’il s’agit de la partie « serveur » (la seule à faire l’objet d’une commercialisation de la part de Net7). Notons enfin qu’il n’a pas été possible d’évaluer la documentation d’Annotopia puisque l’outil est en cours de développement.

17 Commenter le paragraphe 17 0 ÉCRIRE UNE SYNTHÈSE SUR LES LICENCES.

  • Aspects techniques

19 Commenter le paragraphe 19 0 Tous les outils présentent une architecture modulaire, reposant sur un système de briques. De ce fait, il est possible d’envisager des extensions ou l’usage d’autres services interopérables. PARLER DES API/

20 Commenter le paragraphe 20 0 Côté client, la plupart des outils fonctionnent sous JavaScript. Notons que Annotopia pourra employer comme client Annotator, Utopia ou Domeo. Côté Serveur, les solutions proposées sont plus diverses : DETAILLER.

21 Commenter le paragraphe 21 0 Pour être annotées, les ressources doivent être exposées, selon les outils, sous différents formats : ainsi, Annotator, Domeo, Pundit et Annotopia annotent du HTML. Pundit annote également des segments RDF(a) exprimant des id XML. Annotopia annote aussi des PDF. Via des extensions spécifiques, Annotator, Domeo, Anotopia et Pundit peuvent annoter des fragments d’images. Annotation Studio et Textus transforment des ressources fournies par l’utilisateur et les stockent en interne : Annotation Studio encapsule un texte versé sous format DOCX, ODT ou TXT, tandis que Textus transforme les ressources en flux texte sous format Json. Cette dernière solution est très contestable : certes légère, elle interdit la modification de la ressource une fois versée dans la plateforme.

22 Commenter le paragraphe 22 0 Annotation Studio et Textus stockent donc les ressources à annoter à l’intérieur de l’outil, alors que les autres outils peuvent annoter des ressources hébergées indépendamment. Pundit, par sécurité en cas de lien brisé, stocke des copies des fragments annotés (cibles).

23 Commenter le paragraphe 23 0 Dans la plupart des cas, les annotations sont stockées sous format Json. Pundit stocke les informations sous la forme de Graphe RDF. PARLER DES STOCKAGES DES ANNOTATIONS

24 Commenter le paragraphe 24 1 REPRENDRE LES TECHNIQUES D’ANCRAGE (après avoir précisé les mécanismes dans la partie précédente)

Page 22

Source :http://johannadaniel.fr/memoire/?page_id=95%2F&replytopara=11