Annotation sémantique et TYPO3

L’annotation est le processus qui consiste à attacher des informations complémentaires au contenu textuel d’un document. L’annotation sémantique consiste à relier ces contenus à des informations précises (on parle parfois de métadonnée) en relation avec l’identité sémantique des données annotées. De plus en plus fréquemment, on considère la tâche d’annotation sémantique comme l’un des aspects applicatifs du Web sémantique.Wikipedia

Intérêt de l’annotation sémantique et application pratique

L’annotation sémantique permet par exemple d’ajouter automatiquement un lien vers wikipedia sur des termes spécifiques, sans avoir à faire la démarche manuellement. L’annotation ajoute donc automatiquement de l’intelligence à votre contenu.

La place des CMS actuels en rapport avec le web sémantique

Aujourd’hui, à ma connaissance il n’existe pas d’intégration native avec le web sémantique au niveau des CMS les plus connus ( WP, TYPO3, DRUPAL, JOOMLA, EZ-PUBLISH )

Exemple pratique TYPO3, développé par DKD

L’agence DKD, partenaire du projet ForgetIt à développé une plateforme de démonstration qui présente une extension d’annotation.

Ce prototype est réalisé pour inspirer les développeurs à joindre le projet, joindre le git et contribuer.

Il reste à imaginer des usages en contexte d’entreprise, ou de sites à forte valeur ajoutée en contenu éditorial.

 

Démonstration

Frontend:

Web fish SHOP : (http://web2.fish-shop.net)
Ce site de démonstration est une plateforme web de contenu éditorial « type ». DKD l’a crée pour permettre d’évaluer  la solution via des tests externes.

TYPO3 semantic example website

Rien à voir côté frontend, il vous faudra observer le code source pour comprendre ce qu’apporte l’annotation sémantique:

Capture d'écran 2015-12-13 23.10.53

Côté Backend

​Le module d’annotation est utilisable à partir de l’edition d’un bloc texte TYPO3.

Capture d'écran 2015-12-13 21.50.00

 

 

Une fois cliqué, un nouveau bloc apparait sous le bloc d’édition du texte, qui affiche les annotations disponibles pour ce texte.

Capture d'écran 2015-12-13 21.50.24

 

Annotate: Lance l’analyse du texte par rapport aux annotation.

Dans ce cas TYPO3 utilise CMIS pour interroger un module sémantique d’Alfresco qui lui même est « branché » sur « Dbpedia » ( wikipedia sémantique) , qui lui retourne les informations de vocabulaire sémantique (ontologie), de ressource et de type.

​Le composant « GATE » joue un role de routeur sémantique, il reçoit le texte enrichi et s’occupe de voir s’il y a des entités dans DBPEDIA.

 

Capture d'écran 2015-12-13 21.50.32

Module Dashboard :

Semantic TYPO3 Dashboard

Le module dashboard liste le vocabulaire annoté, ses occurence utilisée dans le contenu TYPO3 , son ID unique via CMIS, ainsi que des métadonnées.

La partie social media peut être utilisée pour calculer le « poids » d’un mot ou d’une expression.  Conjuguer les « likes » des médias sociaux pour  calculer l’importance future du contenu, son poids, sa valeur.

Usages possibles:

  • Amélioration de la comprehension du texte par les moteur de recherche.
  • Affichage d’informations complémentaires au rollover sur une entité
  • Affichage des contenus les plus appréciés du site​

Evolutions à venir

  • Compréhension des concepts visuels, analyse d’images utilisation d’API
  • Machine learning, apprentissage progressif
  • Ajout du projet dans l’écosystème APACHE.

En projet par DKD

  • Tester d’avantage le sytème, trouver des testeurs
  • Développer la reconnaissance d’Images
  • Apprendre l’utilisateur à annoter soi-même
  • Développer une visualisation de la densité de l’annotation
  • Représentation graph pour chaque document.
  • Suggestion de recherche
  • Utilisation indépendate hors du framework ForgetIT
  • Compatibilité TYPO3 7 LTS
  • Trouver des user story pour expliquer l’interet du projet
  • Crawler le site TYPO3 ou autre et créer les annotation à partir de ce crawl
  • Propager du contenu d’une technologie vers d’autres

Liens utiles:

https://github.com/dkd/forgetit-fish-example
https://github.com/dkd/typo3-ext-cmis-service
http://demos.gate.ac.uk/mimir/
http://www.forgetit-project.eu/en/about-forgetit/architectural-framework/

Intégrateur TYPO3 depuis 2003, maintenant responsable du pôle d'expertise chez TalanSolutions. Je réalise des audits, des préconisations, des missions d'expertise. J'ai la chance de diriger le plateau technique Web PHP / TYPO3 d'EXL Group.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *