Article DC 2010 Pittsburgh (archive - démarrage)

De Artist

Cette page est conservée pour garder la trace d'un travail collectif autour de la rédaction de l'article : Métadonnées pour WICRI, un réseau de wikis sémantiques pour les communautés de la recherche et de l'innovation.

Pour accéder :

 


 

Cette page introduit les discussions en français à propos de la rédaction d'un article (en anglais) pour la conférence DC 2010 Pittsburgh.

Ce travail devrait s'inspirer de ce qui a été fait à l'occasion de DC 2006 Manzanillo mais en visant plutôt un papier court.

Thème (titre?) de l'article 
métadonnées dans les réseaux de wikis sémantiques
Auteurs 

Cette liste n'est pas fermée

Idée générale

La mise en réseau de wikis partagés par des communautés différentes pose nécessairement des problèmes liés aux métadonnées (définition et utilisation). Cet article veut s'appuyer sur l'expérience acquise dans le réseau Wicri pour les mettre en évidence.

L'article pourrait commencer par une présentation de Wicri. On introduit l'importance des métadonnées et le besoin de wikis relatifs aux métadonnées.

Puis viendrait un état de l'art sur les réseaux de wikis, avec notamment la mention des réseaux de wikis en pair à pair.

Une section serait dédiée aux problèmes rencontrés pour la définition des modèles sémantiques et leur utilisation par l'utiisateur. Elle fait émerger le besoin d'un dictionnaire des métadonnées à prendre en compte pour cette définition. Nous nous limiterions aux métadonnées "générales", par exemple la modélisation des comités associés à une manifestation.

On évoque les limites d'un modèle basé uniquement sur des triplets RDF pour prendre en compte les contraintes liées aux interactions humaines et à celles des robots. Ceci constitue une transition pour la section suivante.

La dernière section est dédiée aux utilisations par des robots ou procédés automatiques. Les besoins actuellement identifiés sont de trois types :

  • maintien de la cohérence du réseau de wiki, recherche au sein du réseau,
  • utilisation du réseau et de ses connaissances formelles pour interroger le web,
  • aide à la saisie ou à la contribution.

Accès à l'article cible

Commentaires en français

Attention : cette partie a été rédigée en tout début de l'action, elle n'est plus significative
Voir l'article (en anglais)

A l'heure actuelle cette partie est une suite de notes.

Introduction

Présentation de Wicri

  • on introduit le besoin initial (TICRI), l'intérêt de Wikipédia mais egalement ses limites.
  • on introduit le réseau Wicri avec ses différents types de wikis
on introduit la problématique
    • on introduit la problématique de différenciation rédactionnelle, de cohérence du réseau en ouvrant la possibilité d'enrichissment automatique.
    • Wicri rassemble des communautés qui doivent produire un ensemble informationnel cohérent. Une charte doit donc être définie. Au niveau individuel elle précise les règles d'identification et l'acceptation de textes sous licence Creative Commons. Au niveau collectif, elle doit préciser les principes éditoriaux (comités de rédaction). Sur un plan technique la clé de voute du système est le respect de métadonnées, vocabulaires et standards élaborées collectivement.

Etat de l'art

Réseaux en pair-à-pair

Par rapport aux réseau de wikis en pair-à-pair, les wikis ont des contenus et des lignes éditoriales différentes. On se trouvera confronté à 3 types de situation :

  • duplication d'un wiki dans sa globalité pour des raisons
    • de fiabilité (exemple Wicri/Média ou Wicri/Wicri),
    • politiques par exemple un wiki thématique fortement porté par 2 régions.
  • duplication de pages dans leur intégralité (par exemple les modèles de Wicri/Base)
  • réplication de paragraphes dans diverses pages (par exemple infobox d'un laboratoire).

Architecture sémantique pour un réseau de contributeurs

On fait apparaitre les besoins suivants :

  • Tous les wikis doivent partager des métadonnées et vocabulaires communs.
  • Un wiki (wicri-base - déjà existant) contient les éléments à partager.
  • Un wiki doit servir de base de discussion pour faire avancer les réflexions relatives à la normalisation.

Architecture sémantique manipulable par des robots

Contraintes :

  • les wikis doivent être lisibles par des humains sans formation,
  • les wikis doivent être modifiés par des humains avec une formation légère,
  • ils sont enrichis par des automates...
  • Limites d'une approche purement sémantique (RDF)

Les contraintes humaines interdisent la généralisation des triplets RDF pour tout ce qui doit être modélisé. D'où la nécessité d'un complément XML.

2 utilisations majeures :

  • améliorer le fonctionnement des robots
  • permettre une saisie assistée (Xtiger).

Retour aux métadonnées/interopérabilité : les schémas XML sont traités au même titre que les métadonnées sémantiques.