Nuvola apps important.png Attention, suite à une faille de sécurité, quelques liens vers les serveurs d'exploration sont désactivés.

-

Plateforme LorExplor

De Wicri France
Révision datée du 28 août 2015 à 22:04 par imported>Jacques Ducloy (La démarche LorExplor)

La plateforme LorExplor est une solution technique, développée dans le cadre dur projet LorExplor et qui permet d'exploiter localement un corpus de documents numériques extrait de la plateforme de services ISTEX.

logo travaux Page en cours de rédaction

La démarche LorExplor

Plus précisément sur un problème donné[1], la démarche LorExplor consiste à :

  • télécharger un corpus censé contenir la réponse à la question posée,
  • construire un serveur d'exploration à partir du corpus,
  • élaborer des règles de curation qui vont améliorer la qualité du corpus (par rapport à la question posée),
  • restituer les résultats.

La plateforme LorExplor

TP Paris 8 2015 Diapositive03.jpg

Elle se compose des éléments suivants :

  • la bibliothèque DILIB,
  • un générateur de Serveurs d'exploration,
  • la solution Semantic MediaWiki,
  • le réseau Wicri.

Adaptations Dilib pour LorExplor

LogoDilib.gif

Le sigle DILIB (Data & Information LIBrary) identifie un projet de bibliothèques de composants logiciels pour les applications liées aux documents et au traitement de l'information.

L'idée générale est celle d'un jeu de construction type Logo ou Meccano où les composants de base sont des fonctions logicielles avec des interfaces normalisées XML. Par exemple, un fichier inverse est un ensemble de documents XML (voir un extrait du fichier inverse auteur sur le serveur Aussois).

Le noyau est un parser XML qui est adapté aux flots de données qui peut traiter des flux de plusieurs millions de documents XML.

  1. Par exemple : quelles sont le communautés scientifiques qui sont présentes à Aussois ?