Plateforme LorExplor
La plateforme LorExplor est une solution technique, développée dans le cadre dur projet LorExplor et qui permet d'exploiter localement un corpus de documents numériques extrait de la plateforme de services ISTEX.
La démarche LorExplor
Plus précisément sur un problème donné[1], la démarche LorExplor consiste à :
- télécharger un corpus censé contenir la réponse à la question posée,
- construire un serveur d'exploration à partir du corpus,
- élaborer des règles de curation qui vont améliorer la qualité du corpus (par rapport à la question posée),
- restituer les résultats.
La plateforme LorExplor
Elle se compose des éléments suivants :
- la bibliothèque DILIB,
- un générateur de Serveurs d'exploration,
- la solution Semantic MediaWiki,
- le réseau Wicri.
Adaptations Dilib pour LorExplor
Le sigle DILIB (Data & Information LIBrary) identifie un projet de bibliothèques de composants logiciels pour les applications liées aux documents et au traitement de l'information.
L'idée générale est celle d'un jeu de construction type Logo ou Meccano où les composants de base sont des fonctions logicielles avec des interfaces normalisées XML. Par exemple, un fichier inverse est un ensemble de documents XML (voir un extrait du fichier inverse auteur sur le serveur Aussois).
Le noyau est un parser XML qui est adapté aux flots de données qui peut traiter des flux de plusieurs millions de documents XML.