Plateforme LorExplor : Différence entre versions
imported>Jacques Ducloy (→La démarche LorExplor) |
imported>Jacques Ducloy (→La démarche LorExplor) |
||
Ligne 3 : | Ligne 3 : | ||
{{Wicri travaux|texte=Page en cours de rédaction}} | {{Wicri travaux|texte=Page en cours de rédaction}} | ||
==La démarche LorExplor== | ==La démarche LorExplor== | ||
+ | Un des objectifs principaux de la plateforme LorExplor est la capacité à donner des éléments de réponse à un problème informationnel en quelques heures. | ||
+ | |||
Plus précisément sur un problème donné<ref>Par exemple : quelles sont le communautés scientifiques qui sont présentes à [[Aussois]] ?</ref>, la démarche LorExplor consiste à : | Plus précisément sur un problème donné<ref>Par exemple : quelles sont le communautés scientifiques qui sont présentes à [[Aussois]] ?</ref>, la démarche LorExplor consiste à : | ||
* télécharger un corpus censé contenir la réponse à la question posée, | * télécharger un corpus censé contenir la réponse à la question posée, |
Version du 28 août 2015 à 22:06
La plateforme LorExplor est une solution technique, développée dans le cadre dur projet LorExplor et qui permet d'exploiter localement un corpus de documents numériques extrait de la plateforme de services ISTEX.
La démarche LorExplor
Un des objectifs principaux de la plateforme LorExplor est la capacité à donner des éléments de réponse à un problème informationnel en quelques heures.
Plus précisément sur un problème donné[1], la démarche LorExplor consiste à :
- télécharger un corpus censé contenir la réponse à la question posée,
- construire un serveur d'exploration à partir du corpus,
- élaborer des règles de curation qui vont améliorer la qualité du corpus (par rapport à la question posée),
- restituer les résultats.
La plateforme LorExplor
Elle se compose des éléments suivants :
- la bibliothèque DILIB,
- un générateur de Serveurs d'exploration,
- la solution Semantic MediaWiki,
- le réseau Wicri.
Adaptations Dilib pour LorExplor
Le sigle DILIB (Data & Information LIBrary) identifie un projet de bibliothèques de composants logiciels pour les applications liées aux documents et au traitement de l'information.
L'idée générale est celle d'un jeu de construction type Logo ou Meccano où les composants de base sont des fonctions logicielles avec des interfaces normalisées XML. Par exemple, un fichier inverse est un ensemble de documents XML (voir un extrait du fichier inverse auteur sur le serveur Aussois).
Le noyau est un parser XML qui est adapté aux flots de données qui peut traiter des flux de plusieurs millions de documents XML.