CARIST (Nancy 2017) Ducloy : Différence entre versions

De CIDE
imported>Jacques Ducloy
(Bilan)
imported>Jacques Ducloy
(Un atelier flexible)
Ligne 83 : Ligne 83 :
 
* Sur Wicri/Eau : [[wicri-eau.fr:Serveur d'exploration Lota lota|Serveur d'exploration Lota lota]] (lotte de rivière).
 
* Sur Wicri/Eau : [[wicri-eau.fr:Serveur d'exploration Lota lota|Serveur d'exploration Lota lota]] (lotte de rivière).
 
* Sur Wicri/Luxembourg : [[wicri-lux.fr:Serveur d'exploration sur la visibilité du Luxembourg à la NLM|Serveur d'exploration sur la visibilité du Luxembourg à la NLM]].
 
* Sur Wicri/Luxembourg : [[wicri-lux.fr:Serveur d'exploration sur la visibilité du Luxembourg à la NLM|Serveur d'exploration sur la visibilité du Luxembourg à la NLM]].
 +
 +
Si les wikis jouent un rôle fondamental dans l'interface homme machine avec les corpus, les travaux de curation et d'exploration sont réalisés avec une bibliothèque de composants XML.
 +
 +
Pour un corpus donné, cette bibliothèque va notamment permettre de réaliser :
 +
* un [[serveur d'exploration]] qui devrait être accessible à un public assez large mais averti.
 +
* une [[plateforme de curation et d'exploration]]. Il s'agit d'un ensemble de serveurs intermédiaires destinés aux spécialistes.
 +
Les serveurs d'exploration sont réalisés sur une machine Unix avec des composants logiciels écrits en langage C.
 +
 +
Les modules de navigation sont réalisés en php.
 +
[[File:LogoDilib.gif|180px|left]]
 +
Ces modules sont intégrés dans la [[bibliothèque Dilib]]. Elle est principalement documentée sur le wiki [[wicri-outils.fr:Bibliothèque Dilib|Wicri/Outils]].
 +
 
{{clr}}
 
{{clr}}
  

Version du 17 mars 2017 à 17:46

L'excellence documentaire pour tous ? Chiche !


 
 

logo travaux document en cours de finition
  • Diapositives à jour,
  • Commentaires en cours.
CARIST 2017 Ducloy Diapositive01.png

Nous présentons les résultats du projet LorExplor. Il est destiné à l'analyse des besoins des chercheurs et partenaires de la recherche en matière d'exploration de corpus à des fins stratégiques. Il utilise la synergie de deux types de technologies : un réseau de wikis sémantiques et l'ingénierie XML. Il débouche sur un démonstrateur, prototype d'une infrastructure pour explorer la connaissance scientifique ou technique. Nous discuterons de ses retombées dans la perspective d'une « excellence documentaire pour tous ».

Pour accéder aux diapositives

Introduction

CARIST 2017 Ducloy V3 Diapositive02.png

Une priorité, l'exploration des connaissances

CARIST 2017 Ducloy Diapositive04.png
Recherche
On sait qu'une information existe, mais on a perdu le chemin pour y accéder.
Exploration
On recherche des informations que l'on ne connait pas :

Pour la plus ancienne référence à l'hypertexte voir sur le wiki Ticri/H2PTM :

Recherche débouchant sur des explorations
  • Où trouver une explication compréhensible sur la relation entre les 8 tons de l'office (magnificats de la Renaissance) et les tonalités classiques (Do majeur...) ?


Infrastructure Wicri

Mediawiki

CARIST 2017 Ducloy Diapositive05.png

La nature de l'information, culturelle ou scientifique, amène de fortes contraintes éditoriales. La page Aussois, sur le wiki Wicri/France, donne un exemple d'introduction. Le début utilise « de façon classique » les outils et pratiques de Wikipédia. La fin de la page a été réalisée avec les techniques présentées ici.

Exemples plus significatifs
  • Sur ce wiki :
    • cette présentation pour lee journées CARIST est enrichie par un ensemble de démonstrations, avec notamment des liens vers des serveurs d'exploration dont le contenu évolue dans le temps.
  • Dans le réseau Wicri,
    • l'adaptation de la traduction française de la pièce de Pouchkine Mozart et Salieri demande de manipuler un outil de notation musicale (LilyPond).
    • elle est intégrée dans un [wicri-musique.fr:[Wolfgang Amadeus Mozart|dossier Mozart]] qui donne accès à environ 15 000 documents (en majorité ISTEX).
Aspects techniques concernant MediaWiki

La solution MediaWiki est puissante mais son utilisation avancée demande un dispositif d'accompagnement. Sur un plan informatique il faut un soutien logistique relativement léger en termes de temps d'intervention mais possédant une solide expertise technique. Au niveau des pratiques, elle demande une stratégie de formation et d'accompagnement des contributeurs.

Semantic MediaWiki

CARIST 2017 Ducloy Diapositive06.png

La souche MediaWiki est déjà très riche par ses mécanismes d'indexation et l'utilisation de modèles. Cette page contient d'ailleurs un grand nombre d'appels de modèles, visualisables par l'onglet « modifier ou voir le texte source ».

Par rapport à Wikipédia le réseau Wicri utilise une extension développée par l'Université de Karlsruhe : Semantic MediaWiki.

De nombreux exemples d'utilisation sont disponibles.

  • Sur Wicri/Musique, la page sur Lorenzo da Ponte qui est utilisé comme exemple sur la diapositive ci-jointe.
  • sur ce wiki, la page Serveur d'exploration qui exploite les données numériques sur les corpus.
  • sur ce wiki, les pages relatives aux colloques CIDE avec la sémantisation des auteurs et comités de programme (voir par exemple CIDE 2016 Athènes).

Le réseau Wicri

CARIST 2017 Ducloy Diapositive07.png
CARIST 2017 Ducloy Diapositive08.png

Plateformes de curation et d'exploration

CARIST 2017 Ducloy Diapositive09.png
Un exemple
Sur le Serveur d'exploration sur la TEI, le flux ISTEX :

DilibExplorGabarit1.png

ExplorGabarit1Arrow.png

Pour aller sur le flux ISTEX

Pour aller sur l'étape de reformatage du corpus

Pour aller sur l'étape de curation

Pour aller sur l'étape de contrôle

Un atelier flexible

CARIST 2017 Ducloy Diapositive10.png

On trouvera de nombreuses applications dans le réseau Wicri en utilisant (dans chaque wiki) la catégorie Serveur d'exploration.

Voici quelques exemples :

Si les wikis jouent un rôle fondamental dans l'interface homme machine avec les corpus, les travaux de curation et d'exploration sont réalisés avec une bibliothèque de composants XML.

Pour un corpus donné, cette bibliothèque va notamment permettre de réaliser :

Les serveurs d'exploration sont réalisés sur une machine Unix avec des composants logiciels écrits en langage C.

Les modules de navigation sont réalisés en php.

LogoDilib.gif

Ces modules sont intégrés dans la bibliothèque Dilib. Elle est principalement documentée sur le wiki Wicri/Outils.

Bilan

Utilisation en travaux dirigés

CARIST 2017 Ducloy Diapositive03.png

Dans le cadre des TD de l'Université de Lorraine en 2016.

Dans le cadre des TD de l'Université Paris 8 en 2017.

Un aspect essentiel : la curation des corpus

CARIST 2017 Ducloy Diapositive18.png
CARIST 2017 Ducloy V4 Diapositive12.png

Conclusion

CARIST 2017 Ducloy Diapositive25.png
CARIST 2017 Ducloy Diapositive26.png
CARIST 2017 Ducloy V4 Diapositive15.png

Visite guidée

CARIST 2017 Ducloy V4 Diapositive16.png

Dilib

CARIST 2017 Ducloy Diapositive11.png

Serveurs d'exploration

CARIST 2017 Ducloy Diapositive12.png
CARIST 2017 Ducloy Diapositive13.png
CARIST 2017 Ducloy Diapositive14.png
CARIST 2017 Ducloy Diapositive16.png

Curation des corpus

CARIST 2017 Ducloy Diapositive15.png
CARIST 2017 Ducloy Diapositive17.png

Curation des données

CARIST 2017 Ducloy Diapositive19.png
CARIST 2017 Ducloy Diapositive20.png
CARIST 2017 Ducloy Diapositive21.png
CARIST 2017 Ducloy Diapositive22.png
CARIST 2017 Ducloy Diapositive23.png
CARIST 2017 Ducloy Diapositive24.png