Acfas (2017) Ducloy
Une cyberinfrastructure numérique et humaniste pour analyser et diffuser la science Jacques Ducloy (Université de Lorraine), Thierry Daunois (Direction des partenariats, Université de Lorraine (France)), Ali Tebbakh (Paragraphe, Université Paris 8)
Sommaire
Résumé
Avec le soutien du programme ISTEX, le démonstrateur Wicri expérimente l’élaboration d’informations de synthèse en explorant des corpus scientifiques. Son socle est un réseau de wikis sémantiques (Semantic MediaWiki). Les corpus sont traités dans des plateformes de curation et d’exploration, fabriquées, sous Unix, avec une bibliothèque de composants XML ou PHP. Avec un haut niveau de personnalisation, la version actuelle permet de fusionner des métadonnées hétérogènes (ISTEX, HAL, Pascal/Francis, PubMed, PubMed Central) avec réduction des doublons et homogénéisation des données. Il est possible ensuite d’exploiter le texte intégral.
Le rédacteur, humaniste numérique, est le véritable pilote d’une étude. Il bénéficie des performances de MediaWiki pour rédiger un texte scientifique en mode collaboratif. Il assemble des briques XML pour obtenir des modèles wiki contenant des cartes et des tableaux de résultats qu’il introduira dans les pages wiki. Il manipule l’environnement sémantique pour exprimer les règles utilisées dans la curation des données.
Cette infrastructure, encore expérimentale, est notamment utilisée pour des travaux dirigés dans des Master en science de l’information. Sur des sujets en rapport avec le contenu des wikis thématiques (environnement, linguistique, informatique…) ou régionaux (Allemagne, France, Brésil, Lorraine…), un groupe d’étudiants peut ainsi analyser un ensemble de plusieurs milliers de documents et rédiger des observations synthétiques.
Les diapositives
Les supports complets sont disponibles sous les formats :
- powerpoint