Acfas (2017) Ducloy
Une cyberinfrastructure numérique et humaniste pour analyser et diffuser la science Jacques Ducloy (Université de Lorraine), Thierry Daunois (Direction des partenariats, Université de Lorraine (France)), Ali Tebbakh (Paragraphe, Université Paris 8)
Sommaire
Résumé
Avec le soutien du programme ISTEX, le démonstrateur Wicri expérimente l’élaboration d’informations de synthèse en explorant des corpus scientifiques. Son socle est un réseau de wikis sémantiques (Semantic MediaWiki). Les corpus sont traités dans des plateformes de curation et d’exploration, fabriquées, sous Unix, avec une bibliothèque de composants XML ou PHP. Avec un haut niveau de personnalisation, la version actuelle permet de fusionner des métadonnées hétérogènes (ISTEX, HAL, Pascal/Francis, PubMed, PubMed Central) avec réduction des doublons et homogénéisation des données. Il est possible ensuite d’exploiter le texte intégral.
Le rédacteur, humaniste numérique, est le véritable pilote d’une étude. Il bénéficie des performances de MediaWiki pour rédiger un texte scientifique en mode collaboratif. Il assemble des briques XML pour obtenir des modèles wiki contenant des cartes et des tableaux de résultats qu’il introduira dans les pages wiki. Il manipule l’environnement sémantique pour exprimer les règles utilisées dans la curation des données.
Cette infrastructure, encore expérimentale, est notamment utilisée pour des travaux dirigés dans des Master en science de l’information. Sur des sujets en rapport avec le contenu des wikis thématiques (environnement, linguistique, informatique…) ou régionaux (Allemagne, France, Brésil, Lorraine…), un groupe d’étudiants peut ainsi analyser un ensemble de plusieurs milliers de documents et rédiger des observations synthétiques.
Les diapositives
Les supports complets sont disponibles sous les formats :
Introduction
Le projet LorExplor veut explorer les usages relatifs à l'exploration de vastes corpus dans un contexte de coopération (accompagnement) entre les spécialistes du domaine d'application et ceux du numérique. En pratique, deux cibles sont privilégiées :
- Aide au pilotage stratégique
- Les démarches exploratoires avec des contraintes de temps. Par exemple, dans le cadre d'une procédure de réponse à un appel d'offres de l'Agence universitaire de la Francophonie : quelles sont, par exemple, les principales équipes canadiennes avec lesquelles l'Université Paris 8 pourrait s'allier sur une thématique portant sur les bibliothèques numériques.
- A côté de services très fortement concernés par ce type d'approche (relations internationales, partenariats, valorisation), toute équipe de recherche peut tirer parti de ce type d'approche une à deux fois par an. Une estimation du nombre d'interventions de ce type est comprise entre 50 000 à 150 000 par an.
Exploration des connaissances, serveur d'exploration
Une cyberinfrastructure humaniste
Mediawiki
Semantic MediaWiki
Voir, sur ce wiki, les pages :