Utilisateur:Jacques Ducloy/Infrastructure pédagogique ISTEX
L'infrastructure pédagogique ISTEX désigne un ensemble de ressources numériques mises à la disposition des enseignants qui souhaitent utiliser ISTEX dans un cadre pédagogique.
Sommaire
Objectifs
L'Infrastructure pédagogique ISTEX veut offrir un large ensemble d'outils et de services pour l'appropriation de l'ingénierie de la connaissance numérique par des acteurs, ou futurs acteurs, de la recherche et de l'innovation.
Dans une perspective à moyen terme, tous les secteurs scientifiques sont concernés. A court terme, la priorité est donnée aux sciences de l'information, notamment pour la formation des formateurs en ingénierie de la connaissance.
Infrastructure initiale
Dans une perspective pédagogique en sciences de l'information, l'infrastructure de départ est constituée des éléments suivants :
- La plateforme d'exploration hypertexte et hypermédias avec ses 30.000 documents.
- Elle est associée au wiki H2PTM qui offre un environnement éditorial et collaboratif pour les travaux pratiques.
- Ce wiki est associé au réseau Wicri qui offre un ensemble terminologique de référence et des règles de curation.
- La bibliothèque de composants Xml Dilib (parser Xml, méthodes d'accès de type séquentiel indexé)
- complétées par des modules de reformatages et d'enrichissement spécialisé,
- et ses commandes pour la génération de plateforme d'exploration.
Cet ensemble a déjà été utilisé pour des séances de travaux pratiques en Master.
Nouveaux développements
Ergonomie et autonomie adaptée aux travaux pratiques
Les travaux pratiques ont été menés avec un mode de fonctionnement où les opérations techniques étaient assurées par l'équipe LorExplor, sur la machine informatique (unix) du réseau Wicri. Ces options sont incompatibles avec un fonctionnement normal en mode travaux pratiques ou dirigés.
Pour pérenniser ce type de formation, il faut déjà intégrer les outils de manipulation de corpus dans une machine virtuelle unix accessible aux étudiants mais séparée de celle du réseau Wicri.
Pour pouvoir généraliser ce type de formation, l'ergonomie et la documentation des outils doivent être fortement améliorées. L'objectif de ce volet technique est d'atteindre une autonomie complète (pas de « sous-traitance LorExplor ») pour les enseignants, puis pour les étudiants dans les séances de type travaux pratiques courants. Plus précisément, un étudiant doit expérimenter une action de curation, de façon autonome et en quelques minutes, là où, actuellement, un opérateur LorExplor passe une demie-heure avec un délai de quelques jours...
A plus long terme, l'ergonomie doit être encore améliorée pour rendre les commandes unix transparentes dans les cas simples.
Elasticsearch et outils de recherche
Les fonctionnalités de la bibliothèque Dilib dans les aspects moteur de recherche sont encore assez réduites. Pour y remédier, deux types d'action sont prévus.
- Pour améliorer la recherche pendant la navigation, nous comptons installer Elasticsearch, un moteur de recherche libre et open source utilisé par l'INIST pour donner accès aux corpus données ISTEX.
- Les modules de la bibliothèques Dilib qui permettent de mieux appréhender le fonctionnement interne d'un moteur de recherche vont être développés dans ce sens.
Outils linguistiques et d'analyse statistique
La notion de machine virtuelle ouvre des possibilités de diversification des outils utilisables.
Nous comptons notamment y intégrer deux types d'outils :
- Un ensemble linguistique. Nous pensons notamment à Unitex (http://www-igm.univ-mlv.fr/~unitex/), un logiciel libre d'analyse lexicale automatique (issu des travaux de Maurice Gross au LADL). Il est utilisé dans la plateforme centrale de services ISTEX pour la reconnaissance et l'annotation des entités nommées.
- des outils résultant des travaux de l'équipe Synalp.
Pour 2016, nous comptons essentiellement utiliser ces outils dans la phase projet des formations.
Outils d'observation
Pour l'observation des pratiques des apprenants, nous comptons explorer deux voies principales :
- les historiques des pages wikis. En effet, les étudiants vont utiliser les wikis dans toutes les étapes de mise en place des serveurs (comme par exemple la définition de leurs stratégies de recherche)
- les analyses des fichiers logs php (là encore le fait de disposer d'une machine virtuelle simplifie le problème).
A plus long terme, on pourrait imaginer que les serveurs d'explorations produisent leurs données log. Des tests de faisabilité seront réalisés pendant le projet.