Acfas (2017) Langlais

De Wicri Canada

Extraction ouverte d’information : de Wikipédia à Érudit


 
 

Titre
Extraction ouverte d’information : de Wikipédia à Érudit
Auteurs
Philippe Langlais
Affiliations
Université de Montréal
In
Analyser la science : les bibliothèques numériques comme objet de recherche (Acfas 2017 - Montréal)

Résumé

Tirer parti de la masse grandissante de textes disponibles sur la toile constitue un enjeu tant universitaire qu'industriel. Dans cette présentation, nous proposons un tour d’horizon des travaux en extraction ouverte d’information, en prenant soin d’en montrer les limites. Nous décrivons ensuite des scénarios d’utilisation de ces technologies pour les sciences humaines. Nous nous appuyons sur une expérience réalisée au RALI dans laquelle l’information extraite de Wikipédia a été mise à profit pour étiqueter des entités extraites de la base documentaire d’Érudit.