Acfas (2017) Langlais
De Wicri Canada
Extraction ouverte d’information : de Wikipédia à Érudit
|
Résumé
Tirer parti de la masse grandissante de textes disponibles sur la toile constitue un enjeu tant universitaire qu'industriel. Dans cette présentation, nous proposons un tour d’horizon des travaux en extraction ouverte d’information, en prenant soin d’en montrer les limites. Nous décrivons ensuite des scénarios d’utilisation de ces technologies pour les sciences humaines. Nous nous appuyons sur une expérience réalisée au RALI dans laquelle l’information extraite de Wikipédia a été mise à profit pour étiqueter des entités extraites de la base documentaire d’Érudit.