MSH Axe 2 - projet ASTTIC
Le projet ASTTIC (Annotation sémantique et terminologique de textes pour leur indexation et leur catégorisation) a pour but la constitution de corpus textuels, annotés sémantiquement, terminologiquement diffusables et accessibles pour la communauté scientifique.
Il est rattaché à l'Axe 2 de la MSH Lorraine.
- Responsable scientifique du projet : Laurence Kister
- Durée prévue : 36 mois
- Date de démarrage : 2011-01-01
Présentation
Le projet se fonde sur les résultats et les observations issus de travaux antérieurs associant sémantique lexicale, sémantique textuelle et terminologie.
ASTTIC a plusieurs objectifs :
- la mise au point, dans le domaine des sciences du langage, d'une méthodologie d'annotation de documents contribuant à l'amélioration de leur indexation (indexation assistée au sens documentaire). L'annotation suppose le repérage dans les textes des candidats termes caractérisques du domaine et leur désambiguïsation sémantique et terminologique
- l'enrichissement d'un thesaurus du domaine grâce aux candidats termes mis en évidence lors des étapes de repérage et de désambiguïsation
- la catégorisation des textes soit en textes scientifiques (écrit pour des spécialistes par des spécialistes) soit en textes de vulgarisation scientifique (écrit pour le grand public par des spécialistes ou des journalistes scientifiques) en fonction de leur degré de généricité ou de spécificité.
Le repérage et l'extraction du vocabulaire des sciences du langage présentent une difficulté spécifique liée à une de ses particularités : la proximité entre le vocabulaire du domaine de spécialité et la langue courante (arbre est un terme en syntaxe et un mot de la langue courante - composition est un terme dans les deux sous-domaines que sont la syntaxe et la morphologie ainsi qu'un terme de musicologie et un mot de la langue courante).
Laboratoires et chercheurs lorrains engagés
- Sabine Barreaux - Institut de l'information scientifique et technique
- Claire François - Institut de l'information scientifique et technique
- Bertrand Gaiffe - Analyse et traitement informatique de la langue française
- Jean-Marc Humbert - Analyse et traitement informatique de la langue française
- Évelyne Jacquey - Analyse et traitement informatique de la langue française
- Majid Khayari - Institut de l'information scientifique et technique
- Laurence Kister - Analyse et traitement informatique de la langue française
- Véronika Lux-Pogodalla - Analyse et traitement informatique de la langue française
- Sandrine Ollinger - Analyse et traitement informatique de la langue française
- Jessika Perignon - Analyse et traitement informatique de la langue française
- Étienne Petitjean - Analyse et traitement informatique de la langue française
- Laurent Romary - Laboratoire lorrain de recherche en informatique et ses applications, INRIA
- Stéphane Schneider - Institut de l'information scientifique et technique
- Yannick Toussaint - Laboratoire lorrain de recherche en informatique et ses applications, INRIA
Autres partenaires engagés dans le projet
- Agnès Tutin - Lidilem, Université Stendhal-Grenoble 3
- Marie-Paule Jacques - IUFM, Lidilem, Université Joseph Fourier Grenoble
- Béatrice Daille - Lina, Université de Nantes, École des mines
Voir aussi
- La présentation du projet ASTTIC sur le site de la MSH Lorraine.