CIDE (2009) Al Hajjar : Différence entre versions

De CIDE
imported>Claire Zuliani
(Références bibliographique)
imported>Claire Zuliani
(Références bibliographique)
Ligne 314 : Ligne 314 :
 
{{CIDE biblio
 
{{CIDE biblio
 
   |id=Comes, 2008
 
   |id=Comes, 2008
   |id édité=[[A pour auteur cité::]], [[A pour auteur cité::]], [[A pour auteur cité::]], [[A pour auteur cité::]], [[A pour auteur cité::]] (2008)
+
   |id édité=[[A pour auteur cité::Calin-Adrian Comes|Comes, C.]], [[A pour auteur cité::L-D. Savu, Savu, L.]], [[A pour auteur cité::I-O Spatacean|Spatacean, I.]], [[A pour auteur cité::B. Stefan|Stefan, B.]], [[A pour auteur cité::A. Avram|Avram, A.]] (2008)
   |texte= C-A. Comes, L-D. Savu, I-O Spatacean, B. Stefan, A. Avram, Universal Symbolic Translator for Procedural Language over SQL, 7th WSEAS Int. Conf. on Applied Computer & Applied Computational Science (ACACOS '08), Hangzhou, Chine, 6-8 Avril, 2008
+
   |texte= Calin-Adrian Comes, L-D. Savu, I-O Spatacean, B. Stefan, A. Avram, Universal Symbolic Translator for Procedural Language over SQL, 7th WSEAS Int. Conf. on Applied Computer & Applied Computational Science (ACACOS '08), Hangzhou, Chine, 6-8 Avril, 2008
 
}}
 
}}
 
{{CIDE biblio
 
{{CIDE biblio
 
   |id=Micher, 2008
 
   |id=Micher, 2008
   |id édité=[[A pour auteur cité::
+
   |id édité=[[A pour auteur cité::Jeffrey Micher|Micher, J.]], [[A pour auteur cité::Clare Voss|Voss, C.]] (2008)
   |texte= J. Micher, C.Voss, Buckwalter-based Lookup Tool as Language Resource for Arabic Language Learners Software Engineering, Testing, and Quality Assurance for Natural Language Processing, pages 66–67, Columbus, Ohio, USA, June 2008.
+
   |texte= Jeffrey Micher, Clare Voss, Buckwalter-based Lookup Tool as Language Resource for Arabic Language Learners Software Engineering, Testing, and Quality Assurance for Natural Language Processing, pages 66–67, Columbus, Ohio, USA, June 2008.
 
}}
 
}}
 
{{CIDE biblio
 
{{CIDE biblio
 
   |id=Sinane, 2008
 
   |id=Sinane, 2008
   |id édité=[[A pour auteur cité::
+
   |id édité=[[A pour auteur cité::Majed Sanan|Sanan, M.]], [[A pour auteur cité::Mahmoud Rammal|Rammal, M.]], [[A pour auteur cité::Khaldoun Zreik|Zreik, K.]] (2008)
  |texte= M. Sinane, M. Rammal, K. Zreik, Arabic documents classification using N-gram, Conférence ICHSL6, Toulouse, 2008.
+
  |texte= Majed Sanan, Mahmoud Rammal, Khaldoun Zreik, Arabic documents classification using N-gram, Conférence ICHSL6, Toulouse, 2008.
 
}}
 
}}
  
Ligne 331 : Ligne 331 :
 
   |id=Baccar, 2008
 
   |id=Baccar, 2008
 
   |id édité=[[A pour auteur cité::
 
   |id édité=[[A pour auteur cité::
   |texte= F. Baccar, A. Khemakhem, B. Gargouri, K. Haddar, A. Ben Hamadou, Modélisation normalisée LMF des dictionnaires électroniques éditoriaux de l’arabe, TALN 2008, Avignon, France, 9-13 juin 2008.
+
   |texte= F. Baccar, A. Khemakhem, B. Gargouri, K. Haddar, A. Ben Hamadou, Modélisation normalisée LMF des dictionnaires électroniques éditoriaux de l’arabe, TALN 2008, Avignon, France, 9-13 juin 2008.
 
}}
 
}}
  
Ligne 348 : Ligne 348 :
 
   |id=Al Hajjar, 2009
 
   |id=Al Hajjar, 2009
 
   |id édité=[[A pour auteur cité::Abd El Salam al Hajjar|A. Al Hajjar]], [[A pour auteur cité::Mohammad Hajjar|M. Hajjar]], [[A pour auteur cité::Khaldoun Zreik|K. Zreik]] (2009)
 
   |id édité=[[A pour auteur cité::Abd El Salam al Hajjar|A. Al Hajjar]], [[A pour auteur cité::Mohammad Hajjar|M. Hajjar]], [[A pour auteur cité::Khaldoun Zreik|K. Zreik]] (2009)
   |texte= A. Al Hajjar, M. Hajjar, K. Zreik, Un nouveau système d'évaluation des méthodes d'extraction de la racine des mots arabes, (soumis), 2009.
+
   |texte= A. Al Hajjar, M. Hajjar, K. Zreik, Un nouveau système d'évaluation des méthodes d'extraction de la racine des mots arabes, (soumis), 2009.
 
}}
 
}}
 
{{CIDE biblio
 
{{CIDE biblio
 
   |id=Manzour, 2009
 
   |id=Manzour, 2009
 
   |id édité=[[A pour auteur cité::
 
   |id édité=[[A pour auteur cité::
   |texte= Ibn Manzour, Lisan Al-Arab. www.muhaddith.org, 2009.
+
   |texte= Ibn Manzour, Lisan Al-Arab. www.muhaddith.org, 2009.
 
}}
 
}}
 
{{CIDE biblio
 
{{CIDE biblio

Version du 6 décembre 2016 à 08:51

Un nouveau dictionnaire électronique structuré et évolutif de la langue arabe : DESELA


 
 

 
titre
Un nouveau dictionnaire électronique structuré et évolutif de la langue arabe : DESELA
auteurs
Abd El Salam al Hajjar (1,2), Mohammad Hajjar (2) et Khaldoun Zreik (2)
Affiliations
(1) : Institut Universitaire de Technologie, Université Libanaise, Liban
(2) : Laboratoire Paragraphe, Université de Paris 8 - Vincennes - Saint-Denis, France
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009) Al Hajjar.pdf
Mots-clés 
Langue arabe, Corpus, Dictionnaire, Extraction d’information, Racine.
Keywords
Arabic Language, Corpus, Dictionary, Information Extraction, Root.


Résumé
Dans cet article, nous proposons un nouveau dictionnaire électronique structuré et évolutif de la langue arabe (DESELA) qui peut être présenté sous la forme d’une base de données relationnelle ou d’un document XML et qui est facilement exploitable à l’aide des langages de requêtes appropriés. En effet, on trouve beaucoup de dictionnaires arabes mais qui ne sont pas directement exploitables puisqu’ils sont sous forme des fichiers texte plats. DESELA contient essentiellement les racines, les préfixes, les suffixes, les infixes, les modèles et les mots dérivés. De plus, pour un mot donné, il fournit les liens avec sa racine, avec les affixes associés et avec son modèle éventuel. DESELA est alimenté automatiquement à partir d’un ou de plusieurs dictionnaires textuels classiques et est enrichi en permanence avec des corpus textuels arabe quelconques grâce à un système que nous avons construit. Ce système est composé d’un parseur, d’un classifieur, d’un comparateur et d’un analyseur. Le parseur permet de transformer une source textuelle (dictionnaire ou corpus textuel) en un ensemble de mots. Le classifieur permet de classer un mot donné et de l’ajouter au DESELA en tant qu’une racine ou en tant qu’un mot dérivé. L’analyseur permet d’extraire les affixes et le modèle à partir d’un mot dérivé et de sa racine. Le comparateur permet d’éviter d’avoir des doublons, à tous les niveaux, dans DESELA. Ce dictionnaire peut être utilisé pour évaluer ces méthodes d’extraction d’information à partir d’un document arabe. Étant donné que le vocabulaire de la langue arabe est essentiellement construit à partir des racines, un mot arabe est construit à partir de sa racine en y ajoutant des affixes (préfixe, infixe, ou suffixe) selon un modèle précis. La plupart des méthodes d’extraction d’information à partir d’un document arabe procèdent inversement en extrayant la racine à partir du mot.