CIDE (2009) Al Hajjar : Différence entre versions

De CIDE
imported>Abdelhakim Aidene
imported>Abdelhakim Aidene
Ligne 252 : Ligne 252 :
 
==Références bibliographique==
 
==Références bibliographique==
  
[1] W. Adamson George, J. Boreham, The use of an association measure based on character structure to identify semantically related pairs of words and document titles, Information Storage and Retrieval, Vol. 10, pp 253-260, 1974.
+
{{CIDE biblio
[2] I. Al Kharashi, A Web Search Engine for Indexing, Searching and Publishing Arabic Bibliographic Databases, 1999.
+
  |id=1
[3] A. Chen, F. Gey, Building an Arabic stemmer for information retrieval.TREC-11 conference 2002.
+
  |texte= W. Adamson George, J. Boreham, The use of an association measure based on character structure to identify semantically related pairs of words and document titles, Information Storage and Retrieval, Vol. 10, pp 253-260, 1974.
 +
}}
 +
{{CIDE biblio
 +
  |id=2
 +
  |texte= I. Al Kharashi, A Web Search Engine for Indexing, Searching and Publishing Arabic Bibliographic Databases, 1999.
 +
}}
 +
{{CIDE biblio
 +
  |id=3
 +
  |texte= A. Chen, F. Gey, Building an Arabic stemmer for information retrieval.TREC-11 conference 2002.
  
[4] K. Darwish, Building a Shallow Arabic Morphological Analyzer in One Day. The ACL-02 Workshop on Computational Approaches to Semitic Languages, Philadelphia, USA, 2002.
+
}}
[5] L. S. Larkey, L. Ballesteros, M. E. Connel, Improving Stemming for Arabic Information Retrieval: Light Stemming and Co-occurrence Analysis, Proc. of the 25th annual international ACM SIGIR conference on Research and development in information retrieval, pp. 275 – 282, 2002.
+
{{CIDE biblio
[6] H. Suleiman Mustafa, Character contiguity in N-gram based word matching: the case for Arabic text searching . Information Processing and Management.41 (4), 819-827, 2004.
+
  |id=4
[7] G. Kanaan, R. Al-Shalabi, J. Jaarn, M. Al-Kabi, A. Hasnah, A New Stemming Algorithm to Extract Quadri-Literal Arabic Roots, 2004.
+
  |texte= K. Darwish, Building a Shallow Arabic Morphological Analyzer in One Day. The ACL-02 Workshop on Computational Approaches to Semitic Languages, Philadelphia, USA, 2002.
[8] K. Taghva, R. Elkoury, J. Coombs, Arabic Stemming without a root dictionary, International Conference on Information Technology: Coding and Computing (ITCC'05) - Volume I  pp. 152-157, 2005.
+
}}
[9] H. Al Ameed, S. Al Ketbi, A. Al Kaabi, K. Al Shebli, N. Al Shamsi, N. Al Nuaimi, S. Al Muhairi, Arabic Light Stemmer: A new Enhanced Approach , The Second International Conference on Innovations in Information Technology (IIT’05), 2005.
+
{{CIDE biblio
[10] L. Larkey, L. Ballesteros, M. Connell, Light Stemming for Arabic IR, Arabic Computational Morphology: Knowledge-based and Empirical Methods, A. Soudi, A. Van Bosch, and G. Neumann Editors.
+
  |id=5
 +
  |texte= L. S. Larkey, L. Ballesteros, M. E. Connel, Improving Stemming for Arabic Information Retrieval: Light Stemming and Co-occurrence Analysis, Proc. of the 25th annual international ACM SIGIR conference on Research and development in information retrieval, pp. 275 – 282, 2002.
 +
}}
 +
{{CIDE biblio
 +
  |id=6
 +
  |texte= H. Suleiman Mustafa, Character contiguity in N-gram based word matching: the case for Arabic text searching . Information Processing and Management.41 (4), 819-827, 2004.
 +
}}
 +
{{CIDE biblio
 +
  |id=7
 +
  |texte= G. Kanaan, R. Al-Shalabi, J. Jaarn, M. Al-Kabi, A. Hasnah, A New Stemming Algorithm to Extract Quadri-Literal Arabic Roots, 2004.
 +
}}
 +
{{CIDE biblio
 +
  |id=8
 +
  |texte= K. Taghva, R. Elkoury, J. Coombs, Arabic Stemming without a root dictionary, International Conference on Information Technology: Coding and Computing (ITCC'05) - Volume I  pp. 152-157, 2005.
 +
}}
 +
{{CIDE biblio
 +
  |id=9
 +
  |texte= H. Al Ameed, S. Al Ketbi, A. Al Kaabi, K. Al Shebli, N. Al Shamsi, N. Al Nuaimi, S. Al Muhairi, Arabic Light Stemmer: A new Enhanced Approach , The Second International Conference on Innovations in Information Technology (IIT’05), 2005.
 +
}}
 +
{{CIDE biblio
 +
  |id=10
 +
  |texte= L. Larkey, L. Ballesteros, M. Connell, Light Stemming for Arabic IR, Arabic Computational Morphology: Knowledge-based and Empirical Methods, A. Soudi, A. Van Bosch, and G. Neumann Editors.
 
Kluwer/Springer's series on Text, Speech, and Language Technology, 2005.
 
Kluwer/Springer's series on Text, Speech, and Language Technology, 2005.
[11] F .Douzidia, G. Lapalme, Un système de résumé de textes en arabe, 2ème Congrès International sur l'Ingénierie de l'Arabe et l'Ingénierie de la langue, Alger, 2005.
+
}}
[12] Y. Kadri, J. Nie, Effective Stemming for Arabic Information Retrieval, proceedings of theChallenge of Arabic for NLP/ MT Conference, Londres, Royaume-Uni, 2006.
+
{{CIDE biblio
[13] L. Khreisat, Arabic Text Classification Using N-gram Frequency Statistics A Comparative Study, The 2006 International Conference on Data Mining Part of the 2006 World Congress in Computer Sciences DMIN: 78-82, 2006.
+
  |id=11
[14] F. Ahmed, A. Nürnberger, N-grams Conflation Approach for Arabic, ACM SIGIR Conference, Amsterdam, 27 Juillet 2007.
+
  |texte= F .Douzidia, G. Lapalme, Un système de résumé de textes en arabe, 2ème Congrès International sur l'Ingénierie de l'Arabe et l'Ingénierie de la langue, Alger, 2005.
[15] A. M. El-Halees, Arabic Text Classification Using Maximum Entropy, The Islamic University Journal (Series of Natural Studies and Engineering) Vol. 15, No.1, pp 157-167, ISSN 1726-6807,
+
}}
 +
{{CIDE biblio
 +
  |id=12
 +
  |texte= Y. Kadri, J. Nie, Effective Stemming for Arabic Information Retrieval, proceedings of theChallenge of Arabic for NLP/ MT Conference, Londres, Royaume-Uni, 2006.
 +
}}
 +
{{CIDE biblio
 +
  |id=13
 +
  |texte= L. Khreisat, Arabic Text Classification Using N-gram Frequency Statistics A Comparative Study, The 2006 International Conference on Data Mining Part of the 2006 World Congress in Computer Sciences DMIN: 78-82, 2006.
 +
}}
 +
{{CIDE biblio
 +
  |id=14
 +
  |texte= F. Ahmed, A. Nürnberger, N-grams Conflation Approach for Arabic, ACM SIGIR Conference, Amsterdam, 27 Juillet 2007.
 +
}}
 +
{{CIDE biblio
 +
  |id=15
 +
  |texte= A. M. El-Halees, Arabic Text Classification Using Maximum Entropy, The Islamic University Journal (Series of Natural Studies and Engineering) Vol. 15, No.1, pp 157-167, ISSN 1726-6807,
 
http//www.iugzaza.edu.ps/ara/research/, 2007.
 
http//www.iugzaza.edu.ps/ara/research/, 2007.
[16] A. Khemakhem, B. Gargouri, A. Abdelwahed, G. Francopoulo, Modélisation des paradigmes de flexion des verbes arabes selon la norme LMF - ISO 24613, Traitement Automatique des Langues Naturelles, Toulouse, France, 5- 8 Juin 2007.
+
}}
 +
{{CIDE biblio
 +
  |id=16
 +
  |texte= A. Khemakhem, B. Gargouri, A. Abdelwahed, G. Francopoulo, Modélisation des paradigmes de flexion des verbes arabes selon la norme LMF - ISO 24613, Traitement Automatique des Langues Naturelles, Toulouse, France, 5- 8 Juin 2007.
  
[17] M. Ben Abderrahmen, B. Gargouri, M Jmaiel, LMF-QL: A graphical Tool to Query LMF databases, Third Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Poznań, Poland, 2007.
+
}}
[18] E. Norbert, Arabic Language Support in SQL Server, Microsoft corporation, SQL Server Technical Article, http://msdn.microsoft.com/en- us/library/cc295829(SQL.90).aspx, 2008.
+
{{CIDE biblio
[19] C-A. Comes, L-D. Savu, I-O Spatacean, B. Stefan, A. Avram, Universal Symbolic Translator for Procedural Language over SQL, 7th WSEAS Int. Conf. on Applied Computer & Applied Computational Science (ACACOS '08), Hangzhou, Chine, 6-8 Avril, 2008
+
  |id=17
[20] J. Micher, C.Voss, Buckwalter-based Lookup Tool as Language Resource for Arabic Language Learners Software Engineering, Testing, and Quality Assurance for Natural Language Processing, pages 66–67, Columbus, Ohio, USA, June 2008.
+
  |texte= M. Ben Abderrahmen, B. Gargouri, M Jmaiel, LMF-QL: A graphical Tool to Query LMF databases, Third Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Poznań, Poland, 2007.
[21] M. Sinane, M. Rammal, K. Zreik, Arabic documents classification using N-gram, Conférence ICHSL6, Toulouse, 2008.
+
}}
[22] F. Baccar, A. Khemakhem, B. Gargouri, K. Haddar, A. Ben Hamadou, Modélisation normalisée LMF des dictionnaires électroniques éditoriaux de l’arabe, TALN 2008, Avignon, France, 9-13 juin 2008.
+
{{CIDE biblio
[23] G. Francopoulo, M. George, Language resource management − Lexical markup framework (LMF), ISO/TC 37/SC 4 Rev.15, 2008.
+
  |id=18
[24] A. Al Hajjar, M. Hajjar, K. Zreik, Classification of Arabic Information Extraction methods, 2nd International Conference on Arabic Language Resources and Tools, Le Caire, Egypte, 21-23 Avril 2009.
+
  |texte= E. Norbert, Arabic Language Support in SQL Server, Microsoft corporation, SQL Server Technical Article, http://msdn.microsoft.com/en- us/library/cc295829(SQL.90).aspx, 2008.
 +
}}
 +
{{CIDE biblio
 +
  |id=19
 +
  |texte= C-A. Comes, L-D. Savu, I-O Spatacean, B. Stefan, A. Avram, Universal Symbolic Translator for Procedural Language over SQL, 7th WSEAS Int. Conf. on Applied Computer & Applied Computational Science (ACACOS '08), Hangzhou, Chine, 6-8 Avril, 2008
 +
}}
 +
{{CIDE biblio
 +
  |id=20
 +
  |texte= J. Micher, C.Voss, Buckwalter-based Lookup Tool as Language Resource for Arabic Language Learners Software Engineering, Testing, and Quality Assurance for Natural Language Processing, pages 66–67, Columbus, Ohio, USA, June 2008.
 +
}}
 +
{{CIDE biblio
 +
  |id=21
 +
  |texte= M. Sinane, M. Rammal, K. Zreik, Arabic documents classification using N-gram, Conférence ICHSL6, Toulouse, 2008.
 +
] F. Baccar, A. Khemakhem, B. Gargouri, K. Haddar, A. Ben Hamadou, Modélisation normalisée LMF des dictionnaires électroniques éditoriaux de l’arabe, TALN 2008, Avignon, France, 9-13 juin 2008.
 +
[23] G. Francopoulo, M. George, Language resource management − }}
 +
Lexical markup framework (LMF), ISO/TC 37/SC 4 Rev.15, 2008.
 +
[24] A. Al Hajjar, M. Hajjar, K. Zreik, Classification of Arabic Information Extraction methods, 2nd International Conference on Arabic Language Resources and Tools, Le Caire, Egypte, 21-23 Avr{{CIDE biblio
 +
il 2009.
 
[25] A. Al Hajjar, M. Hajjar, K. Zreik, Un nouveau système d'évaluation des méthodes d'extraction de la racine des mots arabes, (soumis), 2009.
 
[25] A. Al Hajjar, M. Hajjar, K. Zreik, Un nouveau système d'évaluation des méthodes d'extraction de la racine des mots arabes, (soumis), 2009.
 
[26] Ibn Manzour, Lisan Al-Arab. www.muhaddith.org, 2009.
 
[26] Ibn Manzour, Lisan Al-Arab. www.muhaddith.org, 2009.
[27] Sakher, Lexicons: Lisan Al-Arab, Al Qamous Al Mouhit, Al Wasit, Al Mouhit, Mouhit Al Mouhit, Al Ghani, Taj Al Arous, Najaat Al Raed, http://lexicons.sakhr.com, 2009.
+
[27] Sakher, Lexicons: Lisan Al-Arab |id=22
 +
, Al Qamous Al Mouhit, Al Wasit, Al Mouhit, Mouhit Al Mouhit, Al Ghani, Taj Al Arous, Najaat Al Raed, http://lexicons.sakhr.com, 2009.
 
[28] Academy of the Arabic Language, http://lexicons.sakhr.com/intro/intro.aspx?fileurl=intro01.asp, 2009.
 
[28] Academy of the Arabic Language, http://lexicons.sakhr.com/intro/intro.aspx?fileurl=intro01.asp, 2009.
[29] Islamic Library, Arabic Dictionaries: Al Misbah Al Mounir, Al Qamous Al Mouhit, Moujam Makayys Al Lougha, Moukhtar Al Sihah, http://www.islamweb.net/newlibrary/bookslist.php?subject= اﻟﻠﻐﺔ آﺘﺐ اﻟﻌﺮﺑﻴﺔ, 2009.
+
[29] Islamic L  |texte= F. Baccar, A. Khemakhem, B. Gargouri, K. Haddar, A. Ben Hamadou, Modélisation normalisée LMF des dictionnaires électroniques éditoriaux de l’arabe, TALN 2008, Avignon, France, 9-13 juin 2008.
 +
ibrary, Arabic Dictionaries: Al Misbah Al Mounir, Al Qamous Al Mouhit, Moujam Makayys Al Lougha, Moukhtar Al Sihah, http://www.islamweb.net/newlibrary/bookslist.php?subject= اﻟﻠﻐﺔ آﺘﺐ اﻟﻌﺮﺑﻴﺔ, 2009.}}
 +
{{CIDE biblio
 +
  |id=23
 +
  |texte= G. Francopoulo, M. George, Language resource management − Lexical markup framework (LMF), ISO/TC 37/SC 4 Rev.15, 2008.
 +
}}
 +
{{CIDE biblio
 +
  |id=24
 +
  |texte= A. Al Hajjar, M. Hajjar, K. Zreik, Classification of Arabic Information Extraction methods, 2nd International Conference on Arabic Language Resources and Tools, Le Caire, Egypte, 21-23 Avril 2009.
 +
}}
 +
{{CIDE biblio
 +
  |id=25
 +
  |texte= A. Al Hajjar, M. Hajjar, K. Zreik, Un nouveau système d'évaluation des méthodes d'extraction de la racine des mots arabes, (soumis), 2009.
 +
}}
 +
{{CIDE biblio
 +
  |id=26
 +
  |texte= Ibn Manzour, Lisan Al-Arab. www.muhaddith.org, 2009.
 +
}}
 +
{{CIDE biblio
 +
  |id=27
 +
  |texte= Sakher, Lexicons: Lisan Al-Arab, Al Qamous Al Mouhit, Al Wasit, Al Mouhit, Mouhit Al Mouhit, Al Ghani, Taj Al Arous, Najaat Al Raed, http://lexicons.sakhr.com, 2009.
 +
}}
 +
{{CIDE biblio
 +
  |id=28
 +
  |texte= Academy of the Arabic Language, http://lexicons.sakhr.com/intro/intro.aspx?fileurl=intro01.asp, 2009.
 +
 
 +
}}
 +
 
 +
{{CIDE biblio
 +
  |id=29
 +
  |texte= Islamic Library, Arabic Dictionaries: Al Misbah Al Mounir, Al Qamous Al Mouhit, Moujam Makayys Al Lougha, Moukhtar Al Sihah, http://www.islamweb.net/newlibrary/bookslist.php?subject= اﻟﻠﻐﺔ آﺘﺐ اﻟﻌﺮﺑﻴﺔ, 2009.
 +
 
 +
}}
 +
 
  
 
==Notes==
 
==Notes==

Version du 6 juillet 2016 à 13:59

Un nouveau dictionnaire électronique structuré et évolutif de la langue arabe : DESELA


 
 

 
titre
Un nouveau dictionnaire électronique structuré et évolutif de la langue arabe : DESELA
auteurs
Abd El Salam al Hajjar (1)(2), Mohammad Hajjar (2) et Khaldoun Zreik (2)
Affiliations
(1):Institut Universitaire de Technologie,Université Libanaise, Liban
(2) :Laboratoire Paragraphe, Université de Paris 8 - Vincennes - Saint- Denis, France
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009 al Hajjar.pdf
Mots-clés 
Langue arabe, Corpus, Dictionnaire, Extraction d’information, Racine.
Keywords
Arabic Language, Corpus, Dictionary, Information Extraction, Root.


Résumé
Dans cet article, nous proposons un nouveau dictionnaire électronique structuré et évolutif de la langue arabe (DESELA) qui peut être présenté sous la forme d’une base de données relationnelle ou d’un document XML et qui est facilement exploitable à l’aide des langages de requêtes appropriés. En effet, on trouve beaucoup de dictionnaires arabes mais qui ne sont pas directement exploitables puisqu’ils sont sous forme des fichiers texte plats. DESELA contient essentiellement les racines, les préfixes, les suffixes, les infixes, les modèles et les mots dérivés. De plus, pour un mot donné, il fournit les liens avec sa racine, avec les affixes associés et avec son modèle éventuel. DESELA est alimenté automatiquement à partir d’un ou de plusieurs dictionnaires textuels classiques et est enrichi en permanence avec des corpus textuels arabe quelconques grâce à un système que nous avons construit. Ce système est composé d’un parseur, d’un classifieur, d’un comparateur et d’un analyseur. Le parseur permet de transformer une source textuelle (dictionnaire ou corpus textuel) en un ensemble de mots. Le classifieur permet de classer un mot donné et de l’ajouter au DESELA en tant qu’une racine ou en tant qu’un mot dérivé. L’analyseur permet d’extraire les affixes et le modèle à partir d’un mot dérivé et de sa racine. Le comparateur permet d’éviter d’avoir des doublons, à tous les niveaux, dans DESELA. Ce dictionnaire peut être utilisé pour évaluer ces méthodes d’extraction d’information à partir d’un document arabe. Étant donné que le vocabulaire de la langue arabe est essentiellement construit à partir des racines, un mot arabe est construit à partir de sa racine en y ajoutant des affixes (préfixe, infixe, ou suffixe) selon un modèle précis. La plupart des méthodes d’extraction d’information à partir d’un document arabe procèdent inversement en extrayant la racine à partir du mot.