CIDE (2009) Yao : Différence entre versions

De CIDE
imported>Sabah Benlahbib
(Références bibliographiques)
imported>Thierry Daunois
(Références bibliographiques)
 
(8 révisions intermédiaires par un autre utilisateur non affichées)
Ligne 142 : Ligne 142 :
 
==Références bibliographiques==
 
==Références bibliographiques==
  
[i]{{CIDE biblio
+
{{CIDE biblio
 
  |id=Flesca, 2002
 
  |id=Flesca, 2002
  |id édité=[[A pour auteur cité::Sergio Flesca|FLESCA, S.]], [[A pour auteur cité::Giuseppe Manco|MANCO, G.]], [[A pour auteur cité::Elio Masciari|MASCIARI, E.]], [A pour auteur cité::Luigi Pontieri|PONTIERI, L.]], [[A pour auteur cité::Andrea Pugliese|PUGLIESE, A.]](2002)
+
  |id édité=[[A pour auteur cité::Sergio Flesca|FLESCA, S.]], [[A pour auteur cité::Giuseppe Manco|MANCO, G.]], [[A pour auteur cité::Elio Masciari|MASCIARI, E.]], [[A pour auteur cité::Luigi Pontieri|PONTIERI, L.]], [[A pour auteur cité::Andrea Pugliese|PUGLIESE, A.]] (2002).
  |texte=« Detecting Structural Similarities between XML Documents », in ''Proceedings of the International Workshop on the Web and Databases'' (WebDB), 2002
+
  |texte=« Detecting Structural Similarities between XML Documents », in ''Proceedings of the International Workshop on the Web and Databases'' (WebDB), 2002.
 
}}
 
}}
  
[ii]{{CIDE biblio
+
{{CIDE biblio
 
  |id=Nierman, 2002
 
  |id=Nierman, 2002
  |id édité=[[A pour auteur cité::Andrew Nierman|NIERMAN, A.]], [[A pour auteur cité::Jagadish H. V.|JAGADISH, H. V.]],(2002)
+
  |id édité=[[A pour auteur cité::Andrew Nierman|Nierman, A.]], [[A pour auteur cité::Jagadish H. V.|Jagadish, H. V.]],(2002)
  |texte=« Evaluating Structural Similarity in XML Documents. In Proceedings of the Fifth International Workshop on  the Web and Databases (WebDB 2002), Madison, Wisconsin, USA, 2002
+
  |texte=« Evaluating Structural Similarity in XML Documents », in ''Proceedings of the Fifth International Workshop on  the Web and Databases'' (WebDB 2002), Madison, Wisconsin, USA, 2002.
 
}}
 
}}
  
[iii]{{CIDE biblio
+
{{CIDE biblio
 
  |id=Francesca, 2003
 
  |id=Francesca, 2003
  |id édité=[[A pour auteur cité::Francesca Francesco D.|FRANCESCO D., F.]], [[A pour auteur cité::Gordano Gianluca|GIANLUCA, G.]],[[A pour auteur cité::Riccardo Ortale|ORTALE, R.]],[[A pour auteur cité::Andrea Tagarelli|TAGARELLI, A.]](2003)
+
  |id édité=[[A pour auteur cité::Francesca Francesco D.|Francesco D., F.]], [[A pour auteur cité::Gordano Gianluca|Gianluca, G.]],[[A pour auteur cité::Riccardo Ortale|Ortale, R.]],[[A pour auteur cité::Andrea Tagarelli|Tagarelli, A.]](2003)
  |texte=« Distance-based Clustering of XML Documents. In L. De Raedt et T. Washio (Eds.), MGTS-2003 : Proceedings of the First International Workshop on Mining Graphs, Trees and Sequences, pp. 75–78. 2003
+
  |texte=« Distance-based Clustering of XML Documents », in ''L. De Raedt et T. Washio (Eds.), MGTS-2003 : Proceedings of the First International Workshop on Mining Graphs, Trees and Sequences'', pp. 75–78. 2003.
 
}}
 
}}
  
[iv]{{CIDE biblio
+
{{CIDE biblio
 
  |id=Joshi, 2003
 
  |id=Joshi, 2003
  |id édité=[[A pour auteur cité:: Sachindra Joshi|JOSHI S.]], [[A pour auteur cité::Neeraj Agrawal|AGRAWAL, N.]],[[A pour auteur cité::Raghu Krishnapuram|KRISHNAPURAM, R.]],[[A pour auteur cité::Neji Sumit|SUMIT, N.]](2003)
+
  |id édité=[[A pour auteur cité:: Sachindra Joshi|Joshi S.]], [[A pour auteur cité::Neeraj Agrawal|Agrawal, N.]],[[A pour auteur cité::Raghu Krishnapuram|Krishnapuram, R.]],[[A pour auteur cité::Neji Sumit|Sumit, N.]](2003)
  |texte=« A  bag  of  paths  model for measuring structural similarity in Web documents. In Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining. 2003
+
  |texte=« A  bag  of  paths  model for measuring structural similarity in Web documents », in ''Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining''. 2003.
 
}}
 
}}
  
 
+
{{CIDE biblio
[v]{{CIDE biblio
 
 
  |id=Leung, 2005
 
  |id=Leung, 2005
  |id édité=[[A pour auteur cité:: Sachindra Joshi|JOSHI S.]], [[A pour auteur cité::Neeraj Agrawal|AGRAWAL, N.]],[[A pour auteur cité::Raghu Krishnapuram|KRISHNAPURAM, R.]],[[A pour auteur cité::Neji Sumit|SUMIT, N.]](2003)
+
  |id édité=[[A pour auteur cité:: Leung Ho-Pong|Ho-Pong L.]], [[A pour auteur cité::Chung Fu-lai|Fu-lai C.]],[[A pour auteur cité::Chan Stephen C.F.|Stephen C.F C.]],[[A pour auteur cité::Robert Luck|Luck, R.]](2005)
  |texte=« A  bag  of  paths  model for measuring structural similarity in Web documents. In Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining. 2003
+
  |texte=« Document Clustering Using Common XPath », in ''WIRI’05 Proceedings of the 2005 International Workshop on Challenges''. 2005
 
}}
 
}}
  
[v] Leung H., Chung  F., Chan S.C.F., Luk R. XML Document Clustering Using Common XPath. In WIRI’05 Proceedings of the 2005 International Workshop on Challenges. 2005
+
{{CIDE biblio
 +
|id=Vercoustre, 2005
 +
|id édité=[[A pour auteur cité:: Vercoustre Anne-Marie|Anne-Marie V.]], [[A pour auteur cité::Fegas Mounir|Mounir F.]],[[A pour auteur cité::Saba Gul|Gul S.]],[[A pour auteur cité::Lechevalier Yves|Yves L.]](2005)
 +
|texte=« A Flexible Structured-based Representation for XML Document Mining », in ''Workshop of the INitiative for the Evaluation of XML Retrieval'' (2005). page 443-457. 2005
 +
}}
  
[vi] Vercoustre A.M., Fegas M., Gul S., Lechevallier Y. A Flexible Structured-based Representation for XML Document Mining. In: Workshop of the INitiative for the Evaluation of XML Retrieval  (2005). page 443-457. 2005
+
{{CIDE biblio
 +
|id=Salton, 1988
 +
|id édité=[[A pour auteur cité:: Salton Gerard|Gerard S.]] (1988)
 +
|texte=« Automatic Text Processing », in ''Addison-Wesley Publishing Company''. 1988
 +
}}
  
[vii] Salton G. Automatic Text Processing. Addison-Wesley Publishing Company. 1988
+
{{CIDE biblio
 +
|id=Yang, 2002
 +
|id édité=[[A pour auteur cité:: Yang Jianwu|Jianwu Y.]], [[A pour auteur cité:: Chen Xiaoou|Xiaoou C.]].(2002)
 +
|texte=« A semi-structured document model for text mining », in ''J. Comput. Sci. Technol''. 17(5), 603–610. 2002
 +
}}
  
[viii]   Yang J., Chen X. A semi-structured document model for text mining.
+
{{CIDE biblio
J. Comput. Sci. Technol. 17(5), 603–610. 2002
+
|id=Yao, 2007
 +
|id édité=[[A pour auteur cité:: Yao Jin|Jin Y.]], [[A pour auteur cité:: Nadia Zerida|Zerida N.]].(2007)
 +
|texte=« Rare patterns to improve path-based clustering of Wikipedia articles », in ''XML data mining challenge INEX'07,Dagstuhl, Germany''. 2007
 +
}}
  
[ix] Yao J. et Zerida N. Rare patterns to improve path-based clustering of Wikipedia articles, In XML data mining challenge INEX'07,Dagstuhl, Germany, 2007
+
{{CIDE biblio
 +
|id=Yao, 2009
 +
|id édité=[[A pour auteur cité:: Yao Jin|Jin Y.]], [[A pour auteur cité:: Khaldoun Zreik|Khaldoun Z.]].(2009)
 +
|texte=« La question de la structure dans la catégorisation de documents XML hétérogènes », in ''Systèmes Intelligents, Edited by Mustapha Bellafkih, Mohammed Ramdani, Khaldoun Zreik''. SBN 978-2-909285-53-3, Ed. Europia, Juin 2009
 +
}}
  
[x] Yao J. et Zreik K. La question de la structure dans la catégorisation de documents XML hétérogènes. In Systèmes Intelligents, Edited by Mustapha Bellafkih, Mohammed Ramdani, Khaldoun Zreik. ISBN 978-2-909285-53-3, Ed. Europia, Juin 2009
+
{{CIDE biblio
 +
|id=Porter, 1980
 +
|id édité=[[A pour auteur cité:: Porter M.F|M.F P.]].(1980)
 +
|texte=« An algorithm for suffix stripping», in ''Program'', 14(3) pp 130−137. 1980
 +
}}
  
[xi] Porter M.F. An algorithm for suffix stripping. Program, 14(3) pp 130−137. 1980
+
{{CIDE biblio
 +
|id=Karypis, 2003
 +
|id édité=[[A pour auteur cité:: Karypis George|George K.]].(2003)
 +
|texte=« CLUTO: A Software Package for Clustering High- Dimensional Data Sets», in ''University of Minnesota, Dept. of Computer Science, Minneapolis, MN, Nov''. 2003. Release
 +
}}
  
[xii] Karypis G. CLUTO: A Software Package for Clustering High- Dimensional Data Sets. University of Minnesota, Dept. of Computer Science, Minneapolis, MN, Nov. 2003. Release
+
{{CIDE biblio
 +
|id=Zhao, 2005
 +
|id édité=[[A pour auteur cité:: Zhao Ying|Ying Z.]], [[A pour auteur cité:: Goerge Karypis|Karypis G.]].(2005)
 +
|texte=« Hierarchical Clustering Algorithms for Document Datasets », in ''Data Mining and  Knowledge  Discovery'', Vol. 10, No. 2, pp. 141 - 168. 2005
 +
}}
  
[xiii] Zhao Y. and Karypis G. Hierarchical Clustering Algorithms for Document Datasets. Data Mining and  Knowledge  Discovery, Vol. 10, No. 2, pp. 141 - 168. 2005
+
{{CIDE biblio
 
+
|id=Zhao, 2001
[xiv] Zhao Y. and Karypis G. Criterion functions for document clustering: Experiments and analysis. Technical Report TR #01–40, Department of Computer Science, University of Minnesota, Minneapolis, MN, 2001.
+
|id édité=[[A pour auteur cité:: Zhao Ying|Ying Z.]], [[A pour auteur cité:: Goerge Karypis|Karypis G.]].(2001)
 +
|texte=« Criterion functions for document clustering: Experiments and analysis », in ''Technical Report TR #01–40, Department of Computer Science, University of Minnesota, Minneapolis, MN,''. 2001.
 +
}}
  
 
==Notes==
 
==Notes==

Version actuelle datée du 30 janvier 2017 à 13:29

Une approche de catégorisation structurelle de documents numériques pour une meilleure exploitation du patrimoine juridique décisionnel


 
 

 
titre
Une approche de catégorisation structurelle de documents numériques pour une meilleure exploitation du patrimoine juridique décisionnel.
auteurs
Jin Yao (1), Jacques Madelaine (1) et Khaldoun Zreik(2)
Affiliations
(1):GREYC (Groupe de Recherche en Informatique, Image et Instrumentation de Caen) CNRS UMR 6072, Université de Caen, France
(2) :Laboratoire Paragraphe, Université de Paris 8, France
In
CIDE.12 (Montréal), 2009
En PDF 
CIDE (2009) Yao.pdf
Mots-clés 
Catégorisation de documents semi-structurés, extraction de connaissance, recherche d’information, patrimoine juridique décisionnel
Keywords
Semi-structured document clustering,knowledge discovery, information retrieval, decision support for legal heritage
Résumé
Le patrimoine de document juridique (loi, jurisprudence, brevet) s’est bien approprié l’univers de numérisation pour permettre une diffusion et une exploitation accrues des informations juridiques par des applications diverses. En conséquence, l’usage des bases documentaires juridiques partageables est devenu de plus en plus ouvert et fréquent favorisant ainsi un débit d’alimentation « semi- automatique » assez important. Constat 1: par semi-automatique, on entend un processus de dépôt direct des documents dans des bases contrôlées par des SGBDs qui exigent une intervention humaine réduite surtout au niveau de l’indexation et de la classification. En effet, ce sont les modèles de documents (leurs structures logiques et physiques modélisées par le langage de balisage) qui assurent un rôle important dans les processus d’indexation et de gestion. Donc ces modèles incorporent indirectement connaissance et savoir-faire.Constat 2 : devant une telle masse de données « très souvent textuelles », il devient indispensable d’adopter aussi une approche pour gérer les documents électroniques juridiques en tant que supports de connaissance et de savoir faire. Ceci nous mène vers des problématiques de recherche d’information et d’extraction de connaissance. Ces deux constats nous conduisent à formuler une hypothèse de classification automatique qui tiendra compte de connaissance et de savoir-faire incorporés dans les structures des modèles de documents électroniques juridiques. Aussi on constate que ces connaissances ou savoir-faire ne sont pas toujours explicites dans les corps de documents. Cela nous dirige vers une approche de catégorisation pour extraire des catégories décisionnelles. Cet article présente une méthode de représentation de document semi-structuré permettant d’analyser précisément les connaissances et le savoir-faire incorporé dans les contenus et les structures du document. Les expériences sur un corpus juridiques réel montrent que la prise en compte à la fois du contenu et de la structure conduit à une amélioration remarquable de qualité des catégories décisionnelles.