InforLorV4, PascalFrancis, Corpus, bibRecord, 000237

Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives

Identifieur interne : 000237 ( PascalFrancis/Corpus ); précédent : 000236; suivant : 000238

Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives

Auteurs : Pierre Pompidor ; Boris Carbonneill ; Michel Sala

Source :

Document numérique [ 1279-5127 ] ; 2009.

RBID : Pascal:10-0065111

Descripteurs français

Pascal (Inist)
- Analyse de corpus, Document structuré, Traitement automatique des langues naturelles, Analyse sémantique, Analyse cooccurrence, Indexation, Ontologie, Carte sémantique.

English descriptors

KwdEn :
- Cooccurrence analysis, Corpus analysis, Indexing, Natural language processing, Ontology, Semantic analysis, Semantic map, Structured document.

Abstract

Confrontés à la problématique de l'indexation de très grands corpus documentaires d'entreprises, nous avons mis au point une méthode simple mais efficace (en temps de calcul et de volumétrie), permettant de filtrer par document les co-occurrences les plus représentatives de ceux-ci. Le choix d'un contexte de co-occurrences a deux raisons. D'une part les requêtes portant sur des corpus spécialisés et composés par des experts, s'appuient sur peu de termes précisément choisis dont l'indexation des associations permet la construction de cartes sémantiques de navigation dans les concepts du corpus. Pour cela nous prenons en compte la structure des documents en validant les contenus des paragraphes par ceux de leurs titres. Notre méthode s'appuie sur des mesures tf.idf successives effectuées dans le contexte d'un document et non d'un corpus, sur les contenus des paragraphes auxquels sont intégrés progressivement la hiérarchie des titres les introduisant. D'autre part, nous exploitons simultanément une ontologie de contrôle et les requêtes des utilisateurs comportant les termes précédemment discriminés pour valider par le théorème de Bayes, les associations sémantiques ainsi déterminées, qui finalement permettent la production de cartes sémantiques.

Notice en format standard (ISO 2709)

Pour connaître la documentation sur le format Inist Standard.

A01	`01`	`1`		`@0 1279-5127`
A03		`1`		`@0 Doc. numér.`
A05				`@2 12`
A06				`@2 1`
A08	`01`	`1`	`FRE`	`@1 Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives`
A09	`01`	`1`	`FRE`	`@1 Documents annotés et langages d'indexation`
A11	`01`	`1`		`@1 POMPIDOR (Pierre)`
A11	`02`	`1`		`@1 CARBONNEILL (Boris)`
A11	`03`	`1`		`@1 SALA (Michel)`
A12	`01`	`1`		`@1 BENALI (Khalid) @9 ed.`
A12	`02`	`1`		`@1 RIEU (Dominique) @9 ed.`
A12	`03`	`1`		`@1 SOULE-DUPUY (Chantal) @9 ed.`
A14	`01`			`@1 LIRMM, UMR Université Montpellier II - CNRS @2 34090 Montpellier @3 FRA @Z 1 aut. @Z 3 aut.`
A14	`02`			`@1 Société C6, 770 av. Alfred Sauvy @2 34470 Perols @3 FRA @Z 2 aut.`
A15	`01`			`@1 Loria @2 Nancy @3 FRA @Z 1 aut.`
A15	`02`			`@1 LIG @2 Grenoble @3 FRA @Z 2 aut.`
A15	`03`			`@1 IRIT @2 Toulouse @3 FRA @Z 3 aut.`
A20				`@1 53-79`
A21				`@1 2009`
A23	`01`			`@0 ENG`
A24	`01`			`@0 fre`
A43	`01`			`@1 INIST @2 26597 @5 354000171134820030`
A44				`@0 0000 @1 © 2010 INIST-CNRS. All rights reserved.`
A45				`@0 1 p.1/4`
A47	`01`	`1`		`@0 10-0065111`
A60				`@1 P`
A61				`@0 A`
A64	`01`	`1`		`@0 Document numérique`
A66	`01`			`@0 FRA`
C01	`01`		`FRE`	@0 Confrontés à la problématique de l'indexation de très grands corpus documentaires d'entreprises, nous avons mis au point une méthode simple mais efficace (en temps de calcul et de volumétrie), permettant de filtrer par document les co-occurrences les plus représentatives de ceux-ci. Le choix d'un contexte de co-occurrences a deux raisons. D'une part les requêtes portant sur des corpus spécialisés et composés par des experts, s'appuient sur peu de termes précisément choisis dont l'indexation des associations permet la construction de cartes sémantiques de navigation dans les concepts du corpus. Pour cela nous prenons en compte la structure des documents en validant les contenus des paragraphes par ceux de leurs titres. Notre méthode s'appuie sur des mesures tf.idf successives effectuées dans le contexte d'un document et non d'un corpus, sur les contenus des paragraphes auxquels sont intégrés progressivement la hiérarchie des titres les introduisant. D'autre part, nous exploitons simultanément une ontologie de contrôle et les requêtes des utilisateurs comportant les termes précédemment discriminés pour valider par le théorème de Bayes, les associations sémantiques ainsi déterminées, qui finalement permettent la production de cartes sémantiques.
C02	`01`	`X`		`@0 001A01E02C1`
C03	`01`	`L`	`FRE`	`@0 Analyse de corpus @2 NI @5 04`
C03	`01`	`L`	`ENG`	`@0 Corpus analysis @2 NI @5 04`
C03	`02`	`X`	`FRE`	`@0 Document structuré @5 05`
C03	`02`	`X`	`ENG`	`@0 Structured document @5 05`
C03	`02`	`X`	`SPA`	`@0 Documento estructurado @5 05`
C03	`03`	`L`	`FRE`	`@0 Traitement automatique des langues naturelles @2 NI @5 06`
C03	`03`	`L`	`ENG`	`@0 Natural language processing @2 NI @5 06`
C03	`04`	`X`	`FRE`	`@0 Analyse sémantique @5 07`
C03	`04`	`X`	`ENG`	`@0 Semantic analysis @5 07`
C03	`04`	`X`	`SPA`	`@0 Análisis semántico @5 07`
C03	`05`	`X`	`FRE`	`@0 Analyse cooccurrence @2 NI @5 08`
C03	`05`	`X`	`ENG`	`@0 Cooccurrence analysis @2 NI @5 08`
C03	`05`	`X`	`SPA`	`@0 Análisis coocurrencia @2 NI @5 08`
C03	`06`	`X`	`FRE`	`@0 Indexation @5 09`
C03	`06`	`X`	`ENG`	`@0 Indexing @5 09`
C03	`06`	`X`	`SPA`	`@0 Indización @5 09`
C03	`07`	`X`	`FRE`	`@0 Ontologie @5 10`
C03	`07`	`X`	`ENG`	`@0 Ontology @5 10`
C03	`07`	`X`	`SPA`	`@0 Ontología @5 10`
C03	`08`	`X`	`FRE`	`@0 Carte sémantique @4 CD @5 96`
C03	`08`	`X`	`ENG`	`@0 Semantic map @4 CD @5 96`
N21				`@1 039`

Format Inist (serveur)

NO :	PASCAL 10-0065111 INIST
FT :	Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives
AU :	POMPIDOR (Pierre); CARBONNEILL (Boris); SALA (Michel); BENALI (Khalid); RIEU (Dominique); SOULE-DUPUY (Chantal)
AF :	LIRMM, UMR Université Montpellier II - CNRS/34090 Montpellier/France (1 aut., 3 aut.); Société C6, 770 av. Alfred Sauvy/34470 Perols/France (2 aut.); Loria/Nancy/France (1 aut.); LIG/Grenoble/France (2 aut.); IRIT/Toulouse/France (3 aut.)
DT :	Publication en série; Niveau analytique
SO :	Document numérique; ISSN 1279-5127; France; Da. 2009; Vol. 12; No. 1; Pp. 53-79; Abs. français; Bibl. 1 p.1/4
LA :	Anglais
FA :	Confrontés à la problématique de l'indexation de très grands corpus documentaires d'entreprises, nous avons mis au point une méthode simple mais efficace (en temps de calcul et de volumétrie), permettant de filtrer par document les co-occurrences les plus représentatives de ceux-ci. Le choix d'un contexte de co-occurrences a deux raisons. D'une part les requêtes portant sur des corpus spécialisés et composés par des experts, s'appuient sur peu de termes précisément choisis dont l'indexation des associations permet la construction de cartes sémantiques de navigation dans les concepts du corpus. Pour cela nous prenons en compte la structure des documents en validant les contenus des paragraphes par ceux de leurs titres. Notre méthode s'appuie sur des mesures tf.idf successives effectuées dans le contexte d'un document et non d'un corpus, sur les contenus des paragraphes auxquels sont intégrés progressivement la hiérarchie des titres les introduisant. D'autre part, nous exploitons simultanément une ontologie de contrôle et les requêtes des utilisateurs comportant les termes précédemment discriminés pour valider par le théorème de Bayes, les associations sémantiques ainsi déterminées, qui finalement permettent la production de cartes sémantiques.
CC :	001A01E02C1
FD :	Analyse de corpus; Document structuré; Traitement automatique des langues naturelles; Analyse sémantique; Analyse cooccurrence; Indexation; Ontologie; Carte sémantique
ED :	Corpus analysis; Structured document; Natural language processing; Semantic analysis; Cooccurrence analysis; Indexing; Ontology; Semantic map
SD :	Documento estructurado; Análisis semántico; Análisis coocurrencia; Indización; Ontología
LO :	INIST-26597.354000171134820030
ID :	10-0065111

Links to Exploration step

Pascal:10-0065111

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="fr" level="a">Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives</title>
<author><name sortKey="Pompidor, Pierre" sort="Pompidor, Pierre" uniqKey="Pompidor P" first="Pierre" last="Pompidor">Pierre Pompidor</name>
<affiliation><inist:fA14 i1="01"><s1>LIRMM, UMR Université Montpellier II - CNRS</s1>
<s2>34090 Montpellier</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Carbonneill, Boris" sort="Carbonneill, Boris" uniqKey="Carbonneill B" first="Boris" last="Carbonneill">Boris Carbonneill</name>
<affiliation><inist:fA14 i1="02"><s1>Société C6, 770 av. Alfred Sauvy</s1>
<s2>34470 Perols</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Sala, Michel" sort="Sala, Michel" uniqKey="Sala M" first="Michel" last="Sala">Michel Sala</name>
<affiliation><inist:fA14 i1="01"><s1>LIRMM, UMR Université Montpellier II - CNRS</s1>
<s2>34090 Montpellier</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">10-0065111</idno>
<date when="2009">2009</date>
<idno type="stanalyst">PASCAL 10-0065111 INIST</idno>
<idno type="RBID">Pascal:10-0065111</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000237</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="fr" level="a">Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives</title>
<author><name sortKey="Pompidor, Pierre" sort="Pompidor, Pierre" uniqKey="Pompidor P" first="Pierre" last="Pompidor">Pierre Pompidor</name>
<affiliation><inist:fA14 i1="01"><s1>LIRMM, UMR Université Montpellier II - CNRS</s1>
<s2>34090 Montpellier</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Carbonneill, Boris" sort="Carbonneill, Boris" uniqKey="Carbonneill B" first="Boris" last="Carbonneill">Boris Carbonneill</name>
<affiliation><inist:fA14 i1="02"><s1>Société C6, 770 av. Alfred Sauvy</s1>
<s2>34470 Perols</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Sala, Michel" sort="Sala, Michel" uniqKey="Sala M" first="Michel" last="Sala">Michel Sala</name>
<affiliation><inist:fA14 i1="01"><s1>LIRMM, UMR Université Montpellier II - CNRS</s1>
<s2>34090 Montpellier</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Document numérique</title>
<title level="j" type="abbreviated">Doc. numér.</title>
<idno type="ISSN">1279-5127</idno>
<imprint><date when="2009">2009</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Document numérique</title>
<title level="j" type="abbreviated">Doc. numér.</title>
<idno type="ISSN">1279-5127</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Cooccurrence analysis</term>
<term>Corpus analysis</term>
<term>Indexing</term>
<term>Natural language processing</term>
<term>Ontology</term>
<term>Semantic analysis</term>
<term>Semantic map</term>
<term>Structured document</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Analyse de corpus</term>
<term>Document structuré</term>
<term>Traitement automatique des langues naturelles</term>
<term>Analyse sémantique</term>
<term>Analyse cooccurrence</term>
<term>Indexation</term>
<term>Ontologie</term>
<term>Carte sémantique</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Confrontés à la problématique de l'indexation de très grands corpus documentaires d'entreprises, nous avons mis au point une méthode simple mais efficace (en temps de calcul et de volumétrie), permettant de filtrer par document les co-occurrences les plus représentatives de ceux-ci. Le choix d'un contexte de co-occurrences a deux raisons. D'une part les requêtes portant sur des corpus spécialisés et composés par des experts, s'appuient sur peu de termes précisément choisis dont l'indexation des associations permet la construction de cartes sémantiques de navigation dans les concepts du corpus. Pour cela nous prenons en compte la structure des documents en validant les contenus des paragraphes par ceux de leurs titres. Notre méthode s'appuie sur des mesures tf.idf successives effectuées dans le contexte d'un document et non d'un corpus, sur les contenus des paragraphes auxquels sont intégrés progressivement la hiérarchie des titres les introduisant. D'autre part, nous exploitons simultanément une ontologie de contrôle et les requêtes des utilisateurs comportant les termes précédemment discriminés pour valider par le théorème de Bayes, les associations sémantiques ainsi déterminées, qui finalement permettent la production de cartes sémantiques.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA01 i1="01" i2="1"><s0>1279-5127</s0>
</fA01>
<fA03 i2="1"><s0>Doc. numér.</s0>
</fA03>
<fA05><s2>12</s2>
</fA05>
<fA06><s2>1</s2>
</fA06>
<fA08 i1="01" i2="1" l="FRE"><s1>Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives</s1>
</fA08>
<fA09 i1="01" i2="1" l="FRE"><s1>Documents annotés et langages d'indexation</s1>
</fA09>
<fA11 i1="01" i2="1"><s1>POMPIDOR (Pierre)</s1>
</fA11>
<fA11 i1="02" i2="1"><s1>CARBONNEILL (Boris)</s1>
</fA11>
<fA11 i1="03" i2="1"><s1>SALA (Michel)</s1>
</fA11>
<fA12 i1="01" i2="1"><s1>BENALI (Khalid)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1"><s1>RIEU (Dominique)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="03" i2="1"><s1>SOULE-DUPUY (Chantal)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01"><s1>LIRMM, UMR Université Montpellier II - CNRS</s1>
<s2>34090 Montpellier</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</fA14>
<fA14 i1="02"><s1>Société C6, 770 av. Alfred Sauvy</s1>
<s2>34470 Perols</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</fA14>
<fA15 i1="01"><s1>Loria</s1>
<s2>Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</fA15>
<fA15 i1="02"><s1>LIG</s1>
<s2>Grenoble</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</fA15>
<fA15 i1="03"><s1>IRIT</s1>
<s2>Toulouse</s2>
<s3>FRA</s3>
<sZ>3 aut.</sZ>
</fA15>
<fA20><s1>53-79</s1>
</fA20>
<fA21><s1>2009</s1>
</fA21>
<fA23 i1="01"><s0>ENG</s0>
</fA23>
<fA24 i1="01"><s0>fre</s0>
</fA24>
<fA43 i1="01"><s1>INIST</s1>
<s2>26597</s2>
<s5>354000171134820030</s5>
</fA43>
<fA44><s0>0000</s0>
<s1>© 2010 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45><s0>1 p.1/4</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>10-0065111</s0>
</fA47>
<fA60><s1>P</s1>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA64 i1="01" i2="1"><s0>Document numérique</s0>
</fA64>
<fA66 i1="01"><s0>FRA</s0>
</fA66>
<fC01 i1="01" l="FRE"><s0>Confrontés à la problématique de l'indexation de très grands corpus documentaires d'entreprises, nous avons mis au point une méthode simple mais efficace (en temps de calcul et de volumétrie), permettant de filtrer par document les co-occurrences les plus représentatives de ceux-ci. Le choix d'un contexte de co-occurrences a deux raisons. D'une part les requêtes portant sur des corpus spécialisés et composés par des experts, s'appuient sur peu de termes précisément choisis dont l'indexation des associations permet la construction de cartes sémantiques de navigation dans les concepts du corpus. Pour cela nous prenons en compte la structure des documents en validant les contenus des paragraphes par ceux de leurs titres. Notre méthode s'appuie sur des mesures tf.idf successives effectuées dans le contexte d'un document et non d'un corpus, sur les contenus des paragraphes auxquels sont intégrés progressivement la hiérarchie des titres les introduisant. D'autre part, nous exploitons simultanément une ontologie de contrôle et les requêtes des utilisateurs comportant les termes précédemment discriminés pour valider par le théorème de Bayes, les associations sémantiques ainsi déterminées, qui finalement permettent la production de cartes sémantiques.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001A01E02C1</s0>
</fC02>
<fC03 i1="01" i2="L" l="FRE"><s0>Analyse de corpus</s0>
<s2>NI</s2>
<s5>04</s5>
</fC03>
<fC03 i1="01" i2="L" l="ENG"><s0>Corpus analysis</s0>
<s2>NI</s2>
<s5>04</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Document structuré</s0>
<s5>05</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Structured document</s0>
<s5>05</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Documento estructurado</s0>
<s5>05</s5>
</fC03>
<fC03 i1="03" i2="L" l="FRE"><s0>Traitement automatique des langues naturelles</s0>
<s2>NI</s2>
<s5>06</s5>
</fC03>
<fC03 i1="03" i2="L" l="ENG"><s0>Natural language processing</s0>
<s2>NI</s2>
<s5>06</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Analyse sémantique</s0>
<s5>07</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Semantic analysis</s0>
<s5>07</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Análisis semántico</s0>
<s5>07</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Analyse cooccurrence</s0>
<s2>NI</s2>
<s5>08</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Cooccurrence analysis</s0>
<s2>NI</s2>
<s5>08</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Análisis coocurrencia</s0>
<s2>NI</s2>
<s5>08</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Indexation</s0>
<s5>09</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Indexing</s0>
<s5>09</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Indización</s0>
<s5>09</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Ontologie</s0>
<s5>10</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>Ontology</s0>
<s5>10</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Ontología</s0>
<s5>10</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE"><s0>Carte sémantique</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fC03 i1="08" i2="X" l="ENG"><s0>Semantic map</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fN21><s1>039</s1>
</fN21>
</pA>
</standard>
<server><NO>PASCAL 10-0065111 INIST</NO>
<FT>Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives</FT>
<AU>POMPIDOR (Pierre); CARBONNEILL (Boris); SALA (Michel); BENALI (Khalid); RIEU (Dominique); SOULE-DUPUY (Chantal)</AU>
<AF>LIRMM, UMR Université Montpellier II - CNRS/34090 Montpellier/France (1 aut., 3 aut.); Société C6, 770 av. Alfred Sauvy/34470 Perols/France (2 aut.); Loria/Nancy/France (1 aut.); LIG/Grenoble/France (2 aut.); IRIT/Toulouse/France (3 aut.)</AF>
<DT>Publication en série; Niveau analytique</DT>
<SO>Document numérique; ISSN 1279-5127; France; Da. 2009; Vol. 12; No. 1; Pp. 53-79; Abs. français; Bibl. 1 p.1/4</SO>
<LA>Anglais</LA>
<FA>Confrontés à la problématique de l'indexation de très grands corpus documentaires d'entreprises, nous avons mis au point une méthode simple mais efficace (en temps de calcul et de volumétrie), permettant de filtrer par document les co-occurrences les plus représentatives de ceux-ci. Le choix d'un contexte de co-occurrences a deux raisons. D'une part les requêtes portant sur des corpus spécialisés et composés par des experts, s'appuient sur peu de termes précisément choisis dont l'indexation des associations permet la construction de cartes sémantiques de navigation dans les concepts du corpus. Pour cela nous prenons en compte la structure des documents en validant les contenus des paragraphes par ceux de leurs titres. Notre méthode s'appuie sur des mesures tf.idf successives effectuées dans le contexte d'un document et non d'un corpus, sur les contenus des paragraphes auxquels sont intégrés progressivement la hiérarchie des titres les introduisant. D'autre part, nous exploitons simultanément une ontologie de contrôle et les requêtes des utilisateurs comportant les termes précédemment discriminés pour valider par le théorème de Bayes, les associations sémantiques ainsi déterminées, qui finalement permettent la production de cartes sémantiques.</FA>
<CC>001A01E02C1</CC>
<FD>Analyse de corpus; Document structuré; Traitement automatique des langues naturelles; Analyse sémantique; Analyse cooccurrence; Indexation; Ontologie; Carte sémantique</FD>
<ED>Corpus analysis; Structured document; Natural language processing; Semantic analysis; Cooccurrence analysis; Indexing; Ontology; Semantic map</ED>
<SD>Documento estructurado; Análisis semántico; Análisis coocurrencia; Indización; Ontología</SD>
<LO>INIST-26597.354000171134820030</LO>
<ID>10-0065111</ID>
</server>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Corpus

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000237 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000237 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Corpus
   |type=    RBID
   |clé=     Pascal:10-0065111
   |texte=   Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives
}}

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022

	Serveur d'exploration sur la recherche en informatique en Lorraine
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur la recherche en informatique en Lorraine

Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives

Indexation de co-occurrences dans des corpus de documents structurés et production de cartes sémantiques interactives

Source :

Descripteurs français

English descriptors

Abstract

Notice en format standard (ISO 2709)

Format Inist (serveur)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri