InforLorV4, PascalFrancis, Corpus, bibRecord, 000754

Fouille de textes par combinaison de règles d'association et d'indices statistiques

Identifieur interne : 000754 ( PascalFrancis/Corpus ); précédent : 000753; suivant : 000755

Fouille de textes par combinaison de règles d'association et d'indices statistiques

Auteurs : Hacène Cherfi ; Yannick Toussaint

Source :

RBID : Pascal:03-0457716

Descripteurs français

Pascal (Inist)
- Extraction information, Traitement document, Terminologie, Association, Indice statistique, Texte, Analyse contenu, Indexation automatique, Etude cas, Biologie moléculaire, Règle, Fouille de texte.

English descriptors

KwdEn :
- Association, Automatic indexing, Case study, Content analysis, Document processing, Information extraction, Molecular biology, Statistical index, Terminology, Text, Text mining.

Abstract

Nous proposons la description d'une méthodologie d'accès et de lecture des règles d'association extraites à partir de textes. Le corpus ayant servi à notre expérimentation est constitué de résumés d'articles scientifiques dans le domaine de la biologie moléculaire. Ce processus génère un trop grand nombre de règles et nous amène à chercher à les trier de la plus informative à la moins informative. Le classement est établi suivant des indices statistiques. Une discussion sur nos résultats identifie quelques points ayant un impact sur l'interprétabilité des règles d'association.

Notice en format standard (ISO 2709)

Pour connaître la documentation sur le format Inist Standard.

A08	`01`	`1`	`FRE`	`@1 Fouille de textes par combinaison de règles d'association et d'indices statistiques`
A09	`01`	`1`	`FRE`	`@1 CIFT '2002 : colloque international sur la fouille de texte : Hammamet, 21-23 octobre 2002`
A11	`01`	`1`		`@1 CHERFI (Hacène)`
A11	`02`	`1`		`@1 TOUSSAINT (Yannick)`
A12	`01`	`1`		`@1 TOUSSAINT (Y.) @9 ed.`
A12	`02`	`1`		`@1 NEDELLEC (C.) @9 ed.`
A14	`01`			`@1 Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239 @2 Vandœuvre-lès-Nancy 54506 @3 FRA @Z 1 aut. @Z 2 aut.`
A20				`@1 67-80`
A21				`@1 2002`
A23	`01`			`@0 FRE`
A24	`01`			`@0 eng`
A25	`01`			`@1 INRIA @2 Le Chesnay`
A26	`01`			`@0 2-7261-1224-2`
A30	`01`	`1`	`FRE`	`@1 Colloque international sur la fouille de texte @3 Hammamet TUN @4 2002-10-21`
A43	`01`			`@1 INIST @2 Y 34561 @5 354000108545950050`
A44				`@0 0000 @1 © 2003 INIST-CNRS. All rights reserved.`
A45				`@0 1 p.1/4`
A47	`01`	`1`		`@0 03-0457716`
A60				`@1 C`
A61				`@0 A`
A66	`01`			`@0 CHE`
A68	`01`	`1`	`ENG`	`@1 Text mining by combination of association rules and statistical indices`
A69	`01`	`1`	`ENG`	`@1 Text mining`
C01	`01`		`FRE`	@0 Nous proposons la description d'une méthodologie d'accès et de lecture des règles d'association extraites à partir de textes. Le corpus ayant servi à notre expérimentation est constitué de résumés d'articles scientifiques dans le domaine de la biologie moléculaire. Ce processus génère un trop grand nombre de règles et nous amène à chercher à les trier de la plus informative à la moins informative. Le classement est établi suivant des indices statistiques. Une discussion sur nos résultats identifie quelques points ayant un impact sur l'interprétabilité des règles d'association.
C02	`01`	`X`		`@0 001A01F06`
C02	`02`	`X`		`@0 205`
C03	`01`	`X`	`FRE`	`@0 Extraction information @5 01`
C03	`01`	`X`	`ENG`	`@0 Information extraction @5 01`
C03	`01`	`X`	`SPA`	`@0 Extracción información @5 01`
C03	`02`	`X`	`FRE`	`@0 Traitement document @5 02`
C03	`02`	`X`	`ENG`	`@0 Document processing @5 02`
C03	`02`	`X`	`SPA`	`@0 Tratamiento documento @5 02`
C03	`03`	`X`	`FRE`	`@0 Terminologie @5 03`
C03	`03`	`X`	`ENG`	`@0 Terminology @5 03`
C03	`03`	`X`	`SPA`	`@0 Terminología @5 03`
C03	`04`	`X`	`FRE`	`@0 Association @5 04`
C03	`04`	`X`	`ENG`	`@0 Association @5 04`
C03	`04`	`X`	`SPA`	`@0 Asociación @5 04`
C03	`05`	`X`	`FRE`	`@0 Indice statistique @5 05`
C03	`05`	`X`	`ENG`	`@0 Statistical index @5 05`
C03	`05`	`X`	`SPA`	`@0 Indice estadístico @5 05`
C03	`06`	`X`	`FRE`	`@0 Texte @5 06`
C03	`06`	`X`	`ENG`	`@0 Text @5 06`
C03	`06`	`X`	`SPA`	`@0 Texto @5 06`
C03	`07`	`X`	`FRE`	`@0 Analyse contenu @5 07`
C03	`07`	`X`	`ENG`	`@0 Content analysis @5 07`
C03	`07`	`X`	`SPA`	`@0 Análisis contenido @5 07`
C03	`08`	`X`	`FRE`	`@0 Indexation automatique @5 08`
C03	`08`	`X`	`ENG`	`@0 Automatic indexing @5 08`
C03	`08`	`X`	`SPA`	`@0 Indización automática @5 08`
C03	`09`	`X`	`FRE`	`@0 Etude cas @5 09`
C03	`09`	`X`	`ENG`	`@0 Case study @5 09`
C03	`09`	`X`	`SPA`	`@0 Estudio caso @5 09`
C03	`10`	`X`	`FRE`	`@0 Biologie moléculaire @5 10`
C03	`10`	`X`	`ENG`	`@0 Molecular biology @5 10`
C03	`10`	`X`	`SPA`	`@0 Biología molecular @5 10`
C03	`11`	`X`	`FRE`	`@0 Règle @2 NI @4 INC @5 27`
C03	`12`	`X`	`FRE`	`@0 Fouille de texte @2 NI @4 CD @5 96`
C03	`12`	`X`	`ENG`	`@0 Text mining @2 NI @4 CD @5 96`
N21				`@1 315`
N82				`@1 PSI`

Format Inist (serveur)

NO :	PASCAL 03-0457716 INIST
FT :	Fouille de textes par combinaison de règles d'association et d'indices statistiques
ET :	(Text mining by combination of association rules and statistical indices)
AU :	CHERFI (Hacène); TOUSSAINT (Yannick); TOUSSAINT (Y.); NEDELLEC (C.)
AF :	Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239/Vandœuvre-lès-Nancy 54506/France (1 aut., 2 aut.)
DT :	Congrès; Niveau analytique
SO :	Colloque international sur la fouille de texte/2002-10-21/Hammamet TUN; Suisse; Le Chesnay: INRIA; Da. 2002; Pp. 67-80; ISBN 2-7261-1224-2
LA :	Français
FA :	Nous proposons la description d'une méthodologie d'accès et de lecture des règles d'association extraites à partir de textes. Le corpus ayant servi à notre expérimentation est constitué de résumés d'articles scientifiques dans le domaine de la biologie moléculaire. Ce processus génère un trop grand nombre de règles et nous amène à chercher à les trier de la plus informative à la moins informative. Le classement est établi suivant des indices statistiques. Une discussion sur nos résultats identifie quelques points ayant un impact sur l'interprétabilité des règles d'association.
CC :	001A01F06; 205
FD :	Extraction information; Traitement document; Terminologie; Association; Indice statistique; Texte; Analyse contenu; Indexation automatique; Etude cas; Biologie moléculaire; Règle; Fouille de texte
ED :	Information extraction; Document processing; Terminology; Association; Statistical index; Text; Content analysis; Automatic indexing; Case study; Molecular biology; Text mining
SD :	Extracción información; Tratamiento documento; Terminología; Asociación; Indice estadístico; Texto; Análisis contenido; Indización automática; Estudio caso; Biología molecular
LO :	INIST-Y 34561.354000108545950050
ID :	03-0457716

Links to Exploration step

Pascal:03-0457716

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="fr" level="a">Fouille de textes par combinaison de règles d'association et d'indices statistiques</title>
<author><name sortKey="Cherfi, Hacene" sort="Cherfi, Hacene" uniqKey="Cherfi H" first="Hacène" last="Cherfi">Hacène Cherfi</name>
<affiliation><inist:fA14 i1="01"><s1>Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239</s1>
<s2>Vandœuvre-lès-Nancy 54506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Toussaint, Yannick" sort="Toussaint, Yannick" uniqKey="Toussaint Y" first="Yannick" last="Toussaint">Yannick Toussaint</name>
<affiliation><inist:fA14 i1="01"><s1>Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239</s1>
<s2>Vandœuvre-lès-Nancy 54506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">03-0457716</idno>
<date when="2002">2002</date>
<idno type="stanalyst">PASCAL 03-0457716 INIST</idno>
<idno type="RBID">Pascal:03-0457716</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000754</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="fr" level="a">Fouille de textes par combinaison de règles d'association et d'indices statistiques</title>
<author><name sortKey="Cherfi, Hacene" sort="Cherfi, Hacene" uniqKey="Cherfi H" first="Hacène" last="Cherfi">Hacène Cherfi</name>
<affiliation><inist:fA14 i1="01"><s1>Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239</s1>
<s2>Vandœuvre-lès-Nancy 54506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Toussaint, Yannick" sort="Toussaint, Yannick" uniqKey="Toussaint Y" first="Yannick" last="Toussaint">Yannick Toussaint</name>
<affiliation><inist:fA14 i1="01"><s1>Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239</s1>
<s2>Vandœuvre-lès-Nancy 54506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Association</term>
<term>Automatic indexing</term>
<term>Case study</term>
<term>Content analysis</term>
<term>Document processing</term>
<term>Information extraction</term>
<term>Molecular biology</term>
<term>Statistical index</term>
<term>Terminology</term>
<term>Text</term>
<term>Text mining</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Extraction information</term>
<term>Traitement document</term>
<term>Terminologie</term>
<term>Association</term>
<term>Indice statistique</term>
<term>Texte</term>
<term>Analyse contenu</term>
<term>Indexation automatique</term>
<term>Etude cas</term>
<term>Biologie moléculaire</term>
<term>Règle</term>
<term>Fouille de texte</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Nous proposons la description d'une méthodologie d'accès et de lecture des règles d'association extraites à partir de textes. Le corpus ayant servi à notre expérimentation est constitué de résumés d'articles scientifiques dans le domaine de la biologie moléculaire. Ce processus génère un trop grand nombre de règles et nous amène à chercher à les trier de la plus informative à la moins informative. Le classement est établi suivant des indices statistiques. Une discussion sur nos résultats identifie quelques points ayant un impact sur l'interprétabilité des règles d'association.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA08 i1="01" i2="1" l="FRE"><s1>Fouille de textes par combinaison de règles d'association et d'indices statistiques</s1>
</fA08>
<fA09 i1="01" i2="1" l="FRE"><s1>CIFT '2002 : colloque international sur la fouille de texte : Hammamet, 21-23 octobre 2002</s1>
</fA09>
<fA11 i1="01" i2="1"><s1>CHERFI (Hacène)</s1>
</fA11>
<fA11 i1="02" i2="1"><s1>TOUSSAINT (Yannick)</s1>
</fA11>
<fA12 i1="01" i2="1"><s1>TOUSSAINT (Y.)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1"><s1>NEDELLEC (C.)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01"><s1>Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239</s1>
<s2>Vandœuvre-lès-Nancy 54506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
</fA14>
<fA20><s1>67-80</s1>
</fA20>
<fA21><s1>2002</s1>
</fA21>
<fA23 i1="01"><s0>FRE</s0>
</fA23>
<fA24 i1="01"><s0>eng</s0>
</fA24>
<fA25 i1="01"><s1>INRIA</s1>
<s2>Le Chesnay</s2>
</fA25>
<fA26 i1="01"><s0>2-7261-1224-2</s0>
</fA26>
<fA30 i1="01" i2="1" l="FRE"><s1>Colloque international sur la fouille de texte</s1>
<s3>Hammamet TUN</s3>
<s4>2002-10-21</s4>
</fA30>
<fA43 i1="01"><s1>INIST</s1>
<s2>Y 34561</s2>
<s5>354000108545950050</s5>
</fA43>
<fA44><s0>0000</s0>
<s1>© 2003 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45><s0>1 p.1/4</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>03-0457716</s0>
</fA47>
<fA60><s1>C</s1>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA66 i1="01"><s0>CHE</s0>
</fA66>
<fA68 i1="01" i2="1" l="ENG"><s1>Text mining by combination of association rules and statistical indices</s1>
</fA68>
<fA69 i1="01" i2="1" l="ENG"><s1>Text mining</s1>
</fA69>
<fC01 i1="01" l="FRE"><s0>Nous proposons la description d'une méthodologie d'accès et de lecture des règles d'association extraites à partir de textes. Le corpus ayant servi à notre expérimentation est constitué de résumés d'articles scientifiques dans le domaine de la biologie moléculaire. Ce processus génère un trop grand nombre de règles et nous amène à chercher à les trier de la plus informative à la moins informative. Le classement est établi suivant des indices statistiques. Une discussion sur nos résultats identifie quelques points ayant un impact sur l'interprétabilité des règles d'association.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001A01F06</s0>
</fC02>
<fC02 i1="02" i2="X"><s0>205</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE"><s0>Extraction information</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG"><s0>Information extraction</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA"><s0>Extracción información</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Traitement document</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Document processing</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Tratamiento documento</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Terminologie</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Terminology</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Terminología</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Association</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Association</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Asociación</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Indice statistique</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Statistical index</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Indice estadístico</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Texte</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Text</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Texto</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Analyse contenu</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>Content analysis</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Análisis contenido</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE"><s0>Indexation automatique</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="ENG"><s0>Automatic indexing</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="SPA"><s0>Indización automática</s0>
<s5>08</s5>
</fC03>
<fC03 i1="09" i2="X" l="FRE"><s0>Etude cas</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="ENG"><s0>Case study</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="SPA"><s0>Estudio caso</s0>
<s5>09</s5>
</fC03>
<fC03 i1="10" i2="X" l="FRE"><s0>Biologie moléculaire</s0>
<s5>10</s5>
</fC03>
<fC03 i1="10" i2="X" l="ENG"><s0>Molecular biology</s0>
<s5>10</s5>
</fC03>
<fC03 i1="10" i2="X" l="SPA"><s0>Biología molecular</s0>
<s5>10</s5>
</fC03>
<fC03 i1="11" i2="X" l="FRE"><s0>Règle</s0>
<s2>NI</s2>
<s4>INC</s4>
<s5>27</s5>
</fC03>
<fC03 i1="12" i2="X" l="FRE"><s0>Fouille de texte</s0>
<s2>NI</s2>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fC03 i1="12" i2="X" l="ENG"><s0>Text mining</s0>
<s2>NI</s2>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fN21><s1>315</s1>
</fN21>
<fN82><s1>PSI</s1>
</fN82>
</pA>
</standard>
<server><NO>PASCAL 03-0457716 INIST</NO>
<FT>Fouille de textes par combinaison de règles d'association et d'indices statistiques</FT>
<ET>(Text mining by combination of association rules and statistical indices)</ET>
<AU>CHERFI (Hacène); TOUSSAINT (Yannick); TOUSSAINT (Y.); NEDELLEC (C.)</AU>
<AF>Équipe ORPAILLEUR (LORIA - INRIA Lorraine), Campus scientifique - B.P. 239/Vandœuvre-lès-Nancy 54506/France (1 aut., 2 aut.)</AF>
<DT>Congrès; Niveau analytique</DT>
<SO>Colloque international sur la fouille de texte/2002-10-21/Hammamet TUN; Suisse; Le Chesnay: INRIA; Da. 2002; Pp. 67-80; ISBN 2-7261-1224-2</SO>
<LA>Français</LA>
<FA>Nous proposons la description d'une méthodologie d'accès et de lecture des règles d'association extraites à partir de textes. Le corpus ayant servi à notre expérimentation est constitué de résumés d'articles scientifiques dans le domaine de la biologie moléculaire. Ce processus génère un trop grand nombre de règles et nous amène à chercher à les trier de la plus informative à la moins informative. Le classement est établi suivant des indices statistiques. Une discussion sur nos résultats identifie quelques points ayant un impact sur l'interprétabilité des règles d'association.</FA>
<CC>001A01F06; 205</CC>
<FD>Extraction information; Traitement document; Terminologie; Association; Indice statistique; Texte; Analyse contenu; Indexation automatique; Etude cas; Biologie moléculaire; Règle; Fouille de texte</FD>
<ED>Information extraction; Document processing; Terminology; Association; Statistical index; Text; Content analysis; Automatic indexing; Case study; Molecular biology; Text mining</ED>
<SD>Extracción información; Tratamiento documento; Terminología; Asociación; Indice estadístico; Texto; Análisis contenido; Indización automática; Estudio caso; Biología molecular</SD>
<LO>INIST-Y 34561.354000108545950050</LO>
<ID>03-0457716</ID>
</server>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Corpus

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000754 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000754 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Corpus
   |type=    RBID
   |clé=     Pascal:03-0457716
   |texte=   Fouille de textes par combinaison de règles d'association et d'indices statistiques
}}

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022

	Serveur d'exploration sur la recherche en informatique en Lorraine
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur la recherche en informatique en Lorraine

Fouille de textes par combinaison de règles d'association et d'indices statistiques

Fouille de textes par combinaison de règles d'association et d'indices statistiques

Source :

Descripteurs français

English descriptors

Abstract

Notice en format standard (ISO 2709)

Format Inist (serveur)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri