InforLorV4, PascalFrancis, Corpus, bibRecord, 000966

Extracteur de formules de documents mathématiques

Identifieur interne : 000966 ( PascalFrancis/Corpus ); précédent : 000965; suivant : 000967

Extracteur de formules de documents mathématiques

Auteurs : Afef Kacem ; Abdel Belaïd ; Mohamed Ben Ahmed

Source :

RBID : Pascal:01-0234991

Descripteurs français

Pascal (Inist)
- Reconnaissance optique caractère, Formule mathématique, Extracteur, Segmentation, Extraction information, Composante, Etiquetage, EXTRAFOR (extracteur formules), Document structuré.

English descriptors

KwdEn :
- Component, Extractor, Information extraction, Labelling, Mathematical formula, Optical character recognition, Segmentation, Structured document.

Abstract

L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.

Notice en format standard (ISO 2709)

Pour connaître la documentation sur le format Inist Standard.

A08	`01`	`1`	`FRE`	`@1 Extracteur de formules de documents mathématiques`
A09	`01`	`1`	`FRE`	`@1 CIFED '2000 : colloque international francophone sur l'écrit et le document : Lyon, 2000`
A11	`01`	`1`		`@1 KACEM (Afef)`
A11	`02`	`1`		`@1 BELAÏD (Abdel)`
A11	`03`	`1`		`@1 BEN AHMED (Mohamed)`
A12	`01`	`1`		`@1 EMPTOZ (Hubert) @9 ed.`
A12	`02`	`1`		`@1 VINCENT (Nicole) @9 ed.`
A14	`01`			`@1 RIADI-ENSI Tunis @3 TUN @Z 1 aut. @Z 3 aut.`
A14	`02`			`@1 LORIA-CNRS Nancy @3 FRA @Z 2 aut.`
A20				`@1 295-304`
A21				`@1 2000`
A23	`01`			`@0 FRE`
A25	`01`			`@1 Presses polytechniques et universitaires romandes @2 Lausanne`
A26	`01`			`@0 2-88074-460-1`
A30	`01`	`1`	`FRE`	`@1 Colloque international francophone sur l'écrit et le document @3 Lyon FRA @4 2000`
A43	`01`			`@1 INIST @2 Y 32899 @5 354000092001980300`
A44				`@0 0000 @1 © 2001 INIST-CNRS. All rights reserved.`
A45				`@0 16 ref.`
A47	`01`	`1`		`@0 01-0234991`
A60				`@1 C`
A61				`@0 A`
A66	`01`			`@0 CHE`
A68	`01`	`1`	`ENG`	`@1 Mathematical documents formula extractor`
C01	`01`		`FRE`	@0 L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.
C02	`01`	`X`		`@0 001A01F03`
C02	`02`	`X`		`@0 205`
C03	`01`	`X`	`FRE`	`@0 Reconnaissance optique caractère @5 01`
C03	`01`	`X`	`ENG`	`@0 Optical character recognition @5 01`
C03	`01`	`X`	`SPA`	`@0 Reconocimento óptico de caracteres @5 01`
C03	`02`	`X`	`FRE`	`@0 Formule mathématique @5 02`
C03	`02`	`X`	`ENG`	`@0 Mathematical formula @5 02`
C03	`02`	`X`	`SPA`	`@0 Fórmula matemática @5 02`
C03	`03`	`X`	`FRE`	`@0 Extracteur @5 03`
C03	`03`	`X`	`ENG`	`@0 Extractor @5 03`
C03	`03`	`X`	`SPA`	`@0 Extractor @5 03`
C03	`04`	`X`	`FRE`	`@0 Segmentation @5 04`
C03	`04`	`X`	`ENG`	`@0 Segmentation @5 04`
C03	`04`	`X`	`SPA`	`@0 Segmentación @5 04`
C03	`05`	`X`	`FRE`	`@0 Extraction information @5 05`
C03	`05`	`X`	`ENG`	`@0 Information extraction @5 05`
C03	`05`	`X`	`SPA`	`@0 Extractión información @5 05`
C03	`06`	`X`	`FRE`	`@0 Composante @5 06`
C03	`06`	`X`	`ENG`	`@0 Component @5 06`
C03	`06`	`X`	`SPA`	`@0 Componente @5 06`
C03	`07`	`X`	`FRE`	`@0 Etiquetage @5 07`
C03	`07`	`X`	`ENG`	`@0 Labelling @5 07`
C03	`07`	`X`	`SPA`	`@0 Etiquetaje @5 07`
C03	`08`	`X`	`FRE`	`@0 EXTRAFOR (extracteur formules) @2 NI @4 INC @5 27`
C03	`09`	`X`	`FRE`	`@0 Document structuré @2 NI @4 CD @5 96`
C03	`09`	`X`	`ENG`	`@0 Structured document @2 NI @4 CD @5 96`
N21				`@1 162`

Format Inist (serveur)

NO :	PASCAL 01-0234991 INIST
FT :	Extracteur de formules de documents mathématiques
ET :	(Mathematical documents formula extractor)
AU :	KACEM (Afef); BELAÏD (Abdel); BEN AHMED (Mohamed); EMPTOZ (Hubert); VINCENT (Nicole)
AF :	RIADI-ENSI Tunis/Tunisie (1 aut., 3 aut.); LORIA-CNRS Nancy/France (2 aut.)
DT :	Congrès; Niveau analytique
SO :	Colloque international francophone sur l'écrit et le document/2000/Lyon FRA; Suisse; Lausanne: Presses polytechniques et universitaires romandes; Da. 2000; Pp. 295-304; ISBN 2-88074-460-1
LA :	Français
FA :	L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.
CC :	001A01F03; 205
FD :	Reconnaissance optique caractère; Formule mathématique; Extracteur; Segmentation; Extraction information; Composante; Etiquetage; EXTRAFOR (extracteur formules); Document structuré
ED :	Optical character recognition; Mathematical formula; Extractor; Segmentation; Information extraction; Component; Labelling; Structured document
SD :	Reconocimento óptico de caracteres; Fórmula matemática; Extractor; Segmentación; Extractión información; Componente; Etiquetaje
LO :	INIST-Y 32899.354000092001980300
ID :	01-0234991

Links to Exploration step

Pascal:01-0234991

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="fr" level="a">Extracteur de formules de documents mathématiques</title>
<author><name sortKey="Kacem, Afef" sort="Kacem, Afef" uniqKey="Kacem A" first="Afef" last="Kacem">Afef Kacem</name>
<affiliation><inist:fA14 i1="01"><s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaïd">Abdel Belaïd</name>
<affiliation><inist:fA14 i1="02"><s1>LORIA-CNRS Nancy</s1>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Ben Ahmed, Mohamed" sort="Ben Ahmed, Mohamed" uniqKey="Ben Ahmed M" first="Mohamed" last="Ben Ahmed">Mohamed Ben Ahmed</name>
<affiliation><inist:fA14 i1="01"><s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">01-0234991</idno>
<date when="2000">2000</date>
<idno type="stanalyst">PASCAL 01-0234991 INIST</idno>
<idno type="RBID">Pascal:01-0234991</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000966</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="fr" level="a">Extracteur de formules de documents mathématiques</title>
<author><name sortKey="Kacem, Afef" sort="Kacem, Afef" uniqKey="Kacem A" first="Afef" last="Kacem">Afef Kacem</name>
<affiliation><inist:fA14 i1="01"><s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaïd">Abdel Belaïd</name>
<affiliation><inist:fA14 i1="02"><s1>LORIA-CNRS Nancy</s1>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author><name sortKey="Ben Ahmed, Mohamed" sort="Ben Ahmed, Mohamed" uniqKey="Ben Ahmed M" first="Mohamed" last="Ben Ahmed">Mohamed Ben Ahmed</name>
<affiliation><inist:fA14 i1="01"><s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Component</term>
<term>Extractor</term>
<term>Information extraction</term>
<term>Labelling</term>
<term>Mathematical formula</term>
<term>Optical character recognition</term>
<term>Segmentation</term>
<term>Structured document</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Reconnaissance optique caractère</term>
<term>Formule mathématique</term>
<term>Extracteur</term>
<term>Segmentation</term>
<term>Extraction information</term>
<term>Composante</term>
<term>Etiquetage</term>
<term>EXTRAFOR (extracteur formules)</term>
<term>Document structuré</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA08 i1="01" i2="1" l="FRE"><s1>Extracteur de formules de documents mathématiques</s1>
</fA08>
<fA09 i1="01" i2="1" l="FRE"><s1>CIFED '2000 : colloque international francophone sur l'écrit et le document : Lyon, 2000</s1>
</fA09>
<fA11 i1="01" i2="1"><s1>KACEM (Afef)</s1>
</fA11>
<fA11 i1="02" i2="1"><s1>BELAÏD (Abdel)</s1>
</fA11>
<fA11 i1="03" i2="1"><s1>BEN AHMED (Mohamed)</s1>
</fA11>
<fA12 i1="01" i2="1"><s1>EMPTOZ (Hubert)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1"><s1>VINCENT (Nicole)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01"><s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</fA14>
<fA14 i1="02"><s1>LORIA-CNRS Nancy</s1>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</fA14>
<fA20><s1>295-304</s1>
</fA20>
<fA21><s1>2000</s1>
</fA21>
<fA23 i1="01"><s0>FRE</s0>
</fA23>
<fA25 i1="01"><s1>Presses polytechniques et universitaires romandes</s1>
<s2>Lausanne</s2>
</fA25>
<fA26 i1="01"><s0>2-88074-460-1</s0>
</fA26>
<fA30 i1="01" i2="1" l="FRE"><s1>Colloque international francophone sur l'écrit et le document</s1>
<s3>Lyon FRA</s3>
<s4>2000</s4>
</fA30>
<fA43 i1="01"><s1>INIST</s1>
<s2>Y 32899</s2>
<s5>354000092001980300</s5>
</fA43>
<fA44><s0>0000</s0>
<s1>© 2001 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45><s0>16 ref.</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>01-0234991</s0>
</fA47>
<fA60><s1>C</s1>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA66 i1="01"><s0>CHE</s0>
</fA66>
<fA68 i1="01" i2="1" l="ENG"><s1>Mathematical documents formula extractor</s1>
</fA68>
<fC01 i1="01" l="FRE"><s0>L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001A01F03</s0>
</fC02>
<fC02 i1="02" i2="X"><s0>205</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE"><s0>Reconnaissance optique caractère</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG"><s0>Optical character recognition</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA"><s0>Reconocimento óptico de caracteres</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Formule mathématique</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Mathematical formula</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Fórmula matemática</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Extracteur</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Extractor</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Extractor</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Segmentation</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Segmentation</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Segmentación</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Extraction information</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Information extraction</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Extractión información</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Composante</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Component</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Componente</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Etiquetage</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>Labelling</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Etiquetaje</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE"><s0>EXTRAFOR (extracteur formules)</s0>
<s2>NI</s2>
<s4>INC</s4>
<s5>27</s5>
</fC03>
<fC03 i1="09" i2="X" l="FRE"><s0>Document structuré</s0>
<s2>NI</s2>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fC03 i1="09" i2="X" l="ENG"><s0>Structured document</s0>
<s2>NI</s2>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fN21><s1>162</s1>
</fN21>
</pA>
</standard>
<server><NO>PASCAL 01-0234991 INIST</NO>
<FT>Extracteur de formules de documents mathématiques</FT>
<ET>(Mathematical documents formula extractor)</ET>
<AU>KACEM (Afef); BELAÏD (Abdel); BEN AHMED (Mohamed); EMPTOZ (Hubert); VINCENT (Nicole)</AU>
<AF>RIADI-ENSI Tunis/Tunisie (1 aut., 3 aut.); LORIA-CNRS Nancy/France (2 aut.)</AF>
<DT>Congrès; Niveau analytique</DT>
<SO>Colloque international francophone sur l'écrit et le document/2000/Lyon FRA; Suisse; Lausanne: Presses polytechniques et universitaires romandes; Da. 2000; Pp. 295-304; ISBN 2-88074-460-1</SO>
<LA>Français</LA>
<FA>L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.</FA>
<CC>001A01F03; 205</CC>
<FD>Reconnaissance optique caractère; Formule mathématique; Extracteur; Segmentation; Extraction information; Composante; Etiquetage; EXTRAFOR (extracteur formules); Document structuré</FD>
<ED>Optical character recognition; Mathematical formula; Extractor; Segmentation; Information extraction; Component; Labelling; Structured document</ED>
<SD>Reconocimento óptico de caracteres; Fórmula matemática; Extractor; Segmentación; Extractión información; Componente; Etiquetaje</SD>
<LO>INIST-Y 32899.354000092001980300</LO>
<ID>01-0234991</ID>
</server>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Corpus

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000966 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000966 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Corpus
   |type=    RBID
   |clé=     Pascal:01-0234991
   |texte=   Extracteur de formules de documents mathématiques
}}

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022

	Serveur d'exploration sur la recherche en informatique en Lorraine
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur la recherche en informatique en Lorraine

Extracteur de formules de documents mathématiques

Extracteur de formules de documents mathématiques

Source :

Descripteurs français

English descriptors

Abstract

Notice en format standard (ISO 2709)

Format Inist (serveur)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri