Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Extracteur de formules de documents mathématiques

Identifieur interne : 000966 ( PascalFrancis/Corpus ); précédent : 000965; suivant : 000967

Extracteur de formules de documents mathématiques

Auteurs : Afef Kacem ; Abdel Belaïd ; Mohamed Ben Ahmed

Source :

RBID : Pascal:01-0234991

Descripteurs français

English descriptors

Abstract

L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.

Notice en format standard (ISO 2709)

Pour connaître la documentation sur le format Inist Standard.

pA  
A08 01  1  FRE  @1 Extracteur de formules de documents mathématiques
A09 01  1  FRE  @1 CIFED '2000 : colloque international francophone sur l'écrit et le document : Lyon, 2000
A11 01  1    @1 KACEM (Afef)
A11 02  1    @1 BELAÏD (Abdel)
A11 03  1    @1 BEN AHMED (Mohamed)
A12 01  1    @1 EMPTOZ (Hubert) @9 ed.
A12 02  1    @1 VINCENT (Nicole) @9 ed.
A14 01      @1 RIADI-ENSI Tunis @3 TUN @Z 1 aut. @Z 3 aut.
A14 02      @1 LORIA-CNRS Nancy @3 FRA @Z 2 aut.
A20       @1 295-304
A21       @1 2000
A23 01      @0 FRE
A25 01      @1 Presses polytechniques et universitaires romandes @2 Lausanne
A26 01      @0 2-88074-460-1
A30 01  1  FRE  @1 Colloque international francophone sur l'écrit et le document @3 Lyon FRA @4 2000
A43 01      @1 INIST @2 Y 32899 @5 354000092001980300
A44       @0 0000 @1 © 2001 INIST-CNRS. All rights reserved.
A45       @0 16 ref.
A47 01  1    @0 01-0234991
A60       @1 C
A61       @0 A
A66 01      @0 CHE
A68 01  1  ENG  @1 Mathematical documents formula extractor
C01 01    FRE  @0 L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.
C02 01  X    @0 001A01F03
C02 02  X    @0 205
C03 01  X  FRE  @0 Reconnaissance optique caractère @5 01
C03 01  X  ENG  @0 Optical character recognition @5 01
C03 01  X  SPA  @0 Reconocimento óptico de caracteres @5 01
C03 02  X  FRE  @0 Formule mathématique @5 02
C03 02  X  ENG  @0 Mathematical formula @5 02
C03 02  X  SPA  @0 Fórmula matemática @5 02
C03 03  X  FRE  @0 Extracteur @5 03
C03 03  X  ENG  @0 Extractor @5 03
C03 03  X  SPA  @0 Extractor @5 03
C03 04  X  FRE  @0 Segmentation @5 04
C03 04  X  ENG  @0 Segmentation @5 04
C03 04  X  SPA  @0 Segmentación @5 04
C03 05  X  FRE  @0 Extraction information @5 05
C03 05  X  ENG  @0 Information extraction @5 05
C03 05  X  SPA  @0 Extractión información @5 05
C03 06  X  FRE  @0 Composante @5 06
C03 06  X  ENG  @0 Component @5 06
C03 06  X  SPA  @0 Componente @5 06
C03 07  X  FRE  @0 Etiquetage @5 07
C03 07  X  ENG  @0 Labelling @5 07
C03 07  X  SPA  @0 Etiquetaje @5 07
C03 08  X  FRE  @0 EXTRAFOR (extracteur formules) @2 NI @4 INC @5 27
C03 09  X  FRE  @0 Document structuré @2 NI @4 CD @5 96
C03 09  X  ENG  @0 Structured document @2 NI @4 CD @5 96
N21       @1 162

Format Inist (serveur)

NO : PASCAL 01-0234991 INIST
FT : Extracteur de formules de documents mathématiques
ET : (Mathematical documents formula extractor)
AU : KACEM (Afef); BELAÏD (Abdel); BEN AHMED (Mohamed); EMPTOZ (Hubert); VINCENT (Nicole)
AF : RIADI-ENSI Tunis/Tunisie (1 aut., 3 aut.); LORIA-CNRS Nancy/France (2 aut.)
DT : Congrès; Niveau analytique
SO : Colloque international francophone sur l'écrit et le document/2000/Lyon FRA; Suisse; Lausanne: Presses polytechniques et universitaires romandes; Da. 2000; Pp. 295-304; ISBN 2-88074-460-1
LA : Français
FA : L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.
CC : 001A01F03; 205
FD : Reconnaissance optique caractère; Formule mathématique; Extracteur; Segmentation; Extraction information; Composante; Etiquetage; EXTRAFOR (extracteur formules); Document structuré
ED : Optical character recognition; Mathematical formula; Extractor; Segmentation; Information extraction; Component; Labelling; Structured document
SD : Reconocimento óptico de caracteres; Fórmula matemática; Extractor; Segmentación; Extractión información; Componente; Etiquetaje
LO : INIST-Y 32899.354000092001980300
ID : 01-0234991

Links to Exploration step

Pascal:01-0234991

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">Extracteur de formules de documents mathématiques</title>
<author>
<name sortKey="Kacem, Afef" sort="Kacem, Afef" uniqKey="Kacem A" first="Afef" last="Kacem">Afef Kacem</name>
<affiliation>
<inist:fA14 i1="01">
<s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author>
<name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaïd">Abdel Belaïd</name>
<affiliation>
<inist:fA14 i1="02">
<s1>LORIA-CNRS Nancy</s1>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author>
<name sortKey="Ben Ahmed, Mohamed" sort="Ben Ahmed, Mohamed" uniqKey="Ben Ahmed M" first="Mohamed" last="Ben Ahmed">Mohamed Ben Ahmed</name>
<affiliation>
<inist:fA14 i1="01">
<s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">01-0234991</idno>
<date when="2000">2000</date>
<idno type="stanalyst">PASCAL 01-0234991 INIST</idno>
<idno type="RBID">Pascal:01-0234991</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000966</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">Extracteur de formules de documents mathématiques</title>
<author>
<name sortKey="Kacem, Afef" sort="Kacem, Afef" uniqKey="Kacem A" first="Afef" last="Kacem">Afef Kacem</name>
<affiliation>
<inist:fA14 i1="01">
<s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author>
<name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaïd">Abdel Belaïd</name>
<affiliation>
<inist:fA14 i1="02">
<s1>LORIA-CNRS Nancy</s1>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
<author>
<name sortKey="Ben Ahmed, Mohamed" sort="Ben Ahmed, Mohamed" uniqKey="Ben Ahmed M" first="Mohamed" last="Ben Ahmed">Mohamed Ben Ahmed</name>
<affiliation>
<inist:fA14 i1="01">
<s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Component</term>
<term>Extractor</term>
<term>Information extraction</term>
<term>Labelling</term>
<term>Mathematical formula</term>
<term>Optical character recognition</term>
<term>Segmentation</term>
<term>Structured document</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Reconnaissance optique caractère</term>
<term>Formule mathématique</term>
<term>Extracteur</term>
<term>Segmentation</term>
<term>Extraction information</term>
<term>Composante</term>
<term>Etiquetage</term>
<term>EXTRAFOR (extracteur formules)</term>
<term>Document structuré</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.</div>
</front>
</TEI>
<inist>
<standard h6="B">
<pA>
<fA08 i1="01" i2="1" l="FRE">
<s1>Extracteur de formules de documents mathématiques</s1>
</fA08>
<fA09 i1="01" i2="1" l="FRE">
<s1>CIFED '2000 : colloque international francophone sur l'écrit et le document : Lyon, 2000</s1>
</fA09>
<fA11 i1="01" i2="1">
<s1>KACEM (Afef)</s1>
</fA11>
<fA11 i1="02" i2="1">
<s1>BELAÏD (Abdel)</s1>
</fA11>
<fA11 i1="03" i2="1">
<s1>BEN AHMED (Mohamed)</s1>
</fA11>
<fA12 i1="01" i2="1">
<s1>EMPTOZ (Hubert)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1">
<s1>VINCENT (Nicole)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01">
<s1>RIADI-ENSI Tunis</s1>
<s3>TUN</s3>
<sZ>1 aut.</sZ>
<sZ>3 aut.</sZ>
</fA14>
<fA14 i1="02">
<s1>LORIA-CNRS Nancy</s1>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</fA14>
<fA20>
<s1>295-304</s1>
</fA20>
<fA21>
<s1>2000</s1>
</fA21>
<fA23 i1="01">
<s0>FRE</s0>
</fA23>
<fA25 i1="01">
<s1>Presses polytechniques et universitaires romandes</s1>
<s2>Lausanne</s2>
</fA25>
<fA26 i1="01">
<s0>2-88074-460-1</s0>
</fA26>
<fA30 i1="01" i2="1" l="FRE">
<s1>Colloque international francophone sur l'écrit et le document</s1>
<s3>Lyon FRA</s3>
<s4>2000</s4>
</fA30>
<fA43 i1="01">
<s1>INIST</s1>
<s2>Y 32899</s2>
<s5>354000092001980300</s5>
</fA43>
<fA44>
<s0>0000</s0>
<s1>© 2001 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45>
<s0>16 ref.</s0>
</fA45>
<fA47 i1="01" i2="1">
<s0>01-0234991</s0>
</fA47>
<fA60>
<s1>C</s1>
</fA60>
<fA61>
<s0>A</s0>
</fA61>
<fA66 i1="01">
<s0>CHE</s0>
</fA66>
<fA68 i1="01" i2="1" l="ENG">
<s1>Mathematical documents formula extractor</s1>
</fA68>
<fC01 i1="01" l="FRE">
<s0>L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.</s0>
</fC01>
<fC02 i1="01" i2="X">
<s0>001A01F03</s0>
</fC02>
<fC02 i1="02" i2="X">
<s0>205</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE">
<s0>Reconnaissance optique caractère</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG">
<s0>Optical character recognition</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA">
<s0>Reconocimento óptico de caracteres</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE">
<s0>Formule mathématique</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG">
<s0>Mathematical formula</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA">
<s0>Fórmula matemática</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE">
<s0>Extracteur</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG">
<s0>Extractor</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA">
<s0>Extractor</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE">
<s0>Segmentation</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG">
<s0>Segmentation</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA">
<s0>Segmentación</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE">
<s0>Extraction information</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG">
<s0>Information extraction</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA">
<s0>Extractión información</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE">
<s0>Composante</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG">
<s0>Component</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA">
<s0>Componente</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE">
<s0>Etiquetage</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG">
<s0>Labelling</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA">
<s0>Etiquetaje</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE">
<s0>EXTRAFOR (extracteur formules)</s0>
<s2>NI</s2>
<s4>INC</s4>
<s5>27</s5>
</fC03>
<fC03 i1="09" i2="X" l="FRE">
<s0>Document structuré</s0>
<s2>NI</s2>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fC03 i1="09" i2="X" l="ENG">
<s0>Structured document</s0>
<s2>NI</s2>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fN21>
<s1>162</s1>
</fN21>
</pA>
</standard>
<server>
<NO>PASCAL 01-0234991 INIST</NO>
<FT>Extracteur de formules de documents mathématiques</FT>
<ET>(Mathematical documents formula extractor)</ET>
<AU>KACEM (Afef); BELAÏD (Abdel); BEN AHMED (Mohamed); EMPTOZ (Hubert); VINCENT (Nicole)</AU>
<AF>RIADI-ENSI Tunis/Tunisie (1 aut., 3 aut.); LORIA-CNRS Nancy/France (2 aut.)</AF>
<DT>Congrès; Niveau analytique</DT>
<SO>Colloque international francophone sur l'écrit et le document/2000/Lyon FRA; Suisse; Lausanne: Presses polytechniques et universitaires romandes; Da. 2000; Pp. 295-304; ISBN 2-88074-460-1</SO>
<LA>Français</LA>
<FA>L'auteur décrit un extracteur de formules de documents mathématiques. Son objectif est de segmenter le document pour mieux le reconnaître et permettre de détecter, avec une grande certitude, les zones suceptibles d'être mal reconnues. Les formules ont une syntaxe bien spécifique nécessitant une connaissance précise de leur contenu et surtout une délimitation spatiale sûre. Le système commence par régénérer le document en ses composantes connexes. Puis il attribue à chacune d'elle une étiquette en fonction du rôle qu'elle peut jouer dans la formule. Cette étiquetage primaire permet une segmentation globale du document. Un étiquetage secondaire permet de lever certaines ambiguïtés.</FA>
<CC>001A01F03; 205</CC>
<FD>Reconnaissance optique caractère; Formule mathématique; Extracteur; Segmentation; Extraction information; Composante; Etiquetage; EXTRAFOR (extracteur formules); Document structuré</FD>
<ED>Optical character recognition; Mathematical formula; Extractor; Segmentation; Information extraction; Component; Labelling; Structured document</ED>
<SD>Reconocimento óptico de caracteres; Fórmula matemática; Extractor; Segmentación; Extractión información; Componente; Etiquetaje</SD>
<LO>INIST-Y 32899.354000092001980300</LO>
<ID>01-0234991</ID>
</server>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000966 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000966 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Corpus
   |type=    RBID
   |clé=     Pascal:01-0234991
   |texte=   Extracteur de formules de documents mathématiques
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022