OcrV1, PascalFrancis, Checkpoint, bibRecord, 000187

Phrase-based correction model for improving handwriting recognition accuracies

Identifieur interne : 000187 ( PascalFrancis/Checkpoint ); précédent : 000186; suivant : 000188

Phrase-based correction model for improving handwriting recognition accuracies

Auteurs : Faisal Farooq [États-Unis] ; Damien Jose [États-Unis] ; Venugopal Govindaraju [États-Unis]

Source :

Pattern recognition [ 0031-3203 ] ; 2009.

RBID : Pascal:09-0430753

Descripteurs français

Pascal (Inist)
- Reconnaissance écriture, Précision, Reconnaissance parole, Caractère manuscrit, Algorithme, Estimation canal, Reconnaissance optique caractère, Canal avec bruit, Correction erreur, Décodage Viterbi, Reconnaissance forme, Traitement parole, Estimation paramètre.

English descriptors

KwdEn :
- Accuracy, Algorithm, Channel estimation, Error correction, Handwriting recognition, Manuscript character, Noisy channel, Optical character recognition, Parameter estimation, Pattern recognition, Speech processing, Speech recognition, Viterbi decoding.

Abstract

We propose a method for increasing word recognition accuracies by correcting the output of a handwriting recognition system. We treat the handwriting recognizer as a black box, such that there is no access to its internals. This enables us to keep our algorithm general and independent of any particular system. We use a novel method for correcting the output based on a "phrase-based" system in contrast to traditional source-channel models. We report the accuracies of two in-house handwritten word recognizers before and after the correction. We achieve highly encouraging results for a large synthetically generated dataset. We also report results for a commercially available OCR on real data.

Affiliations:

Links toward previous steps (curation, corpus...)

to stream PascalFrancis, to step Corpus: 000212
to stream PascalFrancis, to step Curation: 000567

Links to Exploration step

Pascal:09-0430753

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" level="a">Phrase-based correction model for improving handwriting recognition accuracies</title>
<author><name sortKey="Farooq, Faisal" sort="Farooq, Faisal" uniqKey="Farooq F" first="Faisal" last="Farooq">Faisal Farooq</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Center for Unified Biometrics and Sensors, State University of New York at Buffalo</s1>
<s2>Amherst, NY 14228</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">État de New York</region>
</placeName>
</affiliation>
</author>
<author><name sortKey="Jose, Damien" sort="Jose, Damien" uniqKey="Jose D" first="Damien" last="Jose">Damien Jose</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Center for Unified Biometrics and Sensors, State University of New York at Buffalo</s1>
<s2>Amherst, NY 14228</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">État de New York</region>
</placeName>
</affiliation>
</author>
<author><name sortKey="Govindaraju, Venu" sort="Govindaraju, Venu" uniqKey="Govindaraju V" first="Venu" last="Govindaraju">Venugopal Govindaraju</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Center for Unified Biometrics and Sensors, State University of New York at Buffalo</s1>
<s2>Amherst, NY 14228</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">État de New York</region>
</placeName>
<placeName><settlement type="city">Buffalo (New York)</settlement>
<region type="state">État de New York</region>
</placeName>
<orgName type="university" n="3">Université d'État de New York à Buffalo</orgName>
<orgName type="institution">Université d'État de New York</orgName>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">09-0430753</idno>
<date when="2009">2009</date>
<idno type="stanalyst">PASCAL 09-0430753 INIST</idno>
<idno type="RBID">Pascal:09-0430753</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000212</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000567</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000187</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en" level="a">Phrase-based correction model for improving handwriting recognition accuracies</title>
<author><name sortKey="Farooq, Faisal" sort="Farooq, Faisal" uniqKey="Farooq F" first="Faisal" last="Farooq">Faisal Farooq</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Center for Unified Biometrics and Sensors, State University of New York at Buffalo</s1>
<s2>Amherst, NY 14228</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">État de New York</region>
</placeName>
</affiliation>
</author>
<author><name sortKey="Jose, Damien" sort="Jose, Damien" uniqKey="Jose D" first="Damien" last="Jose">Damien Jose</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Center for Unified Biometrics and Sensors, State University of New York at Buffalo</s1>
<s2>Amherst, NY 14228</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">État de New York</region>
</placeName>
</affiliation>
</author>
<author><name sortKey="Govindaraju, Venu" sort="Govindaraju, Venu" uniqKey="Govindaraju V" first="Venu" last="Govindaraju">Venugopal Govindaraju</name>
<affiliation wicri:level="2"><inist:fA14 i1="01"><s1>Center for Unified Biometrics and Sensors, State University of New York at Buffalo</s1>
<s2>Amherst, NY 14228</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>États-Unis</country>
<placeName><region type="state">État de New York</region>
</placeName>
<placeName><settlement type="city">Buffalo (New York)</settlement>
<region type="state">État de New York</region>
</placeName>
<orgName type="university" n="3">Université d'État de New York à Buffalo</orgName>
<orgName type="institution">Université d'État de New York</orgName>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Pattern recognition</title>
<title level="j" type="abbreviated">Pattern recogn.</title>
<idno type="ISSN">0031-3203</idno>
<imprint><date when="2009">2009</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Pattern recognition</title>
<title level="j" type="abbreviated">Pattern recogn.</title>
<idno type="ISSN">0031-3203</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Accuracy</term>
<term>Algorithm</term>
<term>Channel estimation</term>
<term>Error correction</term>
<term>Handwriting recognition</term>
<term>Manuscript character</term>
<term>Noisy channel</term>
<term>Optical character recognition</term>
<term>Parameter estimation</term>
<term>Pattern recognition</term>
<term>Speech processing</term>
<term>Speech recognition</term>
<term>Viterbi decoding</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Reconnaissance écriture</term>
<term>Précision</term>
<term>Reconnaissance parole</term>
<term>Caractère manuscrit</term>
<term>Algorithme</term>
<term>Estimation canal</term>
<term>Reconnaissance optique caractère</term>
<term>Canal avec bruit</term>
<term>Correction erreur</term>
<term>Décodage Viterbi</term>
<term>Reconnaissance forme</term>
<term>Traitement parole</term>
<term>Estimation paramètre</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="en">We propose a method for increasing word recognition accuracies by correcting the output of a handwriting recognition system. We treat the handwriting recognizer as a black box, such that there is no access to its internals. This enables us to keep our algorithm general and independent of any particular system. We use a novel method for correcting the output based on a "phrase-based" system in contrast to traditional source-channel models. We report the accuracies of two in-house handwritten word recognizers before and after the correction. We achieve highly encouraging results for a large synthetically generated dataset. We also report results for a commercially available OCR on real data.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA01 i1="01" i2="1"><s0>0031-3203</s0>
</fA01>
<fA02 i1="01"><s0>PTNRA8</s0>
</fA02>
<fA03 i2="1"><s0>Pattern recogn.</s0>
</fA03>
<fA05><s2>42</s2>
</fA05>
<fA06><s2>12</s2>
</fA06>
<fA08 i1="01" i2="1" l="ENG"><s1>Phrase-based correction model for improving handwriting recognition accuracies</s1>
</fA08>
<fA09 i1="01" i2="1" l="ENG"><s1>New Frontiers in Handwriting Recognition</s1>
</fA09>
<fA11 i1="01" i2="1"><s1>FAROOQ (Faisal)</s1>
</fA11>
<fA11 i1="02" i2="1"><s1>JOSE (Damien)</s1>
</fA11>
<fA11 i1="03" i2="1"><s1>GOVINDARAJU (Venu)</s1>
</fA11>
<fA12 i1="01" i2="1"><s1>CHERIET (Mohamed)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1"><s1>BUNKE (Horst)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="03" i2="1"><s1>JIANYING HU</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="04" i2="1"><s1>KIMURA (Fumitaka)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="05" i2="1"><s1>SUEN (Ching Y.)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01"><s1>Center for Unified Biometrics and Sensors, State University of New York at Buffalo</s1>
<s2>Amherst, NY 14228</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</fA14>
<fA15 i1="01"><s1>SYNCHROMEDIA, ETS, 1100, Notre Dame West St.</s1>
<s2>Montreal, H3C 1K3</s2>
<s3>CAN</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
<sZ>4 aut.</sZ>
<sZ>5 aut.</sZ>
</fA15>
<fA20><s1>3271-3277</s1>
</fA20>
<fA21><s1>2009</s1>
</fA21>
<fA23 i1="01"><s0>ENG</s0>
</fA23>
<fA43 i1="01"><s1>INIST</s1>
<s2>15220</s2>
<s5>354000196172090140</s5>
</fA43>
<fA44><s0>0000</s0>
<s1>© 2009 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45><s0>27 ref.</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>09-0430753</s0>
</fA47>
<fA60><s1>P</s1>
<s2>C</s2>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA64 i1="01" i2="1"><s0>Pattern recognition</s0>
</fA64>
<fA66 i1="01"><s0>GBR</s0>
</fA66>
<fC01 i1="01" l="ENG"><s0>We propose a method for increasing word recognition accuracies by correcting the output of a handwriting recognition system. We treat the handwriting recognizer as a black box, such that there is no access to its internals. This enables us to keep our algorithm general and independent of any particular system. We use a novel method for correcting the output based on a "phrase-based" system in contrast to traditional source-channel models. We report the accuracies of two in-house handwritten word recognizers before and after the correction. We achieve highly encouraging results for a large synthetically generated dataset. We also report results for a commercially available OCR on real data.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001D04A05A</s0>
</fC02>
<fC02 i1="02" i2="X"><s0>001D04A05B</s0>
</fC02>
<fC02 i1="03" i2="X"><s0>001D04A04A2</s0>
</fC02>
<fC02 i1="04" i2="X"><s0>001D04A04B</s0>
</fC02>
<fC03 i1="01" i2="3" l="FRE"><s0>Reconnaissance écriture</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="3" l="ENG"><s0>Handwriting recognition</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Précision</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Accuracy</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Precisión</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Reconnaissance parole</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Speech recognition</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Reconocimiento voz</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Caractère manuscrit</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Manuscript character</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Carácter manuscrito</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Algorithme</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Algorithm</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Algoritmo</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Estimation canal</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Channel estimation</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Estimación canal</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Reconnaissance optique caractère</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>Optical character recognition</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Reconocimento óptico de caracteres</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE"><s0>Canal avec bruit</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="ENG"><s0>Noisy channel</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="SPA"><s0>Canal con ruido</s0>
<s5>08</s5>
</fC03>
<fC03 i1="09" i2="X" l="FRE"><s0>Correction erreur</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="ENG"><s0>Error correction</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="SPA"><s0>Corrección error</s0>
<s5>09</s5>
</fC03>
<fC03 i1="10" i2="X" l="FRE"><s0>Décodage Viterbi</s0>
<s5>10</s5>
</fC03>
<fC03 i1="10" i2="X" l="ENG"><s0>Viterbi decoding</s0>
<s5>10</s5>
</fC03>
<fC03 i1="10" i2="X" l="SPA"><s0>Desciframiento Viterbi</s0>
<s5>10</s5>
</fC03>
<fC03 i1="11" i2="X" l="FRE"><s0>Reconnaissance forme</s0>
<s5>31</s5>
</fC03>
<fC03 i1="11" i2="X" l="ENG"><s0>Pattern recognition</s0>
<s5>31</s5>
</fC03>
<fC03 i1="11" i2="X" l="SPA"><s0>Reconocimiento patrón</s0>
<s5>31</s5>
</fC03>
<fC03 i1="12" i2="X" l="FRE"><s0>Traitement parole</s0>
<s5>32</s5>
</fC03>
<fC03 i1="12" i2="X" l="ENG"><s0>Speech processing</s0>
<s5>32</s5>
</fC03>
<fC03 i1="12" i2="X" l="SPA"><s0>Tratamiento palabra</s0>
<s5>32</s5>
</fC03>
<fC03 i1="13" i2="X" l="FRE"><s0>Estimation paramètre</s0>
<s5>33</s5>
</fC03>
<fC03 i1="13" i2="X" l="ENG"><s0>Parameter estimation</s0>
<s5>33</s5>
</fC03>
<fC03 i1="13" i2="X" l="SPA"><s0>Estimación parámetro</s0>
<s5>33</s5>
</fC03>
<fN21><s1>313</s1>
</fN21>
<fN44 i1="01"><s1>OTO</s1>
</fN44>
<fN82><s1>OTO</s1>
</fN82>
</pA>
<pR><fA30 i1="01" i2="1" l="ENG"><s1>ICFHR 2008 Conference</s1>
<s3>Montreal CAN</s3>
<s4>2008-08-18</s4>
</fA30>
</pR>
</standard>
</inist>
<affiliations><list><country><li>États-Unis</li>
</country>
<region><li>État de New York</li>
</region>
<settlement><li>Buffalo (New York)</li>
</settlement>
<orgName><li>Université d'État de New York</li>
<li>Université d'État de New York à Buffalo</li>
</orgName>
</list>
<tree><country name="États-Unis"><region name="État de New York"><name sortKey="Farooq, Faisal" sort="Farooq, Faisal" uniqKey="Farooq F" first="Faisal" last="Farooq">Faisal Farooq</name>
</region>
<name sortKey="Govindaraju, Venu" sort="Govindaraju, Venu" uniqKey="Govindaraju V" first="Venu" last="Govindaraju">Venugopal Govindaraju</name>
<name sortKey="Jose, Damien" sort="Jose, Damien" uniqKey="Jose D" first="Damien" last="Jose">Damien Jose</name>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Ticri/CIDE/explor/OcrV1/Data/PascalFrancis/Checkpoint

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000187 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/biblio.hfd -nk 000187 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Ticri/CIDE
   |area=    OcrV1
   |flux=    PascalFrancis
   |étape=   Checkpoint
   |type=    RBID
   |clé=     Pascal:09-0430753
   |texte=   Phrase-based correction model for improving handwriting recognition accuracies
}}

This area was generated with Dilib version V0.6.32.
Data generation: Sat Nov 11 16:53:45 2017. Site generation: Mon Mar 11 23:15:16 2024

	Serveur d'exploration sur l'OCR
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur l'OCR

Phrase-based correction model for improving handwriting recognition accuracies

Phrase-based correction model for improving handwriting recognition accuracies

Source :

Descripteurs français

English descriptors

Abstract

Links toward previous steps (curation, corpus...)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri