OcrV1, Istex, Checkpoint, bibRecord, 000A67

Context Driven Chinese String Segmentation and Recognition

Identifieur interne : 000A67 ( Istex/Checkpoint ); précédent : 000A66; suivant : 000A68

Context Driven Chinese String Segmentation and Recognition

Auteurs : Yan Jiang [République populaire de Chine] ; Xiaoqing Ding [République populaire de Chine] ; Qiang Fu [République populaire de Chine] ; Zheng Ren [Allemagne]

Source :

Lecture Notes in Computer Science [ 0302-9743 ] ; 2006.

RBID : ISTEX:397074378006AB30825A4D1F4411F0BDE4019931

Abstract

Abstract: This paper presents a context driven segmentation and recognition method for handwritten Chinese characters. We follow a split-merge technique in character segmentation. In this process, a Chinese text line is first pre-segmented into a sequence of radicals, which are then merged according to a cost function combining both recognition confidence and contextual cost. Two strategies are also proposed for implementation: bi-gram based merging and lexicon driven merging. In the former one, we generate a set of merging paths which are then evaluated by Viterbi algorithm. The radicals’ best merging method is given by the path with the highest score. In the latter strategy, a lexicon is preset and compared with the radicals to determine both radicals’ merging and candidate character selection. Experiments show that contextual information plays a crucial role in Chinese character segmentation and could obviously improve the segmentation and recognition results.

Url:

https://api.istex.fr/document/397074378006AB30825A4D1F4411F0BDE4019931/fulltext/pdf

DOI: 10.1007/11815921_13

Affiliations:

Links toward previous steps (curation, corpus...)

to stream Istex, to step Corpus: 003104
to stream Istex, to step Curation: 002E64

Links to Exploration step

ISTEX:397074378006AB30825A4D1F4411F0BDE4019931

Le document en format XML

<record><TEI wicri:istexFullTextTei="biblStruct"><teiHeader><fileDesc><titleStmt><title xml:lang="en">Context Driven Chinese String Segmentation and Recognition</title>
<author><name sortKey="Jiang, Yan" sort="Jiang, Yan" uniqKey="Jiang Y" first="Yan" last="Jiang">Yan Jiang</name>
</author>
<author><name sortKey="Ding, Xiaoqing" sort="Ding, Xiaoqing" uniqKey="Ding X" first="Xiaoqing" last="Ding">Xiaoqing Ding</name>
</author>
<author><name sortKey="Fu, Qiang" sort="Fu, Qiang" uniqKey="Fu Q" first="Qiang" last="Fu">Qiang Fu</name>
</author>
<author><name sortKey="Ren, Zheng" sort="Ren, Zheng" uniqKey="Ren Z" first="Zheng" last="Ren">Zheng Ren</name>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:397074378006AB30825A4D1F4411F0BDE4019931</idno>
<date when="2006" year="2006">2006</date>
<idno type="doi">10.1007/11815921_13</idno>
<idno type="url">https://api.istex.fr/document/397074378006AB30825A4D1F4411F0BDE4019931/fulltext/pdf</idno>
<idno type="wicri:Area/Istex/Corpus">003104</idno>
<idno type="wicri:Area/Istex/Curation">002E64</idno>
<idno type="wicri:Area/Istex/Checkpoint">000A67</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title level="a" type="main" xml:lang="en">Context Driven Chinese String Segmentation and Recognition</title>
<author><name sortKey="Jiang, Yan" sort="Jiang, Yan" uniqKey="Jiang Y" first="Yan" last="Jiang">Yan Jiang</name>
<affiliation wicri:level="3"><country xml:lang="fr">République populaire de Chine</country>
<wicri:regionArea>Department of Electronic Engineering, Tsinghua University, 100084, Beijing</wicri:regionArea>
<placeName><settlement type="city">Pékin</settlement>
</placeName>
</affiliation>
<affiliation wicri:level="1"><country wicri:rule="url">République populaire de Chine</country>
</affiliation>
</author>
<author><name sortKey="Ding, Xiaoqing" sort="Ding, Xiaoqing" uniqKey="Ding X" first="Xiaoqing" last="Ding">Xiaoqing Ding</name>
<affiliation wicri:level="3"><country xml:lang="fr">République populaire de Chine</country>
<wicri:regionArea>Department of Electronic Engineering, Tsinghua University, 100084, Beijing</wicri:regionArea>
<placeName><settlement type="city">Pékin</settlement>
</placeName>
</affiliation>
<affiliation wicri:level="1"><country wicri:rule="url">République populaire de Chine</country>
</affiliation>
</author>
<author><name sortKey="Fu, Qiang" sort="Fu, Qiang" uniqKey="Fu Q" first="Qiang" last="Fu">Qiang Fu</name>
<affiliation wicri:level="3"><country xml:lang="fr">République populaire de Chine</country>
<wicri:regionArea>Department of Electronic Engineering, Tsinghua University, 100084, Beijing</wicri:regionArea>
<placeName><settlement type="city">Pékin</settlement>
</placeName>
</affiliation>
<affiliation wicri:level="1"><country wicri:rule="url">République populaire de Chine</country>
</affiliation>
</author>
<author><name sortKey="Ren, Zheng" sort="Ren, Zheng" uniqKey="Ren Z" first="Zheng" last="Ren">Zheng Ren</name>
<affiliation wicri:level="3"><country xml:lang="fr">Allemagne</country>
<wicri:regionArea>Siemens AG, D-78467, Konstanz</wicri:regionArea>
<placeName><region type="land" nuts="1">Bade-Wurtemberg</region>
<region type="district" nuts="2">District de Fribourg-en-Brisgau</region>
<settlement type="city">Constance (Allemagne)</settlement>
</placeName>
</affiliation>
<affiliation><wicri:noCountry code="no comma">E-mail: zheng.ren@siemens.com</wicri:noCountry>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series><title level="s">Lecture Notes in Computer Science</title>
<imprint><date>2006</date>
</imprint>
<idno type="ISSN">0302-9743</idno>
<idno type="eISSN">1611-3349</idno>
<idno type="ISSN">0302-9743</idno>
</series>
<idno type="istex">397074378006AB30825A4D1F4411F0BDE4019931</idno>
<idno type="DOI">10.1007/11815921_13</idno>
<idno type="ChapterID">13</idno>
<idno type="ChapterID">Chap13</idno>
</biblStruct>
</sourceDesc>
<seriesStmt><idno type="ISSN">0302-9743</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass></textClass>
<langUsage><language ident="en">en</language>
</langUsage>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="en">Abstract: This paper presents a context driven segmentation and recognition method for handwritten Chinese characters. We follow a split-merge technique in character segmentation. In this process, a Chinese text line is first pre-segmented into a sequence of radicals, which are then merged according to a cost function combining both recognition confidence and contextual cost. Two strategies are also proposed for implementation: bi-gram based merging and lexicon driven merging. In the former one, we generate a set of merging paths which are then evaluated by Viterbi algorithm. The radicals’ best merging method is given by the path with the highest score. In the latter strategy, a lexicon is preset and compared with the radicals to determine both radicals’ merging and candidate character selection. Experiments show that contextual information plays a crucial role in Chinese character segmentation and could obviously improve the segmentation and recognition results.</div>
</front>
</TEI>
<affiliations><list><country><li>Allemagne</li>
<li>République populaire de Chine</li>
</country>
<region><li>Bade-Wurtemberg</li>
<li>District de Fribourg-en-Brisgau</li>
</region>
<settlement><li>Constance (Allemagne)</li>
<li>Pékin</li>
</settlement>
</list>
<tree><country name="République populaire de Chine"><noRegion><name sortKey="Jiang, Yan" sort="Jiang, Yan" uniqKey="Jiang Y" first="Yan" last="Jiang">Yan Jiang</name>
</noRegion>
<name sortKey="Ding, Xiaoqing" sort="Ding, Xiaoqing" uniqKey="Ding X" first="Xiaoqing" last="Ding">Xiaoqing Ding</name>
<name sortKey="Ding, Xiaoqing" sort="Ding, Xiaoqing" uniqKey="Ding X" first="Xiaoqing" last="Ding">Xiaoqing Ding</name>
<name sortKey="Fu, Qiang" sort="Fu, Qiang" uniqKey="Fu Q" first="Qiang" last="Fu">Qiang Fu</name>
<name sortKey="Fu, Qiang" sort="Fu, Qiang" uniqKey="Fu Q" first="Qiang" last="Fu">Qiang Fu</name>
<name sortKey="Jiang, Yan" sort="Jiang, Yan" uniqKey="Jiang Y" first="Yan" last="Jiang">Yan Jiang</name>
</country>
<country name="Allemagne"><region name="Bade-Wurtemberg"><name sortKey="Ren, Zheng" sort="Ren, Zheng" uniqKey="Ren Z" first="Zheng" last="Ren">Zheng Ren</name>
</region>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Ticri/CIDE/explor/OcrV1/Data/Istex/Checkpoint

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000A67 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/Istex/Checkpoint/biblio.hfd -nk 000A67 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Ticri/CIDE
   |area=    OcrV1
   |flux=    Istex
   |étape=   Checkpoint
   |type=    RBID
   |clé=     ISTEX:397074378006AB30825A4D1F4411F0BDE4019931
   |texte=   Context Driven Chinese String Segmentation and Recognition
}}

This area was generated with Dilib version V0.6.32.
Data generation: Sat Nov 11 16:53:45 2017. Site generation: Mon Mar 11 23:15:16 2024

	Serveur d'exploration sur l'OCR
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur l'OCR

Context Driven Chinese String Segmentation and Recognition

Context Driven Chinese String Segmentation and Recognition

Source :

Abstract

Links toward previous steps (curation, corpus...)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri