Une approche structurelle pour la reconnaissance de notices bibliographiques
Identifieur interne : 00CF18 ( Main/Merge ); précédent : 00CF17; suivant : 00CF19Une approche structurelle pour la reconnaissance de notices bibliographiques
Auteurs : Yannick Chenevoy [France] ; Abdel Belaïd [France]Source :
- Traitement du Signal [ 0765-0019 ] ; 1995.
Abstract
Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.
This paper presents a library references recognition system for retrospective conversion of catalogues. The system is guided by a structure model of a reference class, described by an attribute grammar. The analysis method is based on prediction and verification of segmentation hypotheses proposed by the model. The result, given in UNIMARC format, contains the different sub-fields of the reference with their confidence score. This method is enough general to be adapted on any document having a micro-structure. This method has been also used on other kind of documents such as author index and subjects.
Url:
DOI: 10.3166/ts.12.663-671
Links toward previous steps (curation, corpus...)
- to stream Istex, to step Corpus: 002E88
- to stream Istex, to step Curation: 002E50
- to stream Istex, to step Checkpoint: 002A76
Links to Exploration step
ISTEX:C58F4A2505FDF936F8D67602B3C270B6C6898F46Le document en format XML
<record><TEI wicri:istexFullTextTei="biblStruct"><teiHeader><fileDesc><titleStmt><title xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author><name sortKey="Chenevoy, Yannick" sort="Chenevoy, Yannick" uniqKey="Chenevoy Y" first="Yannick" last="Chenevoy">Yannick Chenevoy</name>
</author>
<author><name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaid">Abdel Belaïd</name>
<affiliation><country>France</country>
<placeName><settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:C58F4A2505FDF936F8D67602B3C270B6C6898F46</idno>
<date when="1995" year="1995">1995</date>
<idno type="doi">10.3166/ts.12.663-671</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-18P8J3ST-3/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">002E88</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">002E88</idno>
<idno type="wicri:Area/Istex/Curation">002E50</idno>
<idno type="wicri:Area/Istex/Checkpoint">002A76</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Checkpoint">002A76</idno>
<idno type="wicri:doubleKey">0765-0019:1995:Chenevoy Y:une:approche:structurelle</idno>
<idno type="wicri:Area/Main/Merge">00CF18</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title level="a" type="main" xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author><name sortKey="Chenevoy, Yannick" sort="Chenevoy, Yannick" uniqKey="Chenevoy Y" first="Yannick" last="Chenevoy">Yannick Chenevoy</name>
<affiliation wicri:level="0"><country wicri:rule="zip">France</country>
</affiliation>
<affiliation></affiliation>
<affiliation></affiliation>
</author>
<author><name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaid">Abdel Belaïd</name>
<affiliation wicri:level="0"><country wicri:rule="zip">France</country>
<country>France</country>
<placeName><settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
<affiliation wicri:level="1"><country wicri:rule="url">France</country>
<placeName><settlement type="city">Nancy</settlement>
<region type="region" nuts="2">Grand Est</region>
<region type="region" nuts="2">Lorraine (région)</region>
</placeName>
<orgName type="laboratoire" n="5">Laboratoire lorrain de recherche en informatique et ses applications</orgName>
<orgName type="university">Université de Lorraine</orgName>
<orgName type="institution">Centre national de la recherche scientifique</orgName>
<orgName type="institution">Institut national de recherche en informatique et en automatique</orgName>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series><title level="j" type="main">Traitement du Signal</title>
<title level="j" type="abbrev">Trait. Signal</title>
<idno type="ISSN">0765-0019</idno>
<idno type="eISSN">1958-5608</idno>
<imprint><publisher>Lavoisier</publisher>
<date type="published" when="1995-11">1995</date>
<biblScope unit="vol">12</biblScope>
<biblScope unit="issue">6</biblScope>
<biblScope unit="page" from="663">663</biblScope>
<biblScope unit="page" to="671">671</biblScope>
<biblScope unit="page-count">9</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0765-0019</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><idno type="ISSN">0765-0019</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass></textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</div>
<div type="abstract" xml:lang="en">This paper presents a library references recognition system for retrospective conversion of catalogues. The system is guided by a structure model of a reference class, described by an attribute grammar. The analysis method is based on prediction and verification of segmentation hypotheses proposed by the model. The result, given in UNIMARC format, contains the different sub-fields of the reference with their confidence score. This method is enough general to be adapted on any document having a micro-structure. This method has been also used on other kind of documents such as author index and subjects.</div>
</front>
</TEI>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Merge
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 00CF18 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/Main/Merge/biblio.hfd -nk 00CF18 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien |wiki= Wicri/Lorraine |area= InforLorV4 |flux= Main |étape= Merge |type= RBID |clé= ISTEX:C58F4A2505FDF936F8D67602B3C270B6C6898F46 |texte= Une approche structurelle pour la reconnaissance de notices bibliographiques }}
This area was generated with Dilib version V0.6.33. |