Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Une approche structurelle pour la reconnaissance de notices bibliographiques

Identifieur interne : 006826 ( Hal/Corpus ); précédent : 006825; suivant : 006827

Une approche structurelle pour la reconnaissance de notices bibliographiques

Auteurs : Y. Chenevoy ; Abdel Belaïd

Source :

RBID : Hal:inria-00534043

Descripteurs français

Abstract

Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d'une notice consiste à retrouver, à partir d'un flux OCR (Optical Character Recognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.

Url:

Links to Exploration step

Hal:inria-00534043

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author>
<name sortKey="Chenevoy, Y" sort="Chenevoy, Y" uniqKey="Chenevoy Y" first="Y." last="Chenevoy">Y. Chenevoy</name>
<affiliation>
<hal:affiliation type="laboratory" xml:id="struct-39345" status="OLD">
<orgName>Laboratoire Informatique de Recherche sur les Systèmes Intelligents et leurs Applications</orgName>
<orgName type="acronym">LIRSIA</orgName>
<date type="end">2006-12-31</date>
<desc>
<address>
<addrLine>Université de Bourgogne - 21000 Dijon</addrLine>
<country key="FR"></country>
</address>
</desc>
<listRelation>
<relation name="EA1871" active="#struct-300270" type="direct"></relation>
</listRelation>
<tutelles>
<tutelle name="EA1871" active="#struct-300270" type="direct">
<org type="institution" xml:id="struct-300270" status="VALID">
<orgName>Université de Bourgogne</orgName>
<orgName type="acronym">UB</orgName>
<desc>
<address>
<addrLine>Maison de l'université - Esplanade Érasme - BP 27877 - 21078 Dijon cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.u-bourgogne.fr/</ref>
</desc>
</org>
</tutelle>
</tutelles>
</hal:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaïd">Abdel Belaïd</name>
<affiliation>
<hal:affiliation type="researchteam" xml:id="struct-2362" status="OLD">
<orgName>READ</orgName>
<orgName type="acronym">READ</orgName>
<desc>
<address>
<country key="FR"></country>
</address>
</desc>
<listRelation>
<relation active="#struct-160" type="direct"></relation>
<relation name="UMR7503" active="#struct-441569" type="indirect"></relation>
<relation active="#struct-300009" type="indirect"></relation>
<relation active="#struct-300291" type="indirect"></relation>
<relation active="#struct-300292" type="indirect"></relation>
<relation active="#struct-300293" type="indirect"></relation>
</listRelation>
<tutelles>
<tutelle active="#struct-160" type="direct">
<org type="laboratory" xml:id="struct-160" status="OLD">
<orgName>Laboratoire Lorrain de Recherche en Informatique et ses Applications</orgName>
<orgName type="acronym">LORIA</orgName>
<desc>
<address>
<addrLine>Campus Scientifique BP 239 54506 Vandoeuvre-lès-Nancy Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.loria.fr</ref>
</desc>
<listRelation>
<relation name="UMR7503" active="#struct-441569" type="direct"></relation>
<relation active="#struct-300009" type="direct"></relation>
<relation active="#struct-300291" type="direct"></relation>
<relation active="#struct-300292" type="direct"></relation>
<relation active="#struct-300293" type="direct"></relation>
</listRelation>
</org>
</tutelle>
<tutelle name="UMR7503" active="#struct-441569" type="indirect">
<org type="institution" xml:id="struct-441569" status="VALID">
<idno type="ISNI">0000000122597504</idno>
<idno type="IdRef">02636817X</idno>
<orgName>Centre National de la Recherche Scientifique</orgName>
<orgName type="acronym">CNRS</orgName>
<date type="start">1939-10-19</date>
<desc>
<address>
<country key="FR"></country>
</address>
<ref type="url">http://www.cnrs.fr/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300009" type="indirect">
<org type="institution" xml:id="struct-300009" status="VALID">
<orgName>Institut National de Recherche en Informatique et en Automatique</orgName>
<orgName type="acronym">Inria</orgName>
<desc>
<address>
<addrLine>Domaine de VoluceauRocquencourt - BP 10578153 Le Chesnay Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/en/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300291" type="indirect">
<org type="institution" xml:id="struct-300291" status="OLD">
<orgName>Université Henri Poincaré - Nancy 1</orgName>
<orgName type="acronym">UHP</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>24-30 rue Lionnois, BP 60120, 54 003 NANCY cedex, France</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300292" type="indirect">
<org type="institution" xml:id="struct-300292" status="OLD">
<orgName>Université Nancy 2</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>91 avenue de la Libération, BP 454, 54001 Nancy cedex</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300293" type="indirect">
<org type="institution" xml:id="struct-300293" status="OLD">
<orgName>Institut National Polytechnique de Lorraine</orgName>
<orgName type="acronym">INPL</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
</tutelles>
</hal:affiliation>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">HAL</idno>
<idno type="RBID">Hal:inria-00534043</idno>
<idno type="halId">inria-00534043</idno>
<idno type="halUri">https://hal.inria.fr/inria-00534043</idno>
<idno type="url">https://hal.inria.fr/inria-00534043</idno>
<date when="1995">1995</date>
<idno type="wicri:Area/Hal/Corpus">006826</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author>
<name sortKey="Chenevoy, Y" sort="Chenevoy, Y" uniqKey="Chenevoy Y" first="Y." last="Chenevoy">Y. Chenevoy</name>
<affiliation>
<hal:affiliation type="laboratory" xml:id="struct-39345" status="OLD">
<orgName>Laboratoire Informatique de Recherche sur les Systèmes Intelligents et leurs Applications</orgName>
<orgName type="acronym">LIRSIA</orgName>
<date type="end">2006-12-31</date>
<desc>
<address>
<addrLine>Université de Bourgogne - 21000 Dijon</addrLine>
<country key="FR"></country>
</address>
</desc>
<listRelation>
<relation name="EA1871" active="#struct-300270" type="direct"></relation>
</listRelation>
<tutelles>
<tutelle name="EA1871" active="#struct-300270" type="direct">
<org type="institution" xml:id="struct-300270" status="VALID">
<orgName>Université de Bourgogne</orgName>
<orgName type="acronym">UB</orgName>
<desc>
<address>
<addrLine>Maison de l'université - Esplanade Érasme - BP 27877 - 21078 Dijon cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.u-bourgogne.fr/</ref>
</desc>
</org>
</tutelle>
</tutelles>
</hal:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaïd">Abdel Belaïd</name>
<affiliation>
<hal:affiliation type="researchteam" xml:id="struct-2362" status="OLD">
<orgName>READ</orgName>
<orgName type="acronym">READ</orgName>
<desc>
<address>
<country key="FR"></country>
</address>
</desc>
<listRelation>
<relation active="#struct-160" type="direct"></relation>
<relation name="UMR7503" active="#struct-441569" type="indirect"></relation>
<relation active="#struct-300009" type="indirect"></relation>
<relation active="#struct-300291" type="indirect"></relation>
<relation active="#struct-300292" type="indirect"></relation>
<relation active="#struct-300293" type="indirect"></relation>
</listRelation>
<tutelles>
<tutelle active="#struct-160" type="direct">
<org type="laboratory" xml:id="struct-160" status="OLD">
<orgName>Laboratoire Lorrain de Recherche en Informatique et ses Applications</orgName>
<orgName type="acronym">LORIA</orgName>
<desc>
<address>
<addrLine>Campus Scientifique BP 239 54506 Vandoeuvre-lès-Nancy Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.loria.fr</ref>
</desc>
<listRelation>
<relation name="UMR7503" active="#struct-441569" type="direct"></relation>
<relation active="#struct-300009" type="direct"></relation>
<relation active="#struct-300291" type="direct"></relation>
<relation active="#struct-300292" type="direct"></relation>
<relation active="#struct-300293" type="direct"></relation>
</listRelation>
</org>
</tutelle>
<tutelle name="UMR7503" active="#struct-441569" type="indirect">
<org type="institution" xml:id="struct-441569" status="VALID">
<idno type="ISNI">0000000122597504</idno>
<idno type="IdRef">02636817X</idno>
<orgName>Centre National de la Recherche Scientifique</orgName>
<orgName type="acronym">CNRS</orgName>
<date type="start">1939-10-19</date>
<desc>
<address>
<country key="FR"></country>
</address>
<ref type="url">http://www.cnrs.fr/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300009" type="indirect">
<org type="institution" xml:id="struct-300009" status="VALID">
<orgName>Institut National de Recherche en Informatique et en Automatique</orgName>
<orgName type="acronym">Inria</orgName>
<desc>
<address>
<addrLine>Domaine de VoluceauRocquencourt - BP 10578153 Le Chesnay Cedex</addrLine>
<country key="FR"></country>
</address>
<ref type="url">http://www.inria.fr/en/</ref>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300291" type="indirect">
<org type="institution" xml:id="struct-300291" status="OLD">
<orgName>Université Henri Poincaré - Nancy 1</orgName>
<orgName type="acronym">UHP</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>24-30 rue Lionnois, BP 60120, 54 003 NANCY cedex, France</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300292" type="indirect">
<org type="institution" xml:id="struct-300292" status="OLD">
<orgName>Université Nancy 2</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<addrLine>91 avenue de la Libération, BP 454, 54001 Nancy cedex</addrLine>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
<tutelle active="#struct-300293" type="indirect">
<org type="institution" xml:id="struct-300293" status="OLD">
<orgName>Institut National Polytechnique de Lorraine</orgName>
<orgName type="acronym">INPL</orgName>
<date type="end">2011-12-31</date>
<desc>
<address>
<country key="FR"></country>
</address>
</desc>
</org>
</tutelle>
</tutelles>
</hal:affiliation>
</affiliation>
</author>
</analytic>
<series>
<title level="j">Traitement du Signal</title>
<idno type="ISSN">0765-0019</idno>
<imprint>
<date type="datePub">1995</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="mix" xml:lang="fr">
<term>Analyse documentaire</term>
<term>Bibliographie</term>
<term>Bibliography</term>
<term>Document analysis</term>
<term>Document structure</term>
<term>Format UNIMARC</term>
<term>Notice</term>
<term>Pattern recognition</term>
<term>Reconnaissance forme</term>
<term>SGML</term>
<term>Structure document</term>
<term>Technical instructions</term>
<term>UNIMARC format</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d'une notice consiste à retrouver, à partir d'un flux OCR (Optical Character Recognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</div>
</front>
</TEI>
<hal api="V3">
<titleStmt>
<title xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author role="aut">
<persName>
<forename type="first">Y.</forename>
<surname>Chenevoy</surname>
</persName>
<email>chenevoy@crid.u-bourgogne.fr</email>
<idno type="halauthor">543500</idno>
<affiliation ref="#struct-39345"></affiliation>
</author>
<author role="aut">
<persName>
<forename type="first">Abdel</forename>
<surname>Belaïd</surname>
</persName>
<email>abelaid@loria.fr</email>
<idno type="halauthor">52834</idno>
<affiliation ref="#struct-2362"></affiliation>
</author>
<editor role="depositor">
<persName>
<forename>Abdel</forename>
<surname>Belaid</surname>
</persName>
<email>abelaid@loria.fr</email>
</editor>
</titleStmt>
<editionStmt>
<edition n="v1" type="current">
<date type="whenSubmitted">2010-11-08 16:44:19</date>
<date type="whenModified">2016-05-19 01:05:33</date>
<date type="whenReleased">2010-11-08 16:44:19</date>
<date type="whenProduced">1995</date>
</edition>
<respStmt>
<resp>contributor</resp>
<name key="113588">
<persName>
<forename>Abdel</forename>
<surname>Belaid</surname>
</persName>
<email>abelaid@loria.fr</email>
</name>
</respStmt>
</editionStmt>
<publicationStmt>
<distributor>CCSD</distributor>
<idno type="halId">inria-00534043</idno>
<idno type="halUri">https://hal.inria.fr/inria-00534043</idno>
<idno type="halBibtex">chenevoy:inria-00534043</idno>
<idno type="halRefHtml">Traitement du Signal, Lavoisier, 1995, Congrès CNED'94: Colloque National sur l'Ecrit et le Document No3, Rouen FRANCE (06/07/1994), 16 (6), pp.663-671</idno>
<idno type="halRef">Traitement du Signal, Lavoisier, 1995, Congrès CNED'94: Colloque National sur l'Ecrit et le Document No3, Rouen FRANCE (06/07/1994), 16 (6), pp.663-671</idno>
</publicationStmt>
<seriesStmt>
<idno type="stamp" n="UNIV-BOURGOGNE">Université de Bourgogne</idno>
<idno type="stamp" n="INRIA">INRIA - Institut National de Recherche en Informatique et en Automatique</idno>
<idno type="stamp" n="CNRS">CNRS - Centre national de la recherche scientifique</idno>
<idno type="stamp" n="LORIA2">Publications du LORIA</idno>
<idno type="stamp" n="LABO-LORIA-SET" p="LORIA">LABO-LORIA-SET</idno>
<idno type="stamp" n="LORIA">LORIA - Laboratoire Lorrain de Recherche en Informatique et ses Applications</idno>
<idno type="stamp" n="LORIA-TALC" p="LORIA">Traitement automatique des langues et des connaissances</idno>
<idno type="stamp" n="UNIV-LORRAINE">Université de Lorraine</idno>
<idno type="stamp" n="INPL">Institut National Polytechnique de Lorraine</idno>
</seriesStmt>
<notesStmt>
<note type="audience" n="3">National</note>
<note type="popular" n="0">No</note>
<note type="peer" n="1">Yes</note>
</notesStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author role="aut">
<persName>
<forename type="first">Y.</forename>
<surname>Chenevoy</surname>
</persName>
<email>chenevoy@crid.u-bourgogne.fr</email>
<idno type="halAuthorId">543500</idno>
<affiliation ref="#struct-39345"></affiliation>
</author>
<author role="aut">
<persName>
<forename type="first">Abdel</forename>
<surname>Belaïd</surname>
</persName>
<email>abelaid@loria.fr</email>
<idno type="halAuthorId">52834</idno>
<affiliation ref="#struct-2362"></affiliation>
</author>
</analytic>
<monogr>
<idno type="halJournalId" status="VALID">62863</idno>
<idno type="issn">0765-0019</idno>
<idno type="eissn">1958-5608</idno>
<title level="j">Traitement du Signal</title>
<imprint>
<publisher>Lavoisier</publisher>
<biblScope unit="serie">Congrès CNED'94: Colloque National sur l'Ecrit et le Document No3, Rouen , FRANCE (06/07/1994)</biblScope>
<biblScope unit="volume">16</biblScope>
<biblScope unit="issue">6</biblScope>
<biblScope unit="pp">663-671</biblScope>
<date type="datePub">1995</date>
</imprint>
</monogr>
<ref type="seeAlso">http://www.loria.fr/~abelaid/publis/tsi-chenevoy-notice.pdf</ref>
</biblStruct>
</sourceDesc>
<profileDesc>
<langUsage>
<language ident="fr">French</language>
</langUsage>
<textClass>
<keywords scheme="author">
<term xml:lang="fr">Analyse documentaire</term>
<term xml:lang="fr">UNIMARC format</term>
<term xml:lang="fr">Document analysis</term>
<term xml:lang="fr">Pattern recognition</term>
<term xml:lang="fr">Technical instructions</term>
<term xml:lang="fr">Bibliography</term>
<term xml:lang="fr">Document structure</term>
<term xml:lang="fr">SGML</term>
<term xml:lang="fr">Reconnaissance forme</term>
<term xml:lang="fr">Notice</term>
<term xml:lang="fr">Bibliographie</term>
<term xml:lang="fr">Structure document</term>
<term xml:lang="fr">Format UNIMARC</term>
</keywords>
<classCode scheme="halDomain" n="info.info-dl">Computer Science [cs]/Digital Libraries [cs.DL]</classCode>
<classCode scheme="halTypology" n="ART">Journal articles</classCode>
</textClass>
<abstract xml:lang="fr">Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d'une notice consiste à retrouver, à partir d'un flux OCR (Optical Character Recognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</abstract>
</profileDesc>
</hal>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Hal/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 006826 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Hal/Corpus/biblio.hfd -nk 006826 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Hal
   |étape=   Corpus
   |type=    RBID
   |clé=     Hal:inria-00534043
   |texte=   Une approche structurelle pour la reconnaissance de notices bibliographiques
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022