Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Une approche structurelle pour la reconnaissance de notices bibliographiques

Identifieur interne : 002E88 ( Istex/Corpus ); précédent : 002E87; suivant : 002E89

Une approche structurelle pour la reconnaissance de notices bibliographiques

Auteurs : Yannick Chenevoy ; Abdel Belaid

Source :

RBID : ISTEX:C58F4A2505FDF936F8D67602B3C270B6C6898F46

Abstract

Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.
This paper presents a library references recognition system for retrospective conversion of catalogues. The system is guided by a structure model of a reference class, described by an attribute grammar. The analysis method is based on prediction and verification of segmentation hypotheses proposed by the model. The result, given in UNIMARC format, contains the different sub-fields of the reference with their confidence score. This method is enough general to be adapted on any document having a micro-structure. This method has been also used on other kind of documents such as author index and subjects.

Url:
DOI: 10.3166/ts.12.663-671

Links to Exploration step

ISTEX:C58F4A2505FDF936F8D67602B3C270B6C6898F46

Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author>
<name sortKey="Chenevoy, Yannick" sort="Chenevoy, Yannick" uniqKey="Chenevoy Y" first="Yannick" last="Chenevoy">Yannick Chenevoy</name>
<affiliation>
<mods:affiliation>CRID, Université de Bourgogne, Bd Gabriel, F-21000 Dijonchenevoy®crid.u-bourgogne.fr</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>E-mail: chenevoy®crid.u-bourgogne.fr</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>International Standard Book Documentation.</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaid">Abdel Belaid</name>
<affiliation>
<mods:affiliation>CRIN-CNRS, Campus Scientifique, B.P. 239, F-54506 Vandœuvre-lès-Nancy Cedex abelaid@loria.fr</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>E-mail: abelaid@loria.fr</mods:affiliation>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:C58F4A2505FDF936F8D67602B3C270B6C6898F46</idno>
<date when="1995" year="1995">1995</date>
<idno type="doi">10.3166/ts.12.663-671</idno>
<idno type="url">https://api.istex.fr/ark:/67375/HT0-18P8J3ST-3/fulltext.pdf</idno>
<idno type="wicri:Area/Istex/Corpus">002E88</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">002E88</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a" type="main" xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<author>
<name sortKey="Chenevoy, Yannick" sort="Chenevoy, Yannick" uniqKey="Chenevoy Y" first="Yannick" last="Chenevoy">Yannick Chenevoy</name>
<affiliation>
<mods:affiliation>CRID, Université de Bourgogne, Bd Gabriel, F-21000 Dijonchenevoy®crid.u-bourgogne.fr</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>E-mail: chenevoy®crid.u-bourgogne.fr</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>International Standard Book Documentation.</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Belaid, Abdel" sort="Belaid, Abdel" uniqKey="Belaid A" first="Abdel" last="Belaid">Abdel Belaid</name>
<affiliation>
<mods:affiliation>CRIN-CNRS, Campus Scientifique, B.P. 239, F-54506 Vandœuvre-lès-Nancy Cedex abelaid@loria.fr</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>E-mail: abelaid@loria.fr</mods:affiliation>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j" type="main">Traitement du Signal</title>
<title level="j" type="abbrev">Trait. Signal</title>
<idno type="ISSN">0765-0019</idno>
<idno type="eISSN">1958-5608</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="1995-11">1995</date>
<biblScope unit="vol">12</biblScope>
<biblScope unit="issue">6</biblScope>
<biblScope unit="page" from="663">663</biblScope>
<biblScope unit="page" to="671">671</biblScope>
<biblScope unit="page-count">9</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
<idno type="ISSN">0765-0019</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0765-0019</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass></textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</div>
<div type="abstract" xml:lang="en">This paper presents a library references recognition system for retrospective conversion of catalogues. The system is guided by a structure model of a reference class, described by an attribute grammar. The analysis method is based on prediction and verification of segmentation hypotheses proposed by the model. The result, given in UNIMARC format, contains the different sub-fields of the reference with their confidence score. This method is enough general to be adapted on any document having a micro-structure. This method has been also used on other kind of documents such as author index and subjects.</div>
</front>
</TEI>
<istex>
<corpusName>lavoisier</corpusName>
<author>
<json:item>
<name>Yannick Chenevoy</name>
<affiliations>
<json:string>CRID, Université de Bourgogne, Bd Gabriel, F-21000 Dijonchenevoy®crid.u-bourgogne.fr</json:string>
<json:string>E-mail: chenevoy®crid.u-bourgogne.fr</json:string>
<json:string>International Standard Book Documentation.</json:string>
</affiliations>
</json:item>
<json:item>
<name>Abdel Belaid</name>
<affiliations>
<json:string>CRIN-CNRS, Campus Scientifique, B.P. 239, F-54506 Vandœuvre-lès-Nancy Cedex abelaid@loria.fr</json:string>
<json:string>E-mail: abelaid@loria.fr</json:string>
</affiliations>
</json:item>
</author>
<subject>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Notices bibliographiques</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Reconnaissance de la structure</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Analyse de documents</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Format Unimarc</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>SGML</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Library references</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Structure recognition</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Document analysis</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>Unimarc Format</value>
</json:item>
<json:item>
<lang>
<json:string>fre</json:string>
</lang>
<value>SGML</value>
</json:item>
</subject>
<arkIstex>ark:/67375/HT0-18P8J3ST-3</arkIstex>
<language>
<json:string>fre</json:string>
</language>
<originalGenre>
<json:string>research-article</json:string>
</originalGenre>
<abstract>Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</abstract>
<qualityIndicators>
<score>8.692</score>
<pdfWordCount>5838</pdfWordCount>
<pdfCharCount>35341</pdfCharCount>
<pdfVersion>1</pdfVersion>
<pdfPageCount>9</pdfPageCount>
<pdfPageSize>614 x 869 pts</pdfPageSize>
<refBibsNative>false</refBibsNative>
<abstractWordCount>141</abstractWordCount>
<abstractCharCount>947</abstractCharCount>
<keywordCount>10</keywordCount>
</qualityIndicators>
<title>Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<genre>
<json:string>research-article</json:string>
</genre>
<host>
<title>Traitement du Signal</title>
<language>
<json:string>unknown</json:string>
</language>
<issn>
<json:string>0765-0019</json:string>
</issn>
<eissn>
<json:string>1958-5608</json:string>
</eissn>
<publisherId>
<json:string>ts</json:string>
</publisherId>
<volume>12</volume>
<issue>6</issue>
<pages>
<first>663</first>
<last>671</last>
<total>9</total>
</pages>
<genre>
<json:string>journal</json:string>
</genre>
<subject>
<json:item>
<value>Lʼécrit et le document</value>
</json:item>
</subject>
</host>
<ark>
<json:string>ark:/67375/HT0-18P8J3ST-3</json:string>
</ark>
<publicationDate>1995</publicationDate>
<copyrightDate>1995</copyrightDate>
<doi>
<json:string>10.3166/ts.12.663-671</json:string>
</doi>
<id>C58F4A2505FDF936F8D67602B3C270B6C6898F46</id>
<score>1</score>
<fulltext>
<json:item>
<extension>pdf</extension>
<original>true</original>
<mimetype>application/pdf</mimetype>
<uri>https://api.istex.fr/ark:/67375/HT0-18P8J3ST-3/fulltext.pdf</uri>
</json:item>
<json:item>
<extension>zip</extension>
<original>false</original>
<mimetype>application/zip</mimetype>
<uri>https://api.istex.fr/ark:/67375/HT0-18P8J3ST-3/bundle.zip</uri>
</json:item>
<istex:fulltextTEI uri="https://api.istex.fr/ark:/67375/HT0-18P8J3ST-3/fulltext.tei">
<teiHeader>
<fileDesc>
<titleStmt>
<title level="a" type="main">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<respStmt>
<resp>Références bibliographiques récupérées via GROBID</resp>
<name resp="ISTEX-API">ISTEX-API (INIST-CNRS)</name>
</respStmt>
</titleStmt>
<publicationStmt>
<authority>ISTEX</authority>
<publisher>Lavoisier</publisher>
<availability>
<licence>© Lavoisier SAS 1995</licence>
<p>Lavoisier SAS</p>
</availability>
<date type="published" when="1995-11">1995</date>
<date type="Copyright" when="1995">1995</date>
</publicationStmt>
<notesStmt>
<note type="content-type" source="research-article" scheme="https://content-type.data.istex.fr/ark:/67375/XTP-1JC4F85T-7">research-article</note>
<note type="publication-type" scheme="https://publication-type.data.istex.fr/ark:/67375/JMC-0GLKJH51-B">journal</note>
</notesStmt>
<sourceDesc>
<biblStruct type="article">
<analytic>
<title level="a" type="main" xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
<title level="a" type="alt" xml:lang="en">A structural Approach for Library References Recognition</title>
<author xml:id="author-0000">
<persName>
<surname>Chenevoy</surname>
<forename type="first">Yannick</forename>
</persName>
<affiliation>
<ref>1</ref>
<email>chenevoy®crid.u-bourgogne.fr</email>
<address>
<orgName type="institution">CRID, Université de Bourgogne, Bd Gabriel</orgName>
<postCode>F-21000</postCode>
<settlement>Dijon</settlement>
</address>
</affiliation>
<note place="foot">
<ref></ref>
<p>International Standard Book Documentation.</p>
</note>
</author>
<author xml:id="author-0001">
<persName>
<surname>Belaid</surname>
<forename type="first">Abdel</forename>
</persName>
<affiliation>
<ref>2</ref>
<email>abelaid@loria.fr</email>
<address>
<orgName type="institution">CRIN-CNRS, Campus Scientifique</orgName>
<name type="postbox">B.P. 239</name>
<postCode>F-54506</postCode>
<settlement>Vandœuvre-lès-Nancy Cedex</settlement>
</address>
</affiliation>
</author>
<idno type="istex">C58F4A2505FDF936F8D67602B3C270B6C6898F46</idno>
<idno type="ark">ark:/67375/HT0-18P8J3ST-3</idno>
<idno type="DOI">10.3166/ts.12.663-671</idno>
<idno type="publisher-id">ts126p663</idno>
</analytic>
<monogr>
<title level="j" type="main">Traitement du Signal</title>
<title level="j" type="abbrev">Trait. Signal</title>
<idno type="publisher-id">ts</idno>
<idno type="pISSN">0765-0019</idno>
<idno type="eISSN">1958-5608</idno>
<imprint>
<publisher>Lavoisier</publisher>
<date type="published" when="1995-11">1995</date>
<biblScope unit="vol">12</biblScope>
<biblScope unit="issue">6</biblScope>
<biblScope unit="page" from="663">663</biblScope>
<biblScope unit="page" to="671">671</biblScope>
<biblScope unit="page-count">9</biblScope>
<biblScope unit="ref-count">0</biblScope>
<biblScope unit="fig-count">0</biblScope>
<biblScope unit="table-count">0</biblScope>
</imprint>
</monogr>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<abstract xml:lang="fr">
<p>Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</p>
</abstract>
<abstract xml:lang="en">
<p>This paper presents a library references recognition system for retrospective conversion of catalogues. The system is guided by a structure model of a reference class, described by an attribute grammar. The analysis method is based on prediction and verification of segmentation hypotheses proposed by the model. The result, given in UNIMARC format, contains the different sub-fields of the reference with their confidence score. This method is enough general to be adapted on any document having a micro-structure. This method has been also used on other kind of documents such as author index and subjects.</p>
</abstract>
<textClass ana="subject">
<keywords scheme="section">
<term>Lʼécrit et le document</term>
</keywords>
</textClass>
<textClass ana="keyword">
<keywords xml:lang="fr">
<term>Notices bibliographiques</term>
<term>Reconnaissance de la structure</term>
<term>Analyse de documents</term>
<term>Format Unimarc</term>
<term>SGML</term>
</keywords>
</textClass>
<textClass ana="keyword">
<keywords xml:lang="en">
<term>Library references</term>
<term>Structure recognition</term>
<term>Document analysis</term>
<term>Unimarc Format</term>
<term>SGML</term>
</keywords>
</textClass>
<langUsage>
<language ident="fr"></language>
</langUsage>
</profileDesc>
<revisionDesc>
<change xml:id="refBibs-istex" who="#ISTEX-API" when="2019-01-15">References added</change>
</revisionDesc>
</teiHeader>
</istex:fulltextTEI>
<json:item>
<extension>txt</extension>
<original>false</original>
<mimetype>text/plain</mimetype>
<uri>https://api.istex.fr/ark:/67375/HT0-18P8J3ST-3/fulltext.txt</uri>
</json:item>
</fulltext>
<metadata>
<istex:metadataXml wicri:clean="corpus lavoisier not found" wicri:toSee="no header">
<istex:xmlDeclaration>version="1.0" encoding="UTF-8"</istex:xmlDeclaration>
<istex:docType PUBLIC="-//EDP//DTD EDP Publishing JATS v1.0 20130606//EN" URI="JATS-edppublishing1.dtd" name="istex:docType"></istex:docType>
<istex:document>
<article article-type="research-article" dtd-version="1.0" xml:lang="fr">
<front>
<journal-meta>
<journal-id journal-id-type="publisher-id">ts</journal-id>
<journal-title-group>
<journal-title>Traitement du Signal</journal-title>
<journal-subtitle>Signal, Image, Parole</journal-subtitle>
<abbrev-journal-title abbrev-type="publisher">Trait. Signal</abbrev-journal-title>
</journal-title-group>
<issn pub-type="ppub">0765-0019</issn>
<issn pub-type="epub">1958-5608</issn>
<publisher>
<publisher-name>Lavoisier</publisher-name>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.3166/ts.12.663-671</article-id>
<article-id pub-id-type="publisher-id">ts126p663</article-id>
<article-categories>
<subj-group subj-group-type="section" xml:lang="fr">
<subject>Lʼécrit et le document</subject>
</subj-group>
</article-categories>
<title-group>
<article-title xml:lang="fr">Une approche structurelle pour la reconnaissance de notices bibliographiques</article-title>
<trans-title-group xml:lang="en">
<trans-title>A structural Approach for Library References Recognition</trans-title>
</trans-title-group>
</title-group>
<contrib-group content-type="authors">
<contrib contrib-type="author">
<name>
<surname>Chenevoy</surname>
<given-names>Yannick</given-names>
</name>
<xref ref-type="aff" rid="AFF1">1</xref>
<xref ref-type="author-notes" rid="FN1"></xref>
</contrib>
<contrib contrib-type="author">
<name>
<surname>Belaid</surname>
<given-names>Abdel</given-names>
</name>
<xref ref-type="aff" rid="AFF2">2</xref>
</contrib>
</contrib-group>
<aff id="AFF1">
<label>1</label>
<addr-line>
<institution>CRID, Université de Bourgogne, Bd Gabriel</institution>
,
<named-content content-type="postcode">F-21000</named-content>
<named-content content-type="city">Dijon</named-content>
</addr-line>
<email>chenevoy®crid.u-bourgogne.fr</email>
</aff>
<aff id="AFF2">
<label>2</label>
<addr-line>
<institution>CRIN-CNRS, Campus Scientifique</institution>
,
<named-content content-type="postbox">B.P. 239</named-content>
,
<named-content content-type="postcode">F-54506</named-content>
<named-content content-type="city">Vandœuvre-lès-Nancy Cedex</named-content>
</addr-line>
<email>abelaid@loria.fr</email>
</aff>
<author-notes>
<fn id="FN1">
<label></label>
<p>International Standard Book Documentation.</p>
</fn>
</author-notes>
<pub-date date-type="pub" publication-format="print">
<month>11</month>
<year>1995</year>
</pub-date>
<volume>12</volume>
<issue>6</issue>
<fpage>663</fpage>
<lpage>671</lpage>
<permissions>
<copyright-statement>© Lavoisier SAS 1995</copyright-statement>
<copyright-year>1995</copyright-year>
<copyright-holder>Lavoisier SAS</copyright-holder>
</permissions>
<abstract xml:lang="fr">
<p>Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</p>
</abstract>
<trans-abstract xml:lang="en">
<p>This paper presents a library references recognition system for retrospective conversion of catalogues. The system is guided by a structure model of a reference class, described by an attribute grammar. The analysis method is based on prediction and verification of segmentation hypotheses proposed by the model. The result, given in UNIMARC format, contains the different sub-fields of the reference with their confidence score. This method is enough general to be adapted on any document having a micro-structure. This method has been also used on other kind of documents such as author index and subjects.</p>
</trans-abstract>
<kwd-group xml:lang="fr">
<kwd>Notices bibliographiques</kwd>
<kwd>Reconnaissance de la structure</kwd>
<kwd>Analyse de documents</kwd>
<kwd>Format Unimarc</kwd>
<kwd>SGML</kwd>
</kwd-group>
<kwd-group xml:lang="en">
<kwd>Library references</kwd>
<kwd>Structure recognition</kwd>
<kwd>Document analysis</kwd>
<kwd>Unimarc Format</kwd>
<kwd>SGML</kwd>
</kwd-group>
<counts>
<fig-count count="0"></fig-count>
<table-count count="0"></table-count>
<equation-count count="0"></equation-count>
<ref-count count="0"></ref-count>
<page-count count="9"></page-count>
</counts>
<custom-meta-group>
<custom-meta>
<meta-name>idline</meta-name>
<meta-value>Traitement du Signal, volume 12 - n° 6 - 1995</meta-value>
</custom-meta>
<custom-meta>
<meta-name>cover_date</meta-name>
<meta-value>Novembre-Décembre 1995</meta-value>
</custom-meta>
<custom-meta>
<meta-name>first_month</meta-name>
<meta-value>11</meta-value>
</custom-meta>
<custom-meta>
<meta-name>last_month</meta-name>
<meta-value>12</meta-value>
</custom-meta>
<custom-meta>
<meta-name>first_year</meta-name>
<meta-value>1995</meta-value>
</custom-meta>
<custom-meta>
<meta-name>last_year</meta-name>
<meta-value>1995</meta-value>
</custom-meta>
</custom-meta-group>
</article-meta>
</front>
</article>
</istex:document>
</istex:metadataXml>
<mods version="3.6">
<titleInfo lang="fr">
<title>Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
</titleInfo>
<titleInfo type="alternative" lang="fr" contentType="CDATA">
<title>Une approche structurelle pour la reconnaissance de notices bibliographiques</title>
</titleInfo>
<titleInfo type="translated" lang="en">
<title>A structural Approach for Library References Recognition</title>
</titleInfo>
<titleInfo type="translated" lang="en" contentType="CDATA">
<title>A structural Approach for Library References Recognition</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yannick</namePart>
<namePart type="family">Chenevoy</namePart>
<affiliation>CRID, Université de Bourgogne, Bd Gabriel, F-21000 Dijonchenevoy®crid.u-bourgogne.fr</affiliation>
<affiliation>E-mail: chenevoy®crid.u-bourgogne.fr</affiliation>
<affiliation>International Standard Book Documentation.</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Abdel</namePart>
<namePart type="family">Belaid</namePart>
<affiliation>CRIN-CNRS, Campus Scientifique, B.P. 239, F-54506 Vandœuvre-lès-Nancy Cedex abelaid@loria.fr</affiliation>
<affiliation>E-mail: abelaid@loria.fr</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<typeOfResource>text</typeOfResource>
<genre type="research-article" displayLabel="research-article" authority="ISTEX" authorityURI="https://content-type.data.istex.fr" valueURI="https://content-type.data.istex.fr/ark:/67375/XTP-1JC4F85T-7">research-article</genre>
<originInfo>
<publisher>Lavoisier</publisher>
<dateIssued encoding="w3cdtf">1995</dateIssued>
<copyrightDate encoding="w3cdtf">1995</copyrightDate>
</originInfo>
<language>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
<languageTerm type="code" authority="rfc3066">fr</languageTerm>
</language>
<physicalDescription></physicalDescription>
<abstract lang="fr">Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d’une notice consiste à retrouver, à partir d’un flux OCR (Optical Character Récognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.</abstract>
<abstract lang="en">This paper presents a library references recognition system for retrospective conversion of catalogues. The system is guided by a structure model of a reference class, described by an attribute grammar. The analysis method is based on prediction and verification of segmentation hypotheses proposed by the model. The result, given in UNIMARC format, contains the different sub-fields of the reference with their confidence score. This method is enough general to be adapted on any document having a micro-structure. This method has been also used on other kind of documents such as author index and subjects.</abstract>
<note type="footnotes">International Standard Book Documentation.</note>
<subject lang="fr">
<genre>keywords</genre>
<topic>Notices bibliographiques</topic>
<topic>Reconnaissance de la structure</topic>
<topic>Analyse de documents</topic>
<topic>Format Unimarc</topic>
<topic>SGML</topic>
</subject>
<subject lang="en">
<genre>keywords</genre>
<topic>Library references</topic>
<topic>Structure recognition</topic>
<topic>Document analysis</topic>
<topic>Unimarc Format</topic>
<topic>SGML</topic>
</subject>
<relatedItem type="host">
<titleInfo>
<title>Traitement du Signal</title>
</titleInfo>
<genre type="journal" authority="ISTEX" authorityURI="https://publication-type.data.istex.fr" valueURI="https://publication-type.data.istex.fr/ark:/67375/JMC-0GLKJH51-B">journal</genre>
<subject>
<genre>section</genre>
<topic>Lʼécrit et le document</topic>
</subject>
<identifier type="ISSN">0765-0019</identifier>
<identifier type="eISSN">1958-5608</identifier>
<identifier type="PublisherID">ts</identifier>
<part>
<date>1995</date>
<detail type="volume">
<caption>vol.</caption>
<number>12</number>
</detail>
<detail type="issue">
<caption>no.</caption>
<number>6</number>
</detail>
<extent unit="pages">
<start>663</start>
<end>671</end>
<total>9</total>
</extent>
</part>
</relatedItem>
<identifier type="istex">C58F4A2505FDF936F8D67602B3C270B6C6898F46</identifier>
<identifier type="ark">ark:/67375/HT0-18P8J3ST-3</identifier>
<identifier type="DOI">10.3166/ts.12.663-671</identifier>
<identifier type="publisher-ID">ts126p663</identifier>
<accessCondition type="use and reproduction" contentType="copyright">© Lavoisier SAS 1995</accessCondition>
<recordInfo>
<recordContentSource authority="ISTEX" authorityURI="https://loaded-corpus.data.istex.fr" valueURI="https://loaded-corpus.data.istex.fr/ark:/67375/XBH-4L897VLR-T">lavoisier</recordContentSource>
<recordOrigin>© Lavoisier SAS 1995</recordOrigin>
</recordInfo>
</mods>
<json:item>
<extension>json</extension>
<original>false</original>
<mimetype>application/json</mimetype>
<uri>https://api.istex.fr/ark:/67375/HT0-18P8J3ST-3/record.json</uri>
</json:item>
</metadata>
<serie></serie>
</istex>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Istex/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 002E88 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Istex/Corpus/biblio.hfd -nk 002E88 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Istex
   |étape=   Corpus
   |type=    RBID
   |clé=     ISTEX:C58F4A2505FDF936F8D67602B3C270B6C6898F46
   |texte=   Une approche structurelle pour la reconnaissance de notices bibliographiques
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022