Serveur d'exploration sur la TEI

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage

Identifieur interne : 000066 ( PascalFrancis/Checkpoint ); précédent : 000065; suivant : 000067

Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage

Auteurs : F. Bruneseaux [France]

Source :

RBID : Francis:524-99-13508

Descripteurs français

English descriptors

Abstract

Parmi les avantages qu'offre la version informatisée d'une ressource linguistique, il y a, entre autres, la possibilité d'enrichir le document d'annotations spécifiques qui ne se limitent pas à un simple repérage de début/fin de sections ou de paragraphes. Dans cet article, nous aborderons plus précisément le problème du repérage et du codage des noms propres, syntagmes nominaux et expressions référentielles. Cependant, si l'annotation des noms propres peut être intéressante à des fins multiples (résumés automatiques, recherche dans des bases de données, etc.), on verra que dans les faits un tel travail suppose une bonne réflexion sur ce que l'on doit effectivement coder. C'est pourquoi, en nous appuyant sur les recommandations de la TEI (Text Encoding Initiative), nous faisons des propositions afin d'aller au-delà des possibilités actuelles et d'offrir ainsi un schéma qui permette d'affiner le codage en fonction du niveau d'analyse auquelle nom propre est appréhendé, distinguant entre nom propre élément d'un syntagme nominal ou d'une expression référentielle.


Affiliations:


Links toward previous steps (curation, corpus...)


Links to Exploration step

Francis:524-99-13508

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" level="a">Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage</title>
<author>
<name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
<affiliation wicri:level="1">
<inist:fA14 i1="01">
<s1>Centre de recherche en informatique de Nancy (CRIN), Bâtiment LORIA, BP 239</s1>
<s2>Vandœuvre-Lès Nancy 54 506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
<wicri:noRegion>BP 239</wicri:noRegion>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">524-99-13508</idno>
<date when="1998">1998</date>
<idno type="stanalyst">FRANCIS 524-99-13508 INIST</idno>
<idno type="RBID">Francis:524-99-13508</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000059</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000070</idno>
<idno type="wicri:Area/PascalFrancis/Checkpoint">000066</idno>
<idno type="wicri:explorRef" wicri:stream="PascalFrancis" wicri:step="Checkpoint">000066</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr" level="a">Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage</title>
<author>
<name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
<affiliation wicri:level="1">
<inist:fA14 i1="01">
<s1>Centre de recherche en informatique de Nancy (CRIN), Bâtiment LORIA, BP 239</s1>
<s2>Vandœuvre-Lès Nancy 54 506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
<country>France</country>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
<wicri:noRegion>BP 239</wicri:noRegion>
<wicri:noRegion>Vandœuvre-Lès Nancy 54 506</wicri:noRegion>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">Cahiers d'études et de recherches francophones. Langues</title>
<idno type="ISSN">1291-1542</idno>
<imprint>
<date when="1998">1998</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">Cahiers d'études et de recherches francophones. Langues</title>
<idno type="ISSN">1291-1542</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Corpus annotation</term>
<term>Natural language processing</term>
<term>Proper Name</term>
<term>Reference</term>
<term>Standardization</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Traitement automatique des langues naturelles</term>
<term>Nom propre</term>
<term>Syntagme nominal</term>
<term>Référence</term>
<term>Annotation de corpus</term>
<term>Type de texte</term>
<term>Standardisation</term>
<term>Français</term>
<term>Codage</term>
<term>SGML</term>
<term>TEI</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr">
<term>Codage</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Parmi les avantages qu'offre la version informatisée d'une ressource linguistique, il y a, entre autres, la possibilité d'enrichir le document d'annotations spécifiques qui ne se limitent pas à un simple repérage de début/fin de sections ou de paragraphes. Dans cet article, nous aborderons plus précisément le problème du repérage et du codage des noms propres, syntagmes nominaux et expressions référentielles. Cependant, si l'annotation des noms propres peut être intéressante à des fins multiples (résumés automatiques, recherche dans des bases de données, etc.), on verra que dans les faits un tel travail suppose une bonne réflexion sur ce que l'on doit effectivement coder. C'est pourquoi, en nous appuyant sur les recommandations de la TEI (Text Encoding Initiative), nous faisons des propositions afin d'aller au-delà des possibilités actuelles et d'offrir ainsi un schéma qui permette d'affiner le codage en fonction du niveau d'analyse auquelle nom propre est appréhendé, distinguant entre nom propre élément d'un syntagme nominal ou d'une expression référentielle.</div>
</front>
</TEI>
<inist>
<standard h6="B">
<pA>
<fA01 i1="01" i2="2">
<s0>1291-1542</s0>
</fA01>
<fA05>
<s2>1</s2>
</fA05>
<fA06>
<s2>1</s2>
</fA06>
<fA08 i1="01" i2="1" l="FRE">
<s1>Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage</s1>
</fA08>
<fA11 i1="01" i2="1">
<s1>BRUNESEAUX (F.)</s1>
</fA11>
<fA14 i1="01">
<s1>Centre de recherche en informatique de Nancy (CRIN), Bâtiment LORIA, BP 239</s1>
<s2>Vandœuvre-Lès Nancy 54 506</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA20>
<s1>46-59</s1>
</fA20>
<fA21>
<s1>1998</s1>
</fA21>
<fA23 i1="01">
<s0>FRE</s0>
</fA23>
<fA24 i1="01">
<s0>eng</s0>
</fA24>
<fA43 i1="01">
<s1>INIST</s1>
<s2>26871</s2>
<s5>354000089993860050</s5>
</fA43>
<fA44>
<s0>0000</s0>
<s1>© 1999 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45>
<s0>27 ref.</s0>
</fA45>
<fA47 i1="01" i2="1">
<s0>524-99-13508</s0>
</fA47>
<fA60>
<s1>P</s1>
</fA60>
<fA61>
<s0>A</s0>
</fA61>
<fA64 i1="01" i2="2">
<s0>Cahiers d'études et de recherches francophones. Langues</s0>
</fA64>
<fA66 i1="01">
<s0>FRA</s0>
</fA66>
<fA68 i1="01" i2="1" l="ENG">
<s1>Proper names, nominal phrases referring strings : tagging and encoding</s1>
</fA68>
<fC01 i1="01" l="FRE">
<s0>Parmi les avantages qu'offre la version informatisée d'une ressource linguistique, il y a, entre autres, la possibilité d'enrichir le document d'annotations spécifiques qui ne se limitent pas à un simple repérage de début/fin de sections ou de paragraphes. Dans cet article, nous aborderons plus précisément le problème du repérage et du codage des noms propres, syntagmes nominaux et expressions référentielles. Cependant, si l'annotation des noms propres peut être intéressante à des fins multiples (résumés automatiques, recherche dans des bases de données, etc.), on verra que dans les faits un tel travail suppose une bonne réflexion sur ce que l'on doit effectivement coder. C'est pourquoi, en nous appuyant sur les recommandations de la TEI (Text Encoding Initiative), nous faisons des propositions afin d'aller au-delà des possibilités actuelles et d'offrir ainsi un schéma qui permette d'affiner le codage en fonction du niveau d'analyse auquelle nom propre est appréhendé, distinguant entre nom propre élément d'un syntagme nominal ou d'une expression référentielle.</s0>
</fC01>
<fC02 i1="01" i2="L">
<s0>52478</s0>
<s1>XV</s1>
</fC02>
<fC02 i1="02" i2="L">
<s0>524</s0>
</fC02>
<fC03 i1="01" i2="L" l="FRE">
<s0>Traitement automatique des langues naturelles</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="L" l="ENG">
<s0>Natural language processing</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="L" l="FRE">
<s0>Nom propre</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="L" l="ENG">
<s0>Proper Name</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="L" l="FRE">
<s0>Syntagme nominal</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="L" l="FRE">
<s0>Référence</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="L" l="ENG">
<s0>Reference</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="L" l="FRE">
<s0>Annotation de corpus</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="L" l="ENG">
<s0>Corpus annotation</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="L" l="FRE">
<s0>Type de texte</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="L" l="FRE">
<s0>Standardisation</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="L" l="ENG">
<s0>Standardization</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="L" l="FRE">
<s0>Français</s0>
<s2>NL</s2>
<s5>08</s5>
</fC03>
<fC03 i1="09" i2="L" l="FRE">
<s0>Codage</s0>
<s4>INC</s4>
<s5>31</s5>
</fC03>
<fC03 i1="10" i2="L" l="FRE">
<s0>SGML</s0>
<s4>INC</s4>
<s5>32</s5>
</fC03>
<fC03 i1="11" i2="L" l="FRE">
<s0>TEI</s0>
<s4>INC</s4>
<s5>33</s5>
</fC03>
<fN21>
<s1>355</s1>
</fN21>
</pA>
</standard>
</inist>
<affiliations>
<list>
<country>
<li>France</li>
</country>
</list>
<tree>
<country name="France">
<noRegion>
<name sortKey="Bruneseaux, F" sort="Bruneseaux, F" uniqKey="Bruneseaux F" first="F." last="Bruneseaux">F. Bruneseaux</name>
</noRegion>
</country>
</tree>
</affiliations>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Ticri/explor/TeiVM2/Data/PascalFrancis/Checkpoint
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000066 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Checkpoint/biblio.hfd -nk 000066 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Ticri
   |area=    TeiVM2
   |flux=    PascalFrancis
   |étape=   Checkpoint
   |type=    RBID
   |clé=     Francis:524-99-13508
   |texte=   Noms propres, syntagmes nominaux, expressions référentielles : repérage et codage
}}

Wicri

This area was generated with Dilib version V0.6.31.
Data generation: Mon Oct 30 21:59:18 2017. Site generation: Sun Feb 11 23:16:06 2024