Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Contribution à l'identification automatique du locuteur sur des critères acoustiques et phonétiques

Identifieur interne : 00D732 ( Main/Merge ); précédent : 00D731; suivant : 00D733

Contribution à l'identification automatique du locuteur sur des critères acoustiques et phonétiques

Auteurs : O. Mella

Source :

RBID : CRIN:mella93a

English descriptors

Abstract

Les recherches en reconnaissance automatique du locuteur peuvent être réparties en deux grandes classes, d'une part les recherches qui sont fondées sur les techniques de reconnaissance de formes issues de la reconnaissance automatique de la parole, et d'autre part, celles qui ont pour objectif d'exploiter explicitement la variabilité interlocuteur et la variabilité intralocuteur de la parole. Pour cela, ces dernières tentent d'extraire du signal de parole des paramètres acoustiques et phonétiques qui caractérisent au mieux le locuteur. Notre étude se situe dans cette seconde classe de travaux. Dans un premier temps, nous présentons les connaissances des domaines de la production de la parole et de la variabilité de la parole qui sont nécessaires à la compréhension de la problématique de la caractérisation du locuteur. Puis, nous plaçons notre travail dans le cadre plus général de la reconnaissance automatique du locuteur en présentant une synthèse des travaux les plus récents dans les deux classes de recherches définies au début de ce résumé. Ensuite, nous développons les différentes étapes de notre étude. Après une présentation des paramètres acoustiques et phonétiques sélectionnés comme susceptibles de caractériser au mieux le locuteur, nous décrivons les phases d'élaboration et d'étiquetage manuel de notre corpus, ce qui nous conduit à exposer notre vision de la problématique de l'étiquetage. Puis, nous détaillons l'étude de la pertinence des trois premiers formants de sept voyelles orales dans un contexte /p-voyelle-R/. Pour cela, nous exposons tout d'abord une méthodologie de détermination automatique de valeurs robustes des trois premiers formants des voyelles et nous commentons les résultats obtenus. Ensuite, nous présentons, pour chacun des triplets sélectionnés, l'analyse de la pertinence des combinaisons de formants et des écarts entre les formants pour l'identification du locuteur. Cette analyse est fondée sur l'établissement de trois indicateurs issus d'expériences d'identification d'un locuteur parmi dix. Enfin, nous terminons par une interprétation de ces résultats et leur comparaison avec les conclusions d'autres études comme celles qui concernent la normalisation des fréquences formantiques en reconnaissance automatique de la parole.

Links toward previous steps (curation, corpus...)


Links to Exploration step

CRIN:mella93a

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="fr" wicri:score="-20">Contribution à l'identification automatique du locuteur sur des critères acoustiques et phonétiques</title>
</titleStmt>
<publicationStmt>
<idno type="RBID">CRIN:mella93a</idno>
<date when="1993" year="1993">1993</date>
<idno type="wicri:Area/Crin/Corpus">001318</idno>
<idno type="wicri:Area/Crin/Curation">001318</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Curation">001318</idno>
<idno type="wicri:Area/Crin/Checkpoint">003260</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Checkpoint">003260</idno>
<idno type="wicri:Area/Main/Merge">00D732</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="fr">Contribution à l'identification automatique du locuteur sur des critères acoustiques et phonétiques</title>
<author>
<name sortKey="Mella, O" sort="Mella, O" uniqKey="Mella O" first="O." last="Mella">O. Mella</name>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>segmentation</term>
<term>speaker characterization</term>
<term>speaker identification</term>
<term>speaker recognition</term>
<term>speech recognition</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr" wicri:score="-5648">Les recherches en reconnaissance automatique du locuteur peuvent être réparties en deux grandes classes, d'une part les recherches qui sont fondées sur les techniques de reconnaissance de formes issues de la reconnaissance automatique de la parole, et d'autre part, celles qui ont pour objectif d'exploiter explicitement la variabilité interlocuteur et la variabilité intralocuteur de la parole. Pour cela, ces dernières tentent d'extraire du signal de parole des paramètres acoustiques et phonétiques qui caractérisent au mieux le locuteur. Notre étude se situe dans cette seconde classe de travaux. Dans un premier temps, nous présentons les connaissances des domaines de la production de la parole et de la variabilité de la parole qui sont nécessaires à la compréhension de la problématique de la caractérisation du locuteur. Puis, nous plaçons notre travail dans le cadre plus général de la reconnaissance automatique du locuteur en présentant une synthèse des travaux les plus récents dans les deux classes de recherches définies au début de ce résumé. Ensuite, nous développons les différentes étapes de notre étude. Après une présentation des paramètres acoustiques et phonétiques sélectionnés comme susceptibles de caractériser au mieux le locuteur, nous décrivons les phases d'élaboration et d'étiquetage manuel de notre corpus, ce qui nous conduit à exposer notre vision de la problématique de l'étiquetage. Puis, nous détaillons l'étude de la pertinence des trois premiers formants de sept voyelles orales dans un contexte /p-voyelle-R/. Pour cela, nous exposons tout d'abord une méthodologie de détermination automatique de valeurs robustes des trois premiers formants des voyelles et nous commentons les résultats obtenus. Ensuite, nous présentons, pour chacun des triplets sélectionnés, l'analyse de la pertinence des combinaisons de formants et des écarts entre les formants pour l'identification du locuteur. Cette analyse est fondée sur l'établissement de trois indicateurs issus d'expériences d'identification d'un locuteur parmi dix. Enfin, nous terminons par une interprétation de ces résultats et leur comparaison avec les conclusions d'autres études comme celles qui concernent la normalisation des fréquences formantiques en reconnaissance automatique de la parole.</div>
</front>
</TEI>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Merge
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 00D732 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Merge/biblio.hfd -nk 00D732 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Merge
   |type=    RBID
   |clé=     CRIN:mella93a
   |texte=   Contribution à l'identification automatique du locuteur sur des critères acoustiques et phonétiques
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022