Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Communication à l'aide de la parole dans des conditions difficiles

Identifieur interne : 00D919 ( Main/Merge ); précédent : 00D918; suivant : 00D920

Communication à l'aide de la parole dans des conditions difficiles

Auteurs : J.-C. Junqua

Source :

RBID : CRIN:junqua93a

Abstract

La parole permet une communication naturelle entre individus. Bien que cela semble simple pour le locuteur et l'auditeur, la production et la perception de la parole sont des mécanismes complexes qui comportent une suite de transformations à des niveaux différents (e.g. articulatoire, acoustique, linguistique, sémantique) dont le but est de coder et de présenter le signal pour le prochain niveau. Ces mécanismes sont très robustes aux conditions extérieures visant à agir à l'encontre de la communication. C'est essentiellement la redondance incluse dans le codage de la parole qui permet cette robustesse. A l'inverse, la reconnaissance et la compréhension automatique de la parole à l'aide de machines est limitée et fragile face à des perturbations aléatoires comme le bruit, l'émotion ou la fatigue. Pour améliorer la communication dans des conditions difficiles, nos recherches ont mis l'accent sur\, : \begin{itemize} \item[-]le développement d'outils pour représenter nos connaissances sur la parole par l'intermédiaire de composants réutilisables intégrés dans un environnement unique qui facilite la coopération entre plusieurs sources de connaissances. Ceci permet en particulier de faciliter le transfert de connaissances entre disciplines connexes afin de favoriser le développement d'algorithmes ``coopératifs'' qui permettent de palier aux insuffisances de la technologie actuelle. De tels outils permettent d'améliorer la synergie entre domaines de recherche et technologies différentes\, ; \item[-]l'étude de la variabilité de la parole produite dans du bruit et l'impact de cette variabilité et du bruit lui-même sur la reconnaissance. Pour cela, nous avons enregistré des bases de données spécifiques qui nous ont permis de mener à bien des études acoustiques, perceptuelles, et articulatoires sur l'effet Lombard. En effet, de nos jours la variabilité et les problèmes pris en compte sont souvent limités par les bases de données utilisées. C'est un élément essentiel qu'il est très important de développer davantage. Si l'on veut davantage utiliser la redondance du message transmis et développer des techniques permettant d'en tirer partie, il faut enregistrer des bases de données qui prennent en compte les problèmes réels\, ; \item[-]la réalisation de structure d'accueil pour la parole afin de palier aux problèmes de robustesse actuels des systèmes à composante vocale. Lorsqu'un utilisateur communique avec une application en vue de réaliser un certain nombre d'actions, nous pensons qu'il est important de prendre en compte un dialogue, même très limité, dans un environnement multimodal et de posséder un interface utilisateur naturel, facile à utiliser, qui gère convenablement les canaux de communication. \end{itemize} La variabilité de la voix produite (chuchotée, criée, produite avec émotion) ne perturbe que très peu notre compréhension du message émis. L'étude de telles conditions doit pouvoir nous permettre de mieux préciser les limites de la technologie actuelle tout en mettant l'accent sur les paramètres importants que nous utilisons.

Links toward previous steps (curation, corpus...)


Links to Exploration step

CRIN:junqua93a

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="en" wicri:score="207">Communication à l'aide de la parole dans des conditions difficiles</title>
</titleStmt>
<publicationStmt>
<idno type="RBID">CRIN:junqua93a</idno>
<date when="1993" year="1993">1993</date>
<idno type="wicri:Area/Crin/Corpus">001324</idno>
<idno type="wicri:Area/Crin/Curation">001324</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Curation">001324</idno>
<idno type="wicri:Area/Crin/Checkpoint">003447</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Checkpoint">003447</idno>
<idno type="wicri:Area/Main/Merge">00D919</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="en">Communication à l'aide de la parole dans des conditions difficiles</title>
<author>
<name sortKey="Junqua, J C" sort="Junqua, J C" uniqKey="Junqua J" first="J.-C." last="Junqua">J.-C. Junqua</name>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<textClass></textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr" wicri:score="-2869">La parole permet une communication naturelle entre individus. Bien que cela semble simple pour le locuteur et l'auditeur, la production et la perception de la parole sont des mécanismes complexes qui comportent une suite de transformations à des niveaux différents (e.g. articulatoire, acoustique, linguistique, sémantique) dont le but est de coder et de présenter le signal pour le prochain niveau. Ces mécanismes sont très robustes aux conditions extérieures visant à agir à l'encontre de la communication. C'est essentiellement la redondance incluse dans le codage de la parole qui permet cette robustesse. A l'inverse, la reconnaissance et la compréhension automatique de la parole à l'aide de machines est limitée et fragile face à des perturbations aléatoires comme le bruit, l'émotion ou la fatigue. Pour améliorer la communication dans des conditions difficiles, nos recherches ont mis l'accent sur\, : \begin{itemize} \item[-]le développement d'outils pour représenter nos connaissances sur la parole par l'intermédiaire de composants réutilisables intégrés dans un environnement unique qui facilite la coopération entre plusieurs sources de connaissances. Ceci permet en particulier de faciliter le transfert de connaissances entre disciplines connexes afin de favoriser le développement d'algorithmes ``coopératifs'' qui permettent de palier aux insuffisances de la technologie actuelle. De tels outils permettent d'améliorer la synergie entre domaines de recherche et technologies différentes\, ; \item[-]l'étude de la variabilité de la parole produite dans du bruit et l'impact de cette variabilité et du bruit lui-même sur la reconnaissance. Pour cela, nous avons enregistré des bases de données spécifiques qui nous ont permis de mener à bien des études acoustiques, perceptuelles, et articulatoires sur l'effet Lombard. En effet, de nos jours la variabilité et les problèmes pris en compte sont souvent limités par les bases de données utilisées. C'est un élément essentiel qu'il est très important de développer davantage. Si l'on veut davantage utiliser la redondance du message transmis et développer des techniques permettant d'en tirer partie, il faut enregistrer des bases de données qui prennent en compte les problèmes réels\, ; \item[-]la réalisation de structure d'accueil pour la parole afin de palier aux problèmes de robustesse actuels des systèmes à composante vocale. Lorsqu'un utilisateur communique avec une application en vue de réaliser un certain nombre d'actions, nous pensons qu'il est important de prendre en compte un dialogue, même très limité, dans un environnement multimodal et de posséder un interface utilisateur naturel, facile à utiliser, qui gère convenablement les canaux de communication. \end{itemize} La variabilité de la voix produite (chuchotée, criée, produite avec émotion) ne perturbe que très peu notre compréhension du message émis. L'étude de telles conditions doit pouvoir nous permettre de mieux préciser les limites de la technologie actuelle tout en mettant l'accent sur les paramètres importants que nous utilisons.</div>
</front>
</TEI>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Main/Merge
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 00D919 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Main/Merge/biblio.hfd -nk 00D919 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Main
   |étape=   Merge
   |type=    RBID
   |clé=     CRIN:junqua93a
   |texte=   Communication à l'aide de la parole dans des conditions difficiles
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022