InforLorV4, PascalFrancis, Curation, bibRecord, 000B56

Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models

Identifieur interne : 000B56 ( PascalFrancis/Curation ); précédent : 000B55; suivant : 000B57

Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models

Auteurs : O. Siohan [France] ; Y. Gong [France] ; J. P. Haton [France]

Source :

Speech communication [ 0167-6393 ] ; 1996.

RBID : Pascal:96-0387881

Descripteurs français

Pascal (Inist)
- Etude comparative, Traitement parole, Reconnaissance parole, Modèle stochastique, Régression linéaire, Filtrage, Réduction bruit.

English descriptors

KwdEn :
- Comparative study, Filtering, Linear regression, Noise reduction, Speech processing, Speech recognition, Stochastic model.

Abstract

Résumé Cet article présente différentes approches pour la reconnaissance de parole en présence de bruit, intégrées à une Modelisation Stochastique des Trajectoires de parole (STM). Nous decrivons 4 méthodes: adaptation des modèles acoustiques par régression linéaire, transformation de l"espace acoustique de référence, combinaison de modèles stochastiques de parole et bruit, filtrage par état du signal bruité. L"évaluation des différentes approches est effectuée en mode dépendant du locuteur, sur une application de reconnaissance de parole continue comportant un vocabulaire de 1011 mots avec une grammaire de perplexite 28 (paire de mots). Les modèles acoustiques sont des modèles de phones indépendants du contexte, et leur apprentissage est effectué indépendamment de la tâche. Les différentes approches sont évaluées sous des conditions de bruit additifs variées, comprenant différents types de bruit et différents rapports signal-à-bruit. Les expériences montrent que l"adaptation des modèles par régression linéaire conduit aux meilleurs résultats, pour tous les types de bruits testés, et pour des rapports signal-à-bruit modérés (de 6 à 24 dB). En presence d"un bruit Gaussien, pour un rapport signal-à-bruit variant de 6 à 24 dB, l"adaptation par régression linéaire réduit le taux d"erreur de mots de 20% à 59% par rapport aux autres approches. zen, beobachtet werden.

A01	`01`	`1`		`@0 0167-6393`
A02	`01`			`@0 SCOMDH`
A03		`1`		`@0 Speech commun.`
A05				`@2 18`
A06				`@2 4`
A08	`01`	`1`	`ENG`	`@1 Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models`
A11	`01`	`1`		`@1 SIOHAN (O.)`
A11	`02`	`1`		`@1 GONG (Y.)`
A11	`03`	`1`		`@1 HATON (J. P.)`
A14	`01`			`@1 CRIN - CNRS & INRIA Lorraine, BP 239 @2 54506 Vandœuvre-lès-Nancy @3 FRA @Z 1 aut. @Z 2 aut. @Z 3 aut.`
A20				`@1 335-352`
A21				`@1 1996`
A23	`01`			`@0 ENG`
A24	`01`			`@0 eng`
A43	`01`			`@1 INIST @2 19642 @5 354000063850420004`
A44				`@0 9000 @1 © 1996 Elsevier Science B.V. All rights reserved.`
A47	`01`	`1`		`@0 96-0387881`
A60				`@1 P`
A61				`@0 A`
A64	`01`	`1`		`@0 Speech communication`
A66	`01`			`@0 NLD`
C01	`01`		`FRE`	@0 Résumé Cet article présente différentes approches pour la reconnaissance de parole en présence de bruit, intégrées à une Modelisation Stochastique des Trajectoires de parole (STM). Nous decrivons 4 méthodes: adaptation des modèles acoustiques par régression linéaire, transformation de l"espace acoustique de référence, combinaison de modèles stochastiques de parole et bruit, filtrage par état du signal bruité. L"évaluation des différentes approches est effectuée en mode dépendant du locuteur, sur une application de reconnaissance de parole continue comportant un vocabulaire de 1011 mots avec une grammaire de perplexite 28 (paire de mots). Les modèles acoustiques sont des modèles de phones indépendants du contexte, et leur apprentissage est effectué indépendamment de la tâche. Les différentes approches sont évaluées sous des conditions de bruit additifs variées, comprenant différents types de bruit et différents rapports signal-à-bruit. Les expériences montrent que l"adaptation des modèles par régression linéaire conduit aux meilleurs résultats, pour tous les types de bruits testés, et pour des rapports signal-à-bruit modérés (de 6 à 24 dB). En presence d"un bruit Gaussien, pour un rapport signal-à-bruit variant de 6 à 24 dB, l"adaptation par régression linéaire réduit le taux d"erreur de mots de 20% à 59% par rapport aux autres approches. zen, beobachtet werden.
C02	`01`	`X`		`@0 001D04A05B`
C03	`01`	`X`	`FRE`	`@0 Etude comparative @5 01`
C03	`01`	`X`	`ENG`	`@0 Comparative study @5 01`
C03	`01`	`X`	`GER`	`@0 Vergleich @5 01`
C03	`01`	`X`	`SPA`	`@0 Estudio comparativo @5 01`
C03	`02`	`X`	`FRE`	`@0 Traitement parole @5 02`
C03	`02`	`X`	`ENG`	`@0 Speech processing @5 02`
C03	`02`	`X`	`SPA`	`@0 Tratamiento palabra @5 02`
C03	`03`	`X`	`FRE`	`@0 Reconnaissance parole @5 03`
C03	`03`	`X`	`ENG`	`@0 Speech recognition @5 03`
C03	`03`	`X`	`SPA`	`@0 Reconocimiento palabra @5 03`
C03	`04`	`X`	`FRE`	`@0 Modèle stochastique @5 04`
C03	`04`	`X`	`ENG`	`@0 Stochastic model @5 04`
C03	`04`	`X`	`SPA`	`@0 Modelo estocástico @5 04`
C03	`05`	`X`	`FRE`	`@0 Régression linéaire @5 05`
C03	`05`	`X`	`ENG`	`@0 Linear regression @5 05`
C03	`05`	`X`	`SPA`	`@0 Regresión lineal @5 05`
C03	`06`	`X`	`FRE`	`@0 Filtrage @5 06`
C03	`06`	`X`	`ENG`	`@0 Filtering @5 06`
C03	`06`	`X`	`SPA`	`@0 Filtrado @5 06`
C03	`07`	`X`	`FRE`	`@0 Réduction bruit @5 07`
C03	`07`	`X`	`ENG`	`@0 Noise reduction @5 07`
C03	`07`	`X`	`SPA`	`@0 Reducción ruido @5 07`
N21				`@1 267`

Links toward previous steps (curation, corpus...)

to stream PascalFrancis, to step Corpus: Pour aller vers cette notice dans l'étape Curation :000D35

Links to Exploration step

Pascal:96-0387881

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" level="a">Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models</title>
<author><name sortKey="Siohan, O" sort="Siohan, O" uniqKey="Siohan O" first="O." last="Siohan">O. Siohan</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CRIN - CNRS & INRIA Lorraine, BP 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
<author><name sortKey="Gong, Y" sort="Gong, Y" uniqKey="Gong Y" first="Y." last="Gong">Y. Gong</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CRIN - CNRS & INRIA Lorraine, BP 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
<author><name sortKey="Haton, J P" sort="Haton, J P" uniqKey="Haton J" first="J. P." last="Haton">J. P. Haton</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CRIN - CNRS & INRIA Lorraine, BP 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">96-0387881</idno>
<date when="1996">1996</date>
<idno type="stanalyst">PASCAL 96-0387881 Elsevier</idno>
<idno type="RBID">Pascal:96-0387881</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000D35</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000B56</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en" level="a">Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models</title>
<author><name sortKey="Siohan, O" sort="Siohan, O" uniqKey="Siohan O" first="O." last="Siohan">O. Siohan</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CRIN - CNRS & INRIA Lorraine, BP 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
<author><name sortKey="Gong, Y" sort="Gong, Y" uniqKey="Gong Y" first="Y." last="Gong">Y. Gong</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CRIN - CNRS & INRIA Lorraine, BP 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
<author><name sortKey="Haton, J P" sort="Haton, J P" uniqKey="Haton J" first="J. P." last="Haton">J. P. Haton</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CRIN - CNRS & INRIA Lorraine, BP 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
<imprint><date when="1996">1996</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Comparative study</term>
<term>Filtering</term>
<term>Linear regression</term>
<term>Noise reduction</term>
<term>Speech processing</term>
<term>Speech recognition</term>
<term>Stochastic model</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Etude comparative</term>
<term>Traitement parole</term>
<term>Reconnaissance parole</term>
<term>Modèle stochastique</term>
<term>Régression linéaire</term>
<term>Filtrage</term>
<term>Réduction bruit</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Résumé  Cet article présente différentes approches pour la reconnaissance de parole en présence de bruit, intégrées à une Modelisation Stochastique des Trajectoires de parole (STM). Nous decrivons 4 méthodes: adaptation des modèles acoustiques par régression linéaire, transformation de l"espace acoustique de référence, combinaison de modèles stochastiques de parole et bruit, filtrage par état du signal bruité. L"évaluation des différentes approches est effectuée en mode dépendant du locuteur, sur une application de reconnaissance de parole continue comportant un vocabulaire de 1011 mots avec une grammaire de perplexite 28 (paire de mots). Les modèles acoustiques sont des modèles de phones indépendants du contexte, et leur apprentissage est effectué indépendamment de la tâche. Les différentes approches sont évaluées sous des conditions de bruit additifs variées, comprenant différents types de bruit et différents rapports signal-à-bruit. Les expériences montrent que l"adaptation des modèles par régression linéaire conduit aux meilleurs résultats, pour tous les types de bruits testés, et pour des rapports signal-à-bruit modérés (de 6 à 24 dB). En presence d"un bruit Gaussien, pour un rapport signal-à-bruit variant de 6 à 24 dB, l"adaptation par régression linéaire réduit le taux d"erreur de mots de 20% à 59% par rapport aux autres approches.                                        zen, beobachtet werden.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA01 i1="01" i2="1"><s0>0167-6393</s0>
</fA01>
<fA02 i1="01"><s0>SCOMDH</s0>
</fA02>
<fA03 i2="1"><s0>Speech commun.</s0>
</fA03>
<fA05><s2>18</s2>
</fA05>
<fA06><s2>4</s2>
</fA06>
<fA08 i1="01" i2="1" l="ENG"><s1>Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models</s1>
</fA08>
<fA11 i1="01" i2="1"><s1>SIOHAN (O.)</s1>
</fA11>
<fA11 i1="02" i2="1"><s1>GONG (Y.)</s1>
</fA11>
<fA11 i1="03" i2="1"><s1>HATON (J. P.)</s1>
</fA11>
<fA14 i1="01"><s1>CRIN - CNRS & INRIA Lorraine, BP 239</s1>
<s2>54506 Vandœuvre-lès-Nancy</s2>
<s3>FRA</s3>
<sZ>1 aut.</sZ>
<sZ>2 aut.</sZ>
<sZ>3 aut.</sZ>
</fA14>
<fA20><s1>335-352</s1>
</fA20>
<fA21><s1>1996</s1>
</fA21>
<fA23 i1="01"><s0>ENG</s0>
</fA23>
<fA24 i1="01"><s0>eng</s0>
</fA24>
<fA43 i1="01"><s1>INIST</s1>
<s2>19642</s2>
<s5>354000063850420004</s5>
</fA43>
<fA44><s0>9000</s0>
<s1>© 1996 Elsevier Science B.V. All rights reserved.</s1>
</fA44>
<fA47 i1="01" i2="1"><s0>96-0387881</s0>
</fA47>
<fA60><s1>P</s1>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA64 i1="01" i2="1"><s0>Speech communication</s0>
</fA64>
<fA66 i1="01"><s0>NLD</s0>
</fA66>
<fC01 i1="01" l="FRE"><s0>Résumé  Cet article présente différentes approches pour la reconnaissance de parole en présence de bruit, intégrées à une Modelisation Stochastique des Trajectoires de parole (STM). Nous decrivons 4 méthodes: adaptation des modèles acoustiques par régression linéaire, transformation de l"espace acoustique de référence, combinaison de modèles stochastiques de parole et bruit, filtrage par état du signal bruité. L"évaluation des différentes approches est effectuée en mode dépendant du locuteur, sur une application de reconnaissance de parole continue comportant un vocabulaire de 1011 mots avec une grammaire de perplexite 28 (paire de mots). Les modèles acoustiques sont des modèles de phones indépendants du contexte, et leur apprentissage est effectué indépendamment de la tâche. Les différentes approches sont évaluées sous des conditions de bruit additifs variées, comprenant différents types de bruit et différents rapports signal-à-bruit. Les expériences montrent que l"adaptation des modèles par régression linéaire conduit aux meilleurs résultats, pour tous les types de bruits testés, et pour des rapports signal-à-bruit modérés (de 6 à 24 dB). En presence d"un bruit Gaussien, pour un rapport signal-à-bruit variant de 6 à 24 dB, l"adaptation par régression linéaire réduit le taux d"erreur de mots de 20% à 59% par rapport aux autres approches.                                        zen, beobachtet werden.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001D04A05B</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE"><s0>Etude comparative</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG"><s0>Comparative study</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="GER"><s0>Vergleich</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA"><s0>Estudio comparativo</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Traitement parole</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Speech processing</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Tratamiento palabra</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Reconnaissance parole</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Speech recognition</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Reconocimiento palabra</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Modèle stochastique</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Stochastic model</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Modelo estocástico</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Régression linéaire</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Linear regression</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Regresión lineal</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Filtrage</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Filtering</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Filtrado</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Réduction bruit</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>Noise reduction</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Reducción ruido</s0>
<s5>07</s5>
</fC03>
<fN21><s1>267</s1>
</fN21>
</pA>
</standard>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Curation

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000B56 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Curation/biblio.hfd -nk 000B56 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Curation
   |type=    RBID
   |clé=     Pascal:96-0387881
   |texte=   Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models
}}

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022

	Serveur d'exploration sur la recherche en informatique en Lorraine
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur la recherche en informatique en Lorraine

Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models

Comparative experiments of several adaptation approaches to noisy speech recognition using stochastic trajectory models

Source :

Descripteurs français

English descriptors

Abstract

Links toward previous steps (curation, corpus...)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri