InforLorV4, PascalFrancis, Curation, bibRecord, 000B32

Speech recognition in noisy environments: a survey

Identifieur interne : 000B32 ( PascalFrancis/Curation ); précédent : 000B31; suivant : 000B33

Speech recognition in noisy environments: a survey

Auteurs : Y. Gong [France]

Source :

Speech communication [ 0167-6393 ] ; 1995.

RBID : Pascal:95-0244335

Descripteurs français

Pascal (Inist)
- Reconnaissance parole, Reconnaissance automatique, Traitement parole, Dégradation, Bruit, Rapport signal bruit, Parole bruitée.
Wicri :
- topic : Bruit.

English descriptors

KwdEn :
- Automatic recognition, Degradation, Noise, Signal to noise ratio, Speech processing, Speech recognition.

Abstract

Le bruit d'environnement dégrade de façon significative les performances de la plupart des systèmes actuels de reconnaissance automatique de la parole. Cette dégradation provient principalement des différences entre les environnements d'apprentissage et d'utilisation d'un système. Ces dernières années, de nombreux travaux ont porté sur la reduction de ces différences. Une synthèse des résultats de ces recherches est présentée dans cet article, selon trois grandes catégories: les paramétrages résistant au bruit et les mesures de similarité, le débruitage de la parole, et la compensation des modèles en présence de bruit. L'article met en évidence les points essentiels en reconnaissance de parole bruitée, à savoir l'utilisation des corrélations en temps et en fréquence du signal, l'augmentation de l'importance des portions du signal ayant un rapport S/B élevé lors de la décision, la prise en compte de connaissances spécifiques à la tâche sur le signal et sur le bruit, la mise en œuvre de traitements dépendant des classes d'événements de la parole, et enfin l'utilisation des modèles auditifs

A01	`01`	`1`		`@0 0167-6393`
A02	`01`			`@0 SCOMDH`
A03		`1`		`@0 Speech commun.`
A05				`@2 16`
A06				`@2 3`
A08	`01`	`1`	`ENG`	`@1 Speech recognition in noisy environments: a survey`
A11	`01`	`1`		`@1 GONG (Y.)`
A14	`01`			`@1 CNRS/CRIN/INRIA-Lorraine @2 Nancy @3 FRA`
A20				`@1 261-291`
A21				`@1 1995`
A23	`01`			`@0 ENG`
A24	`01`			`@0 ger`
A24	`02`			`@0 fre`
A43	`01`			`@1 INIST @2 19642 @5 354000056247300040`
A44				`@0 0000`
A45				`@0 8 p.1/2`
A47	`01`	`1`		`@0 95-0244335`
A60				`@1 P`
A61				`@0 A`
A64	`01`	`1`		`@0 Speech communication`
A66	`01`			`@0 NLD`
C01	`01`		`FRE`	@0 Le bruit d'environnement dégrade de façon significative les performances de la plupart des systèmes actuels de reconnaissance automatique de la parole. Cette dégradation provient principalement des différences entre les environnements d'apprentissage et d'utilisation d'un système. Ces dernières années, de nombreux travaux ont porté sur la reduction de ces différences. Une synthèse des résultats de ces recherches est présentée dans cet article, selon trois grandes catégories: les paramétrages résistant au bruit et les mesures de similarité, le débruitage de la parole, et la compensation des modèles en présence de bruit. L'article met en évidence les points essentiels en reconnaissance de parole bruitée, à savoir l'utilisation des corrélations en temps et en fréquence du signal, l'augmentation de l'importance des portions du signal ayant un rapport S/B élevé lors de la décision, la prise en compte de connaissances spécifiques à la tâche sur le signal et sur le bruit, la mise en œuvre de traitements dépendant des classes d'événements de la parole, et enfin l'utilisation des modèles auditifs
C02	`01`	`X`		`@0 001D04A05B`
C03	`01`	`X`	`FRE`	`@0 Reconnaissance parole @5 14`
C03	`01`	`X`	`ENG`	`@0 Speech recognition @5 14`
C03	`01`	`X`	`SPA`	`@0 Reconocimiento palabra @5 14`
C03	`02`	`X`	`FRE`	`@0 Reconnaissance automatique @5 15`
C03	`02`	`X`	`ENG`	`@0 Automatic recognition @5 15`
C03	`02`	`X`	`SPA`	`@0 Reconocimiento automático @5 15`
C03	`03`	`X`	`FRE`	`@0 Traitement parole @5 16`
C03	`03`	`X`	`ENG`	`@0 Speech processing @5 16`
C03	`03`	`X`	`SPA`	`@0 Tratamiento palabra @5 16`
C03	`04`	`X`	`FRE`	`@0 Dégradation @5 17`
C03	`04`	`X`	`ENG`	`@0 Degradation @5 17`
C03	`04`	`X`	`SPA`	`@0 Degradación @5 17`
C03	`05`	`X`	`FRE`	`@0 Bruit @5 18`
C03	`05`	`X`	`ENG`	`@0 Noise @5 18`
C03	`05`	`X`	`GER`	`@0 Geraeusch @5 18`
C03	`05`	`X`	`SPA`	`@0 Ruido @5 18`
C03	`06`	`X`	`FRE`	`@0 Rapport signal bruit @5 19`
C03	`06`	`X`	`ENG`	`@0 Signal to noise ratio @5 19`
C03	`06`	`X`	`GER`	`@0 Signal Rausch Verhaeltnis @5 19`
C03	`06`	`X`	`SPA`	`@0 Relación señal ruido @5 19`
C03	`07`	`X`	`FRE`	`@0 Parole bruitée @4 INC @5 72`
N21				`@1 142`

Links toward previous steps (curation, corpus...)

to stream PascalFrancis, to step Corpus: Pour aller vers cette notice dans l'étape Curation :000D62

Links to Exploration step

Pascal:95-0244335

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" level="a">Speech recognition in noisy environments: a survey</title>
<author><name sortKey="Gong, Y" sort="Gong, Y" uniqKey="Gong Y" first="Y." last="Gong">Y. Gong</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CNRS/CRIN/INRIA-Lorraine</s1>
<s2>Nancy</s2>
<s3>FRA</s3>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">95-0244335</idno>
<date when="1995">1995</date>
<idno type="stanalyst">PASCAL 95-0244335 INIST</idno>
<idno type="RBID">Pascal:95-0244335</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000D62</idno>
<idno type="wicri:Area/PascalFrancis/Curation">000B32</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en" level="a">Speech recognition in noisy environments: a survey</title>
<author><name sortKey="Gong, Y" sort="Gong, Y" uniqKey="Gong Y" first="Y." last="Gong">Y. Gong</name>
<affiliation wicri:level="1"><inist:fA14 i1="01"><s1>CNRS/CRIN/INRIA-Lorraine</s1>
<s2>Nancy</s2>
<s3>FRA</s3>
</inist:fA14>
<country>France</country>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
<imprint><date when="1995">1995</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Automatic recognition</term>
<term>Degradation</term>
<term>Noise</term>
<term>Signal to noise ratio</term>
<term>Speech processing</term>
<term>Speech recognition</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Reconnaissance parole</term>
<term>Reconnaissance automatique</term>
<term>Traitement parole</term>
<term>Dégradation</term>
<term>Bruit</term>
<term>Rapport signal bruit</term>
<term>Parole bruitée</term>
</keywords>
<keywords scheme="Wicri" type="topic" xml:lang="fr"><term>Bruit</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Le bruit d'environnement dégrade de façon significative les performances de la plupart des systèmes actuels de reconnaissance automatique de la parole. Cette dégradation provient principalement des différences entre les environnements d'apprentissage et d'utilisation d'un système. Ces dernières années, de nombreux travaux ont porté sur la reduction de ces différences. Une synthèse des résultats de ces recherches est présentée dans cet article, selon trois grandes catégories: les paramétrages résistant au bruit et les mesures de similarité, le débruitage de la parole, et la compensation des modèles en présence de bruit. L'article met en évidence les points essentiels en reconnaissance de parole bruitée, à savoir l'utilisation des corrélations en temps et en fréquence du signal, l'augmentation de l'importance des portions du signal ayant un rapport S/B élevé lors de la décision, la prise en compte de connaissances spécifiques à la tâche sur le signal et sur le bruit, la mise en œuvre de traitements dépendant des classes d'événements de la parole, et enfin l'utilisation des modèles auditifs</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA01 i1="01" i2="1"><s0>0167-6393</s0>
</fA01>
<fA02 i1="01"><s0>SCOMDH</s0>
</fA02>
<fA03 i2="1"><s0>Speech commun.</s0>
</fA03>
<fA05><s2>16</s2>
</fA05>
<fA06><s2>3</s2>
</fA06>
<fA08 i1="01" i2="1" l="ENG"><s1>Speech recognition in noisy environments: a survey</s1>
</fA08>
<fA11 i1="01" i2="1"><s1>GONG (Y.)</s1>
</fA11>
<fA14 i1="01"><s1>CNRS/CRIN/INRIA-Lorraine</s1>
<s2>Nancy</s2>
<s3>FRA</s3>
</fA14>
<fA20><s1>261-291</s1>
</fA20>
<fA21><s1>1995</s1>
</fA21>
<fA23 i1="01"><s0>ENG</s0>
</fA23>
<fA24 i1="01"><s0>ger</s0>
</fA24>
<fA24 i1="02"><s0>fre</s0>
</fA24>
<fA43 i1="01"><s1>INIST</s1>
<s2>19642</s2>
<s5>354000056247300040</s5>
</fA43>
<fA44><s0>0000</s0>
</fA44>
<fA45><s0>8 p.1/2</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>95-0244335</s0>
</fA47>
<fA60><s1>P</s1>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA64 i1="01" i2="1"><s0>Speech communication</s0>
</fA64>
<fA66 i1="01"><s0>NLD</s0>
</fA66>
<fC01 i1="01" l="FRE"><s0>Le bruit d'environnement dégrade de façon significative les performances de la plupart des systèmes actuels de reconnaissance automatique de la parole. Cette dégradation provient principalement des différences entre les environnements d'apprentissage et d'utilisation d'un système. Ces dernières années, de nombreux travaux ont porté sur la reduction de ces différences. Une synthèse des résultats de ces recherches est présentée dans cet article, selon trois grandes catégories: les paramétrages résistant au bruit et les mesures de similarité, le débruitage de la parole, et la compensation des modèles en présence de bruit. L'article met en évidence les points essentiels en reconnaissance de parole bruitée, à savoir l'utilisation des corrélations en temps et en fréquence du signal, l'augmentation de l'importance des portions du signal ayant un rapport S/B élevé lors de la décision, la prise en compte de connaissances spécifiques à la tâche sur le signal et sur le bruit, la mise en œuvre de traitements dépendant des classes d'événements de la parole, et enfin l'utilisation des modèles auditifs</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001D04A05B</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE"><s0>Reconnaissance parole</s0>
<s5>14</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG"><s0>Speech recognition</s0>
<s5>14</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA"><s0>Reconocimiento palabra</s0>
<s5>14</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Reconnaissance automatique</s0>
<s5>15</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Automatic recognition</s0>
<s5>15</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Reconocimiento automático</s0>
<s5>15</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Traitement parole</s0>
<s5>16</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Speech processing</s0>
<s5>16</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Tratamiento palabra</s0>
<s5>16</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Dégradation</s0>
<s5>17</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Degradation</s0>
<s5>17</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Degradación</s0>
<s5>17</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Bruit</s0>
<s5>18</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Noise</s0>
<s5>18</s5>
</fC03>
<fC03 i1="05" i2="X" l="GER"><s0>Geraeusch</s0>
<s5>18</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Ruido</s0>
<s5>18</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Rapport signal bruit</s0>
<s5>19</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Signal to noise ratio</s0>
<s5>19</s5>
</fC03>
<fC03 i1="06" i2="X" l="GER"><s0>Signal Rausch Verhaeltnis</s0>
<s5>19</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Relación señal ruido</s0>
<s5>19</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Parole bruitée</s0>
<s4>INC</s4>
<s5>72</s5>
</fC03>
<fN21><s1>142</s1>
</fN21>
</pA>
</standard>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Curation

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000B32 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Curation/biblio.hfd -nk 000B32 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Curation
   |type=    RBID
   |clé=     Pascal:95-0244335
   |texte=   Speech recognition in noisy environments: a survey
}}

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022

	Serveur d'exploration sur la recherche en informatique en Lorraine
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur la recherche en informatique en Lorraine

Speech recognition in noisy environments: a survey

Speech recognition in noisy environments: a survey

Source :

Descripteurs français

English descriptors

Abstract

Links toward previous steps (curation, corpus...)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri