InforLorV4, PascalFrancis, Corpus, bibRecord, 000B70

Should recognizers have ears?

Identifieur interne : 000B70 ( PascalFrancis/Corpus ); précédent : 000B69; suivant : 000B71

Should recognizers have ears?

Auteurs : H. Hermansky

Source :

Speech communication [ 0167-6393 ] ; 1998.

RBID : Pascal:99-0006607

Descripteurs français

Pascal (Inist)
- Traitement parole, Modulation fréquence, Reconnaissance parole, Reconnaissance automatique, Limite résolution, Extraction information, Analyse stochastique, Modèle Markov, Prédiction linéaire, Filtre RASTA.

English descriptors

KwdEn :
- Automatic recognition, Frequency modulation, Information extraction, Linear prediction, Markov model, RASTA filter, Resolving power, Speech processing, Speech recognition, Stochastic analysis.

Abstract

Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.

Notice en format standard (ISO 2709)

Pour connaître la documentation sur le format Inist Standard.

A01	`01`	`1`		`@0 0167-6393`
A02	`01`			`@0 SCOMDH`
A03		`1`		`@0 Speech commun.`
A05				`@2 25`
A06				`@2 1-3`
A08	`01`	`1`	`ENG`	`@1 Should recognizers have ears?`
A11	`01`	`1`		`@1 HERMANSKY (H.)`
A12	`01`	`1`		`@1 JUNQUA (Jean-Claude) @9 ed.`
A12	`02`	`1`		`@1 HATON (Jean-Paul) @9 ed.`
A14	`01`			`@1 Oregon Graduate Institute of Science & Technology @2 Portland, OR @3 USA @Z 1 aut.`
A14	`02`			`@1 International Computer Science Institute @2 Berkeley, California @3 USA @Z 1 aut.`
A14	`03`			`@1 Technical University @2 Brno @3 CZE @Z 1 aut.`
A15	`01`			`@1 Speech Technology Laboratory @3 USA @Z 1 aut.`
A15	`02`			`@1 CRIN @2 Nancy @3 FRA @Z 2 aut.`
A18	`01`	`1`		`@1 European Speech Communication Association @3 EUR @9 patr.`
A18	`02`	`1`		`@1 North Atlantic Treaty Organization. Research Study Group on Speech Processing @3 INC @9 patr.`
A20				`@1 3-27`
A21				`@1 1998`
A23	`01`			`@0 ENG`
A24	`01`			`@0 ger`
A24	`02`			`@0 fre`
A43	`01`			`@1 INIST @2 19642 @5 354000071027760010`
A44				`@0 0000 @1 © 1999 INIST-CNRS. All rights reserved.`
A45				`@0 76 ref.`
A47	`01`	`1`		`@0 99-0006607`
A60				`@1 P @2 C`
A61				`@0 A`
A64		`1`		`@0 Speech communication`
A66	`01`			`@0 NLD`
C01	`01`		`FRE`	@0 Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.
C02	`01`	`X`		`@0 001D04A05B`
C03	`01`	`X`	`FRE`	`@0 Traitement parole @5 01`
C03	`01`	`X`	`ENG`	`@0 Speech processing @5 01`
C03	`01`	`X`	`SPA`	`@0 Tratamiento palabra @5 01`
C03	`02`	`X`	`FRE`	`@0 Modulation fréquence @5 02`
C03	`02`	`X`	`ENG`	`@0 Frequency modulation @5 02`
C03	`02`	`X`	`SPA`	`@0 Modulación frecuencia @5 02`
C03	`03`	`X`	`FRE`	`@0 Reconnaissance parole @5 03`
C03	`03`	`X`	`ENG`	`@0 Speech recognition @5 03`
C03	`03`	`X`	`SPA`	`@0 Reconocimiento palabra @5 03`
C03	`04`	`X`	`FRE`	`@0 Reconnaissance automatique @5 04`
C03	`04`	`X`	`ENG`	`@0 Automatic recognition @5 04`
C03	`04`	`X`	`SPA`	`@0 Reconocimiento automático @5 04`
C03	`05`	`X`	`FRE`	`@0 Limite résolution @5 05`
C03	`05`	`X`	`ENG`	`@0 Resolving power @5 05`
C03	`05`	`X`	`GER`	`@0 Aufloesungsvermoegen @5 05`
C03	`05`	`X`	`SPA`	`@0 Poder resolución @5 05`
C03	`06`	`X`	`FRE`	`@0 Extraction information @5 06`
C03	`06`	`X`	`ENG`	`@0 Information extraction @5 06`
C03	`06`	`X`	`SPA`	`@0 Extractión información @5 06`
C03	`07`	`X`	`FRE`	`@0 Analyse stochastique @5 07`
C03	`07`	`X`	`ENG`	`@0 Stochastic analysis @5 07`
C03	`07`	`X`	`SPA`	`@0 Análisis estocástico @5 07`
C03	`08`	`X`	`FRE`	`@0 Modèle Markov @5 08`
C03	`08`	`X`	`ENG`	`@0 Markov model @5 08`
C03	`08`	`X`	`SPA`	`@0 Modelo Markov @5 08`
C03	`09`	`X`	`FRE`	`@0 Prédiction linéaire @5 09`
C03	`09`	`X`	`ENG`	`@0 Linear prediction @5 09`
C03	`09`	`X`	`SPA`	`@0 Predicción lineal @5 09`
C03	`10`	`X`	`FRE`	`@0 Filtre RASTA @4 CD @5 96`
C03	`10`	`X`	`ENG`	`@0 RASTA filter @4 CD @5 96`
N21				`@1 004`

A30	`01`	`1`	`ENG`	`@1 Robust Speech Recognition for Unknown Communication Channels. Workshop @3 Pont-à-Mousson FRA @4 1997-04-17`

Format Inist (serveur)

NO :	PASCAL 99-0006607 INIST
ET :	Should recognizers have ears?
AU :	HERMANSKY (H.); JUNQUA (Jean-Claude); HATON (Jean-Paul)
AF :	Oregon Graduate Institute of Science & Technology/Portland, OR/Etats-Unis (1 aut.); International Computer Science Institute/Berkeley, California/Etats-Unis (1 aut.); Technical University/Brno/Tchèque, République (1 aut.); Speech Technology Laboratory/Etats-Unis (1 aut.); CRIN/Nancy/France (2 aut.)
DT :	Publication en série; Congrès; Niveau analytique
SO :	Speech communication; ISSN 0167-6393; Coden SCOMDH; Pays-Bas; Da. 1998; Vol. 25; No. 1-3; Pp. 3-27; Abs. allemand/français; Bibl. 76 ref.
LA :	Anglais
FA :	Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.
CC :	001D04A05B
FD :	Traitement parole; Modulation fréquence; Reconnaissance parole; Reconnaissance automatique; Limite résolution; Extraction information; Analyse stochastique; Modèle Markov; Prédiction linéaire; Filtre RASTA
ED :	Speech processing; Frequency modulation; Speech recognition; Automatic recognition; Resolving power; Information extraction; Stochastic analysis; Markov model; Linear prediction; RASTA filter
GD :	Aufloesungsvermoegen
SD :	Tratamiento palabra; Modulación frecuencia; Reconocimiento palabra; Reconocimiento automático; Poder resolución; Extractión información; Análisis estocástico; Modelo Markov; Predicción lineal
LO :	INIST-19642.354000071027760010
ID :	99-0006607

Links to Exploration step

Pascal:99-0006607

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" level="a">Should recognizers have ears?</title>
<author><name sortKey="Hermansky, H" sort="Hermansky, H" uniqKey="Hermansky H" first="H." last="Hermansky">H. Hermansky</name>
<affiliation><inist:fA14 i1="01"><s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="02"><s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="03"><s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">99-0006607</idno>
<date when="1998">1998</date>
<idno type="stanalyst">PASCAL 99-0006607 INIST</idno>
<idno type="RBID">Pascal:99-0006607</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000B70</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en" level="a">Should recognizers have ears?</title>
<author><name sortKey="Hermansky, H" sort="Hermansky, H" uniqKey="Hermansky H" first="H." last="Hermansky">H. Hermansky</name>
<affiliation><inist:fA14 i1="01"><s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="02"><s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="03"><s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
<imprint><date when="1998">1998</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Automatic recognition</term>
<term>Frequency modulation</term>
<term>Information extraction</term>
<term>Linear prediction</term>
<term>Markov model</term>
<term>RASTA filter</term>
<term>Resolving power</term>
<term>Speech processing</term>
<term>Speech recognition</term>
<term>Stochastic analysis</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Traitement parole</term>
<term>Modulation fréquence</term>
<term>Reconnaissance parole</term>
<term>Reconnaissance automatique</term>
<term>Limite résolution</term>
<term>Extraction information</term>
<term>Analyse stochastique</term>
<term>Modèle Markov</term>
<term>Prédiction linéaire</term>
<term>Filtre RASTA</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA01 i1="01" i2="1"><s0>0167-6393</s0>
</fA01>
<fA02 i1="01"><s0>SCOMDH</s0>
</fA02>
<fA03 i2="1"><s0>Speech commun.</s0>
</fA03>
<fA05><s2>25</s2>
</fA05>
<fA06><s2>1-3</s2>
</fA06>
<fA08 i1="01" i2="1" l="ENG"><s1>Should recognizers have ears?</s1>
</fA08>
<fA11 i1="01" i2="1"><s1>HERMANSKY (H.)</s1>
</fA11>
<fA12 i1="01" i2="1"><s1>JUNQUA (Jean-Claude)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1"><s1>HATON (Jean-Paul)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01"><s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA14 i1="02"><s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA14 i1="03"><s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA15 i1="01"><s1>Speech Technology Laboratory</s1>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA15>
<fA15 i1="02"><s1>CRIN</s1>
<s2>Nancy</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</fA15>
<fA18 i1="01" i2="1"><s1>European Speech Communication Association</s1>
<s3>EUR</s3>
<s9>patr.</s9>
</fA18>
<fA18 i1="02" i2="1"><s1>North Atlantic Treaty Organization. Research Study Group on Speech Processing</s1>
<s3>INC</s3>
<s9>patr.</s9>
</fA18>
<fA20><s1>3-27</s1>
</fA20>
<fA21><s1>1998</s1>
</fA21>
<fA23 i1="01"><s0>ENG</s0>
</fA23>
<fA24 i1="01"><s0>ger</s0>
</fA24>
<fA24 i1="02"><s0>fre</s0>
</fA24>
<fA43 i1="01"><s1>INIST</s1>
<s2>19642</s2>
<s5>354000071027760010</s5>
</fA43>
<fA44><s0>0000</s0>
<s1>© 1999 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45><s0>76 ref.</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>99-0006607</s0>
</fA47>
<fA60><s1>P</s1>
<s2>C</s2>
</fA60>
<fA61><s0>A</s0>
</fA61>
<fA64 i2="1"><s0>Speech communication</s0>
</fA64>
<fA66 i1="01"><s0>NLD</s0>
</fA66>
<fC01 i1="01" l="FRE"><s0>Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001D04A05B</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE"><s0>Traitement parole</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG"><s0>Speech processing</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA"><s0>Tratamiento palabra</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Modulation fréquence</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Frequency modulation</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Modulación frecuencia</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Reconnaissance parole</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Speech recognition</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Reconocimiento palabra</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Reconnaissance automatique</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Automatic recognition</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Reconocimiento automático</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Limite résolution</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Resolving power</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="GER"><s0>Aufloesungsvermoegen</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Poder resolución</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Extraction information</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Information extraction</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Extractión información</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Analyse stochastique</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>Stochastic analysis</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Análisis estocástico</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE"><s0>Modèle Markov</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="ENG"><s0>Markov model</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="SPA"><s0>Modelo Markov</s0>
<s5>08</s5>
</fC03>
<fC03 i1="09" i2="X" l="FRE"><s0>Prédiction linéaire</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="ENG"><s0>Linear prediction</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="SPA"><s0>Predicción lineal</s0>
<s5>09</s5>
</fC03>
<fC03 i1="10" i2="X" l="FRE"><s0>Filtre RASTA</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fC03 i1="10" i2="X" l="ENG"><s0>RASTA filter</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fN21><s1>004</s1>
</fN21>
</pA>
<pR><fA30 i1="01" i2="1" l="ENG"><s1>Robust Speech Recognition for Unknown Communication Channels. Workshop</s1>
<s3>Pont-à-Mousson FRA</s3>
<s4>1997-04-17</s4>
</fA30>
</pR>
</standard>
<server><NO>PASCAL 99-0006607 INIST</NO>
<ET>Should recognizers have ears?</ET>
<AU>HERMANSKY (H.); JUNQUA (Jean-Claude); HATON (Jean-Paul)</AU>
<AF>Oregon Graduate Institute of Science & Technology/Portland, OR/Etats-Unis (1 aut.); International Computer Science Institute/Berkeley, California/Etats-Unis (1 aut.); Technical University/Brno/Tchèque, République (1 aut.); Speech Technology Laboratory/Etats-Unis (1 aut.); CRIN/Nancy/France (2 aut.)</AF>
<DT>Publication en série; Congrès; Niveau analytique</DT>
<SO>Speech communication; ISSN 0167-6393; Coden SCOMDH; Pays-Bas; Da. 1998; Vol. 25; No. 1-3; Pp. 3-27; Abs. allemand/français; Bibl. 76 ref.</SO>
<LA>Anglais</LA>
<FA>Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</FA>
<CC>001D04A05B</CC>
<FD>Traitement parole; Modulation fréquence; Reconnaissance parole; Reconnaissance automatique; Limite résolution; Extraction information; Analyse stochastique; Modèle Markov; Prédiction linéaire; Filtre RASTA</FD>
<ED>Speech processing; Frequency modulation; Speech recognition; Automatic recognition; Resolving power; Information extraction; Stochastic analysis; Markov model; Linear prediction; RASTA filter</ED>
<GD>Aufloesungsvermoegen</GD>
<SD>Tratamiento palabra; Modulación frecuencia; Reconocimiento palabra; Reconocimiento automático; Poder resolución; Extractión información; Análisis estocástico; Modelo Markov; Predicción lineal</SD>
<LO>INIST-19642.354000071027760010</LO>
<ID>99-0006607</ID>
</server>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Corpus

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000B70 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000B70 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Corpus
   |type=    RBID
   |clé=     Pascal:99-0006607
   |texte=   Should recognizers have ears?
}}

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022

	Serveur d'exploration sur la recherche en informatique en Lorraine
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur la recherche en informatique en Lorraine

Should recognizers have ears?

Should recognizers have ears?

Source :

Descripteurs français

English descriptors

Abstract

Notice en format standard (ISO 2709)

Format Inist (serveur)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri