Should recognizers have ears?
Identifieur interne :
000B70 ( PascalFrancis/Corpus );
précédent :
000B69;
suivant :
000B71
Should recognizers have ears?
Auteurs : H. HermanskySource :
-
Speech communication [ 0167-6393 ] ; 1998.
RBID : Pascal:99-0006607
Descripteurs français
English descriptors
Abstract
Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.
Notice en format standard (ISO 2709)
Pour connaître la documentation sur le format Inist Standard.
pA |
A01 | 01 | 1 | | @0 0167-6393 |
---|
A02 | 01 | | | @0 SCOMDH |
---|
A03 | | 1 | | @0 Speech commun. |
---|
A05 | | | | @2 25 |
---|
A06 | | | | @2 1-3 |
---|
A08 | 01 | 1 | ENG | @1 Should recognizers have ears? |
---|
A11 | 01 | 1 | | @1 HERMANSKY (H.) |
---|
A12 | 01 | 1 | | @1 JUNQUA (Jean-Claude) @9 ed. |
---|
A12 | 02 | 1 | | @1 HATON (Jean-Paul) @9 ed. |
---|
A14 | 01 | | | @1 Oregon Graduate Institute of Science & Technology @2 Portland, OR @3 USA @Z 1 aut. |
---|
A14 | 02 | | | @1 International Computer Science Institute @2 Berkeley, California @3 USA @Z 1 aut. |
---|
A14 | 03 | | | @1 Technical University @2 Brno @3 CZE @Z 1 aut. |
---|
A15 | 01 | | | @1 Speech Technology Laboratory @3 USA @Z 1 aut. |
---|
A15 | 02 | | | @1 CRIN @2 Nancy @3 FRA @Z 2 aut. |
---|
A18 | 01 | 1 | | @1 European Speech Communication Association @3 EUR @9 patr. |
---|
A18 | 02 | 1 | | @1 North Atlantic Treaty Organization. Research Study Group on Speech Processing @3 INC @9 patr. |
---|
A20 | | | | @1 3-27 |
---|
A21 | | | | @1 1998 |
---|
A23 | 01 | | | @0 ENG |
---|
A24 | 01 | | | @0 ger |
---|
A24 | 02 | | | @0 fre |
---|
A43 | 01 | | | @1 INIST @2 19642 @5 354000071027760010 |
---|
A44 | | | | @0 0000 @1 © 1999 INIST-CNRS. All rights reserved. |
---|
A45 | | | | @0 76 ref. |
---|
A47 | 01 | 1 | | @0 99-0006607 |
---|
A60 | | | | @1 P @2 C |
---|
A61 | | | | @0 A |
---|
A64 | | 1 | | @0 Speech communication |
---|
A66 | 01 | | | @0 NLD |
---|
C01 | 01 | | FRE | @0 Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie. |
---|
C02 | 01 | X | | @0 001D04A05B |
---|
C03 | 01 | X | FRE | @0 Traitement parole @5 01 |
---|
C03 | 01 | X | ENG | @0 Speech processing @5 01 |
---|
C03 | 01 | X | SPA | @0 Tratamiento palabra @5 01 |
---|
C03 | 02 | X | FRE | @0 Modulation fréquence @5 02 |
---|
C03 | 02 | X | ENG | @0 Frequency modulation @5 02 |
---|
C03 | 02 | X | SPA | @0 Modulación frecuencia @5 02 |
---|
C03 | 03 | X | FRE | @0 Reconnaissance parole @5 03 |
---|
C03 | 03 | X | ENG | @0 Speech recognition @5 03 |
---|
C03 | 03 | X | SPA | @0 Reconocimiento palabra @5 03 |
---|
C03 | 04 | X | FRE | @0 Reconnaissance automatique @5 04 |
---|
C03 | 04 | X | ENG | @0 Automatic recognition @5 04 |
---|
C03 | 04 | X | SPA | @0 Reconocimiento automático @5 04 |
---|
C03 | 05 | X | FRE | @0 Limite résolution @5 05 |
---|
C03 | 05 | X | ENG | @0 Resolving power @5 05 |
---|
C03 | 05 | X | GER | @0 Aufloesungsvermoegen @5 05 |
---|
C03 | 05 | X | SPA | @0 Poder resolución @5 05 |
---|
C03 | 06 | X | FRE | @0 Extraction information @5 06 |
---|
C03 | 06 | X | ENG | @0 Information extraction @5 06 |
---|
C03 | 06 | X | SPA | @0 Extractión información @5 06 |
---|
C03 | 07 | X | FRE | @0 Analyse stochastique @5 07 |
---|
C03 | 07 | X | ENG | @0 Stochastic analysis @5 07 |
---|
C03 | 07 | X | SPA | @0 Análisis estocástico @5 07 |
---|
C03 | 08 | X | FRE | @0 Modèle Markov @5 08 |
---|
C03 | 08 | X | ENG | @0 Markov model @5 08 |
---|
C03 | 08 | X | SPA | @0 Modelo Markov @5 08 |
---|
C03 | 09 | X | FRE | @0 Prédiction linéaire @5 09 |
---|
C03 | 09 | X | ENG | @0 Linear prediction @5 09 |
---|
C03 | 09 | X | SPA | @0 Predicción lineal @5 09 |
---|
C03 | 10 | X | FRE | @0 Filtre RASTA @4 CD @5 96 |
---|
C03 | 10 | X | ENG | @0 RASTA filter @4 CD @5 96 |
---|
N21 | | | | @1 004 |
---|
|
pR |
A30 | 01 | 1 | ENG | @1 Robust Speech Recognition for Unknown Communication Channels. Workshop @3 Pont-à-Mousson FRA @4 1997-04-17 |
---|
|
Format Inist (serveur)
NO : | PASCAL 99-0006607 INIST |
ET : | Should recognizers have ears? |
AU : | HERMANSKY (H.); JUNQUA (Jean-Claude); HATON (Jean-Paul) |
AF : | Oregon Graduate Institute of Science & Technology/Portland, OR/Etats-Unis (1 aut.); International Computer Science Institute/Berkeley, California/Etats-Unis (1 aut.); Technical University/Brno/Tchèque, République (1 aut.); Speech Technology Laboratory/Etats-Unis (1 aut.); CRIN/Nancy/France (2 aut.) |
DT : | Publication en série; Congrès; Niveau analytique |
SO : | Speech communication; ISSN 0167-6393; Coden SCOMDH; Pays-Bas; Da. 1998; Vol. 25; No. 1-3; Pp. 3-27; Abs. allemand/français; Bibl. 76 ref. |
LA : | Anglais |
FA : | Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie. |
CC : | 001D04A05B |
FD : | Traitement parole; Modulation fréquence; Reconnaissance parole; Reconnaissance automatique; Limite résolution; Extraction information; Analyse stochastique; Modèle Markov; Prédiction linéaire; Filtre RASTA |
ED : | Speech processing; Frequency modulation; Speech recognition; Automatic recognition; Resolving power; Information extraction; Stochastic analysis; Markov model; Linear prediction; RASTA filter |
GD : | Aufloesungsvermoegen |
SD : | Tratamiento palabra; Modulación frecuencia; Reconocimiento palabra; Reconocimiento automático; Poder resolución; Extractión información; Análisis estocástico; Modelo Markov; Predicción lineal |
LO : | INIST-19642.354000071027760010 |
ID : | 99-0006607 |
Links to Exploration step
Pascal:99-0006607
Le document en format XML
<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" level="a">Should recognizers have ears?</title>
<author><name sortKey="Hermansky, H" sort="Hermansky, H" uniqKey="Hermansky H" first="H." last="Hermansky">H. Hermansky</name>
<affiliation><inist:fA14 i1="01"><s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="02"><s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="03"><s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt><idno type="wicri:source">INIST</idno>
<idno type="inist">99-0006607</idno>
<date when="1998">1998</date>
<idno type="stanalyst">PASCAL 99-0006607 INIST</idno>
<idno type="RBID">Pascal:99-0006607</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000B70</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en" level="a">Should recognizers have ears?</title>
<author><name sortKey="Hermansky, H" sort="Hermansky, H" uniqKey="Hermansky H" first="H." last="Hermansky">H. Hermansky</name>
<affiliation><inist:fA14 i1="01"><s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="02"><s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation><inist:fA14 i1="03"><s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
<series><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
<imprint><date when="1998">1998</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt><title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
</seriesStmt>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>Automatic recognition</term>
<term>Frequency modulation</term>
<term>Information extraction</term>
<term>Linear prediction</term>
<term>Markov model</term>
<term>RASTA filter</term>
<term>Resolving power</term>
<term>Speech processing</term>
<term>Speech recognition</term>
<term>Stochastic analysis</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr"><term>Traitement parole</term>
<term>Modulation fréquence</term>
<term>Reconnaissance parole</term>
<term>Reconnaissance automatique</term>
<term>Limite résolution</term>
<term>Extraction information</term>
<term>Analyse stochastique</term>
<term>Modèle Markov</term>
<term>Prédiction linéaire</term>
<term>Filtre RASTA</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr">Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</div>
</front>
</TEI>
<inist><standard h6="B"><pA><fA01 i1="01" i2="1"><s0>0167-6393</s0>
</fA01>
<fA02 i1="01"><s0>SCOMDH</s0>
</fA02>
<fA03 i2="1"><s0>Speech commun.</s0>
</fA03>
<fA06><s2>1-3</s2>
</fA06>
<fA08 i1="01" i2="1" l="ENG"><s1>Should recognizers have ears?</s1>
</fA08>
<fA11 i1="01" i2="1"><s1>HERMANSKY (H.)</s1>
</fA11>
<fA12 i1="01" i2="1"><s1>JUNQUA (Jean-Claude)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1"><s1>HATON (Jean-Paul)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01"><s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA14 i1="02"><s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA14 i1="03"><s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA15 i1="01"><s1>Speech Technology Laboratory</s1>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA15>
<fA15 i1="02"><s1>CRIN</s1>
<s2>Nancy</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</fA15>
<fA18 i1="01" i2="1"><s1>European Speech Communication Association</s1>
<s3>EUR</s3>
<s9>patr.</s9>
</fA18>
<fA18 i1="02" i2="1"><s1>North Atlantic Treaty Organization. Research Study Group on Speech Processing</s1>
<s3>INC</s3>
<s9>patr.</s9>
</fA18>
<fA20><s1>3-27</s1>
</fA20>
<fA21><s1>1998</s1>
</fA21>
<fA23 i1="01"><s0>ENG</s0>
</fA23>
<fA24 i1="01"><s0>ger</s0>
</fA24>
<fA24 i1="02"><s0>fre</s0>
</fA24>
<fA43 i1="01"><s1>INIST</s1>
<s2>19642</s2>
<s5>354000071027760010</s5>
</fA43>
<fA44><s0>0000</s0>
<s1>© 1999 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45><s0>76 ref.</s0>
</fA45>
<fA47 i1="01" i2="1"><s0>99-0006607</s0>
</fA47>
<fA60><s1>P</s1>
<s2>C</s2>
</fA60>
<fA64 i2="1"><s0>Speech communication</s0>
</fA64>
<fA66 i1="01"><s0>NLD</s0>
</fA66>
<fC01 i1="01" l="FRE"><s0>Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</s0>
</fC01>
<fC02 i1="01" i2="X"><s0>001D04A05B</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE"><s0>Traitement parole</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG"><s0>Speech processing</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA"><s0>Tratamiento palabra</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE"><s0>Modulation fréquence</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG"><s0>Frequency modulation</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA"><s0>Modulación frecuencia</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE"><s0>Reconnaissance parole</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG"><s0>Speech recognition</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA"><s0>Reconocimiento palabra</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE"><s0>Reconnaissance automatique</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG"><s0>Automatic recognition</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA"><s0>Reconocimiento automático</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE"><s0>Limite résolution</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG"><s0>Resolving power</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="GER"><s0>Aufloesungsvermoegen</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA"><s0>Poder resolución</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE"><s0>Extraction information</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG"><s0>Information extraction</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA"><s0>Extractión información</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE"><s0>Analyse stochastique</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG"><s0>Stochastic analysis</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA"><s0>Análisis estocástico</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE"><s0>Modèle Markov</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="ENG"><s0>Markov model</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="SPA"><s0>Modelo Markov</s0>
<s5>08</s5>
</fC03>
<fC03 i1="09" i2="X" l="FRE"><s0>Prédiction linéaire</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="ENG"><s0>Linear prediction</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="SPA"><s0>Predicción lineal</s0>
<s5>09</s5>
</fC03>
<fC03 i1="10" i2="X" l="FRE"><s0>Filtre RASTA</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fC03 i1="10" i2="X" l="ENG"><s0>RASTA filter</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fN21><s1>004</s1>
</fN21>
</pA>
<pR><fA30 i1="01" i2="1" l="ENG"><s1>Robust Speech Recognition for Unknown Communication Channels. Workshop</s1>
<s3>Pont-à-Mousson FRA</s3>
<s4>1997-04-17</s4>
</fA30>
</pR>
</standard>
<server><NO>PASCAL 99-0006607 INIST</NO>
<ET>Should recognizers have ears?</ET>
<AU>HERMANSKY (H.); JUNQUA (Jean-Claude); HATON (Jean-Paul)</AU>
<AF>Oregon Graduate Institute of Science & Technology/Portland, OR/Etats-Unis (1 aut.); International Computer Science Institute/Berkeley, California/Etats-Unis (1 aut.); Technical University/Brno/Tchèque, République (1 aut.); Speech Technology Laboratory/Etats-Unis (1 aut.); CRIN/Nancy/France (2 aut.)</AF>
<DT>Publication en série; Congrès; Niveau analytique</DT>
<SO>Speech communication; ISSN 0167-6393; Coden SCOMDH; Pays-Bas; Da. 1998; Vol. 25; No. 1-3; Pp. 3-27; Abs. allemand/français; Bibl. 76 ref.</SO>
<LA>Anglais</LA>
<FA>Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</FA>
<CC>001D04A05B</CC>
<FD>Traitement parole; Modulation fréquence; Reconnaissance parole; Reconnaissance automatique; Limite résolution; Extraction information; Analyse stochastique; Modèle Markov; Prédiction linéaire; Filtre RASTA</FD>
<ED>Speech processing; Frequency modulation; Speech recognition; Automatic recognition; Resolving power; Information extraction; Stochastic analysis; Markov model; Linear prediction; RASTA filter</ED>
<GD>Aufloesungsvermoegen</GD>
<SD>Tratamiento palabra; Modulación frecuencia; Reconocimiento palabra; Reconocimiento automático; Poder resolución; Extractión información; Análisis estocástico; Modelo Markov; Predicción lineal</SD>
<LO>INIST-19642.354000071027760010</LO>
<ID>99-0006607</ID>
</server>
</inist>
</record>
Pour manipuler ce document sous Unix (Dilib)
EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000B70 | SxmlIndent | more
Ou
HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000B70 | SxmlIndent | more
Pour mettre un lien sur cette page dans le réseau Wicri
{{Explor lien
|wiki= Wicri/Lorraine
|area= InforLorV4
|flux= PascalFrancis
|étape= Corpus
|type= RBID
|clé= Pascal:99-0006607
|texte= Should recognizers have ears?
}}
| This area was generated with Dilib version V0.6.33. Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022 | ![](Common/icons/LogoDilib.gif) |