Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Should recognizers have ears?

Identifieur interne : 000B70 ( PascalFrancis/Corpus ); précédent : 000B69; suivant : 000B71

Should recognizers have ears?

Auteurs : H. Hermansky

Source :

RBID : Pascal:99-0006607

Descripteurs français

English descriptors

Abstract

Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.

Notice en format standard (ISO 2709)

Pour connaître la documentation sur le format Inist Standard.

pA  
A01 01  1    @0 0167-6393
A02 01      @0 SCOMDH
A03   1    @0 Speech commun.
A05       @2 25
A06       @2 1-3
A08 01  1  ENG  @1 Should recognizers have ears?
A11 01  1    @1 HERMANSKY (H.)
A12 01  1    @1 JUNQUA (Jean-Claude) @9 ed.
A12 02  1    @1 HATON (Jean-Paul) @9 ed.
A14 01      @1 Oregon Graduate Institute of Science & Technology @2 Portland, OR @3 USA @Z 1 aut.
A14 02      @1 International Computer Science Institute @2 Berkeley, California @3 USA @Z 1 aut.
A14 03      @1 Technical University @2 Brno @3 CZE @Z 1 aut.
A15 01      @1 Speech Technology Laboratory @3 USA @Z 1 aut.
A15 02      @1 CRIN @2 Nancy @3 FRA @Z 2 aut.
A18 01  1    @1 European Speech Communication Association @3 EUR @9 patr.
A18 02  1    @1 North Atlantic Treaty Organization. Research Study Group on Speech Processing @3 INC @9 patr.
A20       @1 3-27
A21       @1 1998
A23 01      @0 ENG
A24 01      @0 ger
A24 02      @0 fre
A43 01      @1 INIST @2 19642 @5 354000071027760010
A44       @0 0000 @1 © 1999 INIST-CNRS. All rights reserved.
A45       @0 76 ref.
A47 01  1    @0 99-0006607
A60       @1 P @2 C
A61       @0 A
A64   1    @0 Speech communication
A66 01      @0 NLD
C01 01    FRE  @0 Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.
C02 01  X    @0 001D04A05B
C03 01  X  FRE  @0 Traitement parole @5 01
C03 01  X  ENG  @0 Speech processing @5 01
C03 01  X  SPA  @0 Tratamiento palabra @5 01
C03 02  X  FRE  @0 Modulation fréquence @5 02
C03 02  X  ENG  @0 Frequency modulation @5 02
C03 02  X  SPA  @0 Modulación frecuencia @5 02
C03 03  X  FRE  @0 Reconnaissance parole @5 03
C03 03  X  ENG  @0 Speech recognition @5 03
C03 03  X  SPA  @0 Reconocimiento palabra @5 03
C03 04  X  FRE  @0 Reconnaissance automatique @5 04
C03 04  X  ENG  @0 Automatic recognition @5 04
C03 04  X  SPA  @0 Reconocimiento automático @5 04
C03 05  X  FRE  @0 Limite résolution @5 05
C03 05  X  ENG  @0 Resolving power @5 05
C03 05  X  GER  @0 Aufloesungsvermoegen @5 05
C03 05  X  SPA  @0 Poder resolución @5 05
C03 06  X  FRE  @0 Extraction information @5 06
C03 06  X  ENG  @0 Information extraction @5 06
C03 06  X  SPA  @0 Extractión información @5 06
C03 07  X  FRE  @0 Analyse stochastique @5 07
C03 07  X  ENG  @0 Stochastic analysis @5 07
C03 07  X  SPA  @0 Análisis estocástico @5 07
C03 08  X  FRE  @0 Modèle Markov @5 08
C03 08  X  ENG  @0 Markov model @5 08
C03 08  X  SPA  @0 Modelo Markov @5 08
C03 09  X  FRE  @0 Prédiction linéaire @5 09
C03 09  X  ENG  @0 Linear prediction @5 09
C03 09  X  SPA  @0 Predicción lineal @5 09
C03 10  X  FRE  @0 Filtre RASTA @4 CD @5 96
C03 10  X  ENG  @0 RASTA filter @4 CD @5 96
N21       @1 004
pR  
A30 01  1  ENG  @1 Robust Speech Recognition for Unknown Communication Channels. Workshop @3 Pont-à-Mousson FRA @4 1997-04-17

Format Inist (serveur)

NO : PASCAL 99-0006607 INIST
ET : Should recognizers have ears?
AU : HERMANSKY (H.); JUNQUA (Jean-Claude); HATON (Jean-Paul)
AF : Oregon Graduate Institute of Science & Technology/Portland, OR/Etats-Unis (1 aut.); International Computer Science Institute/Berkeley, California/Etats-Unis (1 aut.); Technical University/Brno/Tchèque, République (1 aut.); Speech Technology Laboratory/Etats-Unis (1 aut.); CRIN/Nancy/France (2 aut.)
DT : Publication en série; Congrès; Niveau analytique
SO : Speech communication; ISSN 0167-6393; Coden SCOMDH; Pays-Bas; Da. 1998; Vol. 25; No. 1-3; Pp. 3-27; Abs. allemand/français; Bibl. 76 ref.
LA : Anglais
FA : Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.
CC : 001D04A05B
FD : Traitement parole; Modulation fréquence; Reconnaissance parole; Reconnaissance automatique; Limite résolution; Extraction information; Analyse stochastique; Modèle Markov; Prédiction linéaire; Filtre RASTA
ED : Speech processing; Frequency modulation; Speech recognition; Automatic recognition; Resolving power; Information extraction; Stochastic analysis; Markov model; Linear prediction; RASTA filter
GD : Aufloesungsvermoegen
SD : Tratamiento palabra; Modulación frecuencia; Reconocimiento palabra; Reconocimiento automático; Poder resolución; Extractión información; Análisis estocástico; Modelo Markov; Predicción lineal
LO : INIST-19642.354000071027760010
ID : 99-0006607

Links to Exploration step

Pascal:99-0006607

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="en" level="a">Should recognizers have ears?</title>
<author>
<name sortKey="Hermansky, H" sort="Hermansky, H" uniqKey="Hermansky H" first="H." last="Hermansky">H. Hermansky</name>
<affiliation>
<inist:fA14 i1="01">
<s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation>
<inist:fA14 i1="02">
<s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation>
<inist:fA14 i1="03">
<s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">INIST</idno>
<idno type="inist">99-0006607</idno>
<date when="1998">1998</date>
<idno type="stanalyst">PASCAL 99-0006607 INIST</idno>
<idno type="RBID">Pascal:99-0006607</idno>
<idno type="wicri:Area/PascalFrancis/Corpus">000B70</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="en" level="a">Should recognizers have ears?</title>
<author>
<name sortKey="Hermansky, H" sort="Hermansky, H" uniqKey="Hermansky H" first="H." last="Hermansky">H. Hermansky</name>
<affiliation>
<inist:fA14 i1="01">
<s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation>
<inist:fA14 i1="02">
<s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
<affiliation>
<inist:fA14 i1="03">
<s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</inist:fA14>
</affiliation>
</author>
</analytic>
<series>
<title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
<imprint>
<date when="1998">1998</date>
</imprint>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<title level="j" type="main">Speech communication</title>
<title level="j" type="abbreviated">Speech commun.</title>
<idno type="ISSN">0167-6393</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>Automatic recognition</term>
<term>Frequency modulation</term>
<term>Information extraction</term>
<term>Linear prediction</term>
<term>Markov model</term>
<term>RASTA filter</term>
<term>Resolving power</term>
<term>Speech processing</term>
<term>Speech recognition</term>
<term>Stochastic analysis</term>
</keywords>
<keywords scheme="Pascal" xml:lang="fr">
<term>Traitement parole</term>
<term>Modulation fréquence</term>
<term>Reconnaissance parole</term>
<term>Reconnaissance automatique</term>
<term>Limite résolution</term>
<term>Extraction information</term>
<term>Analyse stochastique</term>
<term>Modèle Markov</term>
<term>Prédiction linéaire</term>
<term>Filtre RASTA</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr">Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</div>
</front>
</TEI>
<inist>
<standard h6="B">
<pA>
<fA01 i1="01" i2="1">
<s0>0167-6393</s0>
</fA01>
<fA02 i1="01">
<s0>SCOMDH</s0>
</fA02>
<fA03 i2="1">
<s0>Speech commun.</s0>
</fA03>
<fA05>
<s2>25</s2>
</fA05>
<fA06>
<s2>1-3</s2>
</fA06>
<fA08 i1="01" i2="1" l="ENG">
<s1>Should recognizers have ears?</s1>
</fA08>
<fA11 i1="01" i2="1">
<s1>HERMANSKY (H.)</s1>
</fA11>
<fA12 i1="01" i2="1">
<s1>JUNQUA (Jean-Claude)</s1>
<s9>ed.</s9>
</fA12>
<fA12 i1="02" i2="1">
<s1>HATON (Jean-Paul)</s1>
<s9>ed.</s9>
</fA12>
<fA14 i1="01">
<s1>Oregon Graduate Institute of Science & Technology</s1>
<s2>Portland, OR</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA14 i1="02">
<s1>International Computer Science Institute</s1>
<s2>Berkeley, California</s2>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA14 i1="03">
<s1>Technical University</s1>
<s2>Brno</s2>
<s3>CZE</s3>
<sZ>1 aut.</sZ>
</fA14>
<fA15 i1="01">
<s1>Speech Technology Laboratory</s1>
<s3>USA</s3>
<sZ>1 aut.</sZ>
</fA15>
<fA15 i1="02">
<s1>CRIN</s1>
<s2>Nancy</s2>
<s3>FRA</s3>
<sZ>2 aut.</sZ>
</fA15>
<fA18 i1="01" i2="1">
<s1>European Speech Communication Association</s1>
<s3>EUR</s3>
<s9>patr.</s9>
</fA18>
<fA18 i1="02" i2="1">
<s1>North Atlantic Treaty Organization. Research Study Group on Speech Processing</s1>
<s3>INC</s3>
<s9>patr.</s9>
</fA18>
<fA20>
<s1>3-27</s1>
</fA20>
<fA21>
<s1>1998</s1>
</fA21>
<fA23 i1="01">
<s0>ENG</s0>
</fA23>
<fA24 i1="01">
<s0>ger</s0>
</fA24>
<fA24 i1="02">
<s0>fre</s0>
</fA24>
<fA43 i1="01">
<s1>INIST</s1>
<s2>19642</s2>
<s5>354000071027760010</s5>
</fA43>
<fA44>
<s0>0000</s0>
<s1>© 1999 INIST-CNRS. All rights reserved.</s1>
</fA44>
<fA45>
<s0>76 ref.</s0>
</fA45>
<fA47 i1="01" i2="1">
<s0>99-0006607</s0>
</fA47>
<fA60>
<s1>P</s1>
<s2>C</s2>
</fA60>
<fA61>
<s0>A</s0>
</fA61>
<fA64 i2="1">
<s0>Speech communication</s0>
</fA64>
<fA66 i1="01">
<s0>NLD</s0>
</fA66>
<fC01 i1="01" l="FRE">
<s0>Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</s0>
</fC01>
<fC02 i1="01" i2="X">
<s0>001D04A05B</s0>
</fC02>
<fC03 i1="01" i2="X" l="FRE">
<s0>Traitement parole</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="ENG">
<s0>Speech processing</s0>
<s5>01</s5>
</fC03>
<fC03 i1="01" i2="X" l="SPA">
<s0>Tratamiento palabra</s0>
<s5>01</s5>
</fC03>
<fC03 i1="02" i2="X" l="FRE">
<s0>Modulation fréquence</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="ENG">
<s0>Frequency modulation</s0>
<s5>02</s5>
</fC03>
<fC03 i1="02" i2="X" l="SPA">
<s0>Modulación frecuencia</s0>
<s5>02</s5>
</fC03>
<fC03 i1="03" i2="X" l="FRE">
<s0>Reconnaissance parole</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="ENG">
<s0>Speech recognition</s0>
<s5>03</s5>
</fC03>
<fC03 i1="03" i2="X" l="SPA">
<s0>Reconocimiento palabra</s0>
<s5>03</s5>
</fC03>
<fC03 i1="04" i2="X" l="FRE">
<s0>Reconnaissance automatique</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="ENG">
<s0>Automatic recognition</s0>
<s5>04</s5>
</fC03>
<fC03 i1="04" i2="X" l="SPA">
<s0>Reconocimiento automático</s0>
<s5>04</s5>
</fC03>
<fC03 i1="05" i2="X" l="FRE">
<s0>Limite résolution</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="ENG">
<s0>Resolving power</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="GER">
<s0>Aufloesungsvermoegen</s0>
<s5>05</s5>
</fC03>
<fC03 i1="05" i2="X" l="SPA">
<s0>Poder resolución</s0>
<s5>05</s5>
</fC03>
<fC03 i1="06" i2="X" l="FRE">
<s0>Extraction information</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="ENG">
<s0>Information extraction</s0>
<s5>06</s5>
</fC03>
<fC03 i1="06" i2="X" l="SPA">
<s0>Extractión información</s0>
<s5>06</s5>
</fC03>
<fC03 i1="07" i2="X" l="FRE">
<s0>Analyse stochastique</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="ENG">
<s0>Stochastic analysis</s0>
<s5>07</s5>
</fC03>
<fC03 i1="07" i2="X" l="SPA">
<s0>Análisis estocástico</s0>
<s5>07</s5>
</fC03>
<fC03 i1="08" i2="X" l="FRE">
<s0>Modèle Markov</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="ENG">
<s0>Markov model</s0>
<s5>08</s5>
</fC03>
<fC03 i1="08" i2="X" l="SPA">
<s0>Modelo Markov</s0>
<s5>08</s5>
</fC03>
<fC03 i1="09" i2="X" l="FRE">
<s0>Prédiction linéaire</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="ENG">
<s0>Linear prediction</s0>
<s5>09</s5>
</fC03>
<fC03 i1="09" i2="X" l="SPA">
<s0>Predicción lineal</s0>
<s5>09</s5>
</fC03>
<fC03 i1="10" i2="X" l="FRE">
<s0>Filtre RASTA</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fC03 i1="10" i2="X" l="ENG">
<s0>RASTA filter</s0>
<s4>CD</s4>
<s5>96</s5>
</fC03>
<fN21>
<s1>004</s1>
</fN21>
</pA>
<pR>
<fA30 i1="01" i2="1" l="ENG">
<s1>Robust Speech Recognition for Unknown Communication Channels. Workshop</s1>
<s3>Pont-à-Mousson FRA</s3>
<s4>1997-04-17</s4>
</fA30>
</pR>
</standard>
<server>
<NO>PASCAL 99-0006607 INIST</NO>
<ET>Should recognizers have ears?</ET>
<AU>HERMANSKY (H.); JUNQUA (Jean-Claude); HATON (Jean-Paul)</AU>
<AF>Oregon Graduate Institute of Science & Technology/Portland, OR/Etats-Unis (1 aut.); International Computer Science Institute/Berkeley, California/Etats-Unis (1 aut.); Technical University/Brno/Tchèque, République (1 aut.); Speech Technology Laboratory/Etats-Unis (1 aut.); CRIN/Nancy/France (2 aut.)</AF>
<DT>Publication en série; Congrès; Niveau analytique</DT>
<SO>Speech communication; ISSN 0167-6393; Coden SCOMDH; Pays-Bas; Da. 1998; Vol. 25; No. 1-3; Pp. 3-27; Abs. allemand/français; Bibl. 76 ref.</SO>
<LA>Anglais</LA>
<FA>Récemment, des techniques motivées par la perception auditive, sont appliquées dans de principales technologies courantes de la parole. Il semble y avoir un regain d'intérêt à l'exploitation de plus de connaissance du processus de la parole humaine dans la conception de systèmes de reconnaissance de la parole. Le papier discute l'expérience de l'auteur dans l'application de connaissances auditives à la reconnaissance automatique de la parole. Il avance l'idé que la raison d'appliquer des connaissances de la perception auditive humaine à l'ingénierie de la parole devrait être la capacité de la perception à supprimer quelques parties de l'information contenue dans le message de la parole. L'article plaide contre l'exploitation aveugle de connaissance accidentelle dispersée qui peut être non pertinente pour une tâche de reconnaissance de la parole. Trois propriétés de perception humaine de la parole sont discutées: ● re========sacute;olution spectrale limiteé, ● utilisation de l'information contenue dans des segments de longueur d'une syllabe environ, ● possibilité d'ignorer les composantes altérées ou non pertinentes de la parole. L'auteur montre, en se référant à certains travaux publiés, que l'utilisation sélective de la connaissance auditive optimisée en fonction et dans certains cas provenant de vraies donneés de parole, peut être compatible avec les approches stochastiques actuelles de la reconnaissance automatique de la parole et pourrait avoir des avantages pour des applications pratiques d'ingénierie.</FA>
<CC>001D04A05B</CC>
<FD>Traitement parole; Modulation fréquence; Reconnaissance parole; Reconnaissance automatique; Limite résolution; Extraction information; Analyse stochastique; Modèle Markov; Prédiction linéaire; Filtre RASTA</FD>
<ED>Speech processing; Frequency modulation; Speech recognition; Automatic recognition; Resolving power; Information extraction; Stochastic analysis; Markov model; Linear prediction; RASTA filter</ED>
<GD>Aufloesungsvermoegen</GD>
<SD>Tratamiento palabra; Modulación frecuencia; Reconocimiento palabra; Reconocimiento automático; Poder resolución; Extractión información; Análisis estocástico; Modelo Markov; Predicción lineal</SD>
<LO>INIST-19642.354000071027760010</LO>
<ID>99-0006607</ID>
</server>
</inist>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/PascalFrancis/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 000B70 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/PascalFrancis/Corpus/biblio.hfd -nk 000B70 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    PascalFrancis
   |étape=   Corpus
   |type=    RBID
   |clé=     Pascal:99-0006607
   |texte=   Should recognizers have ears?
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022