InforLorV4, Crin, Curation, bibRecord, 003D25

Segmentation Parole/Musique pour la transcription automatique

Identifieur interne : 003D25 ( Crin/Curation ); précédent : 003D24; suivant : 003D26

Segmentation Parole/Musique pour la transcription automatique

Auteurs : Joseph Razik ; Dominique Fohr ; Odile Mella ; Nathalie Parlangeau-Vallès

Source :

RBID : CRIN:razik04a

English descriptors

KwdEn :
- automatic transcription, gmm, mfcc, speech recognition, speech/music segmentation.

Abstract

Dans cet article nous présentons une étude sur l'utilisation des paramètres MFCC dans la tâche de segmentation parole/musique indispensable dans les applications de transcription automatique d'émissions radiophoniques. Nous avons étudié, l'influence du nombre de coefficients MFCC, celle des paramètres dynamiques et notamment celui de la variance des coefficients MFCC calculée sur une seconde. Les tests ont été effectués sur un corpus radiophonique réel et difficile et sur le corpus de Scheirer.

Links toward previous steps (curation, corpus...)

to stream Crin, to step Corpus: Pour aller vers cette notice dans l'étape Curation :003D25

Links to Exploration step

CRIN:razik04a

Le document en format XML

<record><TEI><teiHeader><fileDesc><titleStmt><title xml:lang="en" wicri:score="248">Segmentation Parole/Musique pour la transcription automatique</title>
</titleStmt>
<publicationStmt><idno type="RBID">CRIN:razik04a</idno>
<date when="2004" year="2004">2004</date>
<idno type="wicri:Area/Crin/Corpus">003D25</idno>
<idno type="wicri:Area/Crin/Curation">003D25</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Curation">003D25</idno>
</publicationStmt>
<sourceDesc><biblStruct><analytic><title xml:lang="en">Segmentation Parole/Musique pour la transcription automatique</title>
<author><name sortKey="Razik, Joseph" sort="Razik, Joseph" uniqKey="Razik J" first="Joseph" last="Razik">Joseph Razik</name>
</author>
<author><name sortKey="Fohr, Dominique" sort="Fohr, Dominique" uniqKey="Fohr D" first="Dominique" last="Fohr">Dominique Fohr</name>
</author>
<author><name sortKey="Mella, Odile" sort="Mella, Odile" uniqKey="Mella O" first="Odile" last="Mella">Odile Mella</name>
</author>
<author><name sortKey="Parlangeau Valles, Nathalie" sort="Parlangeau Valles, Nathalie" uniqKey="Parlangeau Valles N" first="Nathalie" last="Parlangeau-Vallès">Nathalie Parlangeau-Vallès</name>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc><textClass><keywords scheme="KwdEn" xml:lang="en"><term>automatic transcription</term>
<term>gmm</term>
<term>mfcc</term>
<term>speech recognition</term>
<term>speech/music segmentation</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front><div type="abstract" xml:lang="fr" wicri:score="-994">Dans cet article nous présentons une étude sur l'utilisation des paramètres MFCC dans la tâche de segmentation parole/musique indispensable dans les applications de transcription automatique d'émissions radiophoniques. Nous avons étudié, l'influence du nombre de coefficients MFCC, celle des paramètres dynamiques et notamment celui de la variance des coefficients MFCC calculée sur une seconde. Les tests ont été effectués sur un corpus radiophonique réel et difficile et sur le corpus de Scheirer.</div>
</front>
</TEI>
<BibTex type="inproceedings"><ref>razik04a</ref>
<crinnumber>A04-R-036</crinnumber>
<category>3</category>
<equipe>PAROLE</equipe>
<author><e>Razik, Joseph</e>
<e>Fohr, Dominique</e>
<e>Mella, Odile</e>
<e>Parlangeau-Vallès, Nathalie</e>
</author>
<title>Segmentation Parole/Musique pour la transcription automatique</title>
<booktitle>{Actes des XXVes Journées d'Etude sur la Parole - JEP'2004, Fès, Maroc}</booktitle>
<year>2004</year>
<month>Apr</month>
<url>http://www.loria.fr/publications/2004/A04-R-036/A04-R-036.ps</url>
<keywords><e>speech/music segmentation</e>
<e>speech recognition</e>
<e>automatic transcription</e>
<e>gmm</e>
<e>mfcc</e>
</keywords>
<abstract>Dans cet article nous présentons une étude sur l'utilisation des paramètres MFCC dans la tâche de segmentation parole/musique indispensable dans les applications de transcription automatique d'émissions radiophoniques. Nous avons étudié, l'influence du nombre de coefficients MFCC, celle des paramètres dynamiques et notamment celui de la variance des coefficients MFCC calculée sur une seconde. Les tests ont été effectués sur un corpus radiophonique réel et difficile et sur le corpus de Scheirer.</abstract>
</BibTex>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Crin/Curation

HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 003D25 | SxmlIndent | more

HfdSelect -h $EXPLOR_AREA/Data/Crin/Curation/biblio.hfd -nk 003D25 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Crin
   |étape=   Curation
   |type=    RBID
   |clé=     CRIN:razik04a
   |texte=   Segmentation Parole/Musique pour la transcription automatique
}}

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022

	Serveur d'exploration sur la recherche en informatique en Lorraine
	Attention, ce site est en cours de développement ! Attention, site généré par des moyens informatiques à partir de corpus bruts. Les informations ne sont donc pas validées.

Serveur d'exploration sur la recherche en informatique en Lorraine

Segmentation Parole/Musique pour la transcription automatique

Segmentation Parole/Musique pour la transcription automatique

Source :

English descriptors

Abstract

Links toward previous steps (curation, corpus...)

Links to Exploration step

Le document en format XML

Pour manipuler ce document sous Unix (Dilib)

Pour mettre un lien sur cette page dans le réseau Wicri