Serveur d'exploration sur la recherche en informatique en Lorraine

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

Segmentation Parole/Musique pour la transcription automatique

Identifieur interne : 003D25 ( Crin/Curation ); précédent : 003D24; suivant : 003D26

Segmentation Parole/Musique pour la transcription automatique

Auteurs : Joseph Razik ; Dominique Fohr ; Odile Mella ; Nathalie Parlangeau-Vallès

Source :

RBID : CRIN:razik04a

English descriptors

Abstract

Dans cet article nous présentons une étude sur l'utilisation des paramètres MFCC dans la tâche de segmentation parole/musique indispensable dans les applications de transcription automatique d'émissions radiophoniques. Nous avons étudié, l'influence du nombre de coefficients MFCC, celle des paramètres dynamiques et notamment celui de la variance des coefficients MFCC calculée sur une seconde. Les tests ont été effectués sur un corpus radiophonique réel et difficile et sur le corpus de Scheirer.

Links toward previous steps (curation, corpus...)


Links to Exploration step

CRIN:razik04a

Le document en format XML

<record>
<TEI>
<teiHeader>
<fileDesc>
<titleStmt>
<title xml:lang="en" wicri:score="248">Segmentation Parole/Musique pour la transcription automatique</title>
</titleStmt>
<publicationStmt>
<idno type="RBID">CRIN:razik04a</idno>
<date when="2004" year="2004">2004</date>
<idno type="wicri:Area/Crin/Corpus">003D25</idno>
<idno type="wicri:Area/Crin/Curation">003D25</idno>
<idno type="wicri:explorRef" wicri:stream="Crin" wicri:step="Curation">003D25</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title xml:lang="en">Segmentation Parole/Musique pour la transcription automatique</title>
<author>
<name sortKey="Razik, Joseph" sort="Razik, Joseph" uniqKey="Razik J" first="Joseph" last="Razik">Joseph Razik</name>
</author>
<author>
<name sortKey="Fohr, Dominique" sort="Fohr, Dominique" uniqKey="Fohr D" first="Dominique" last="Fohr">Dominique Fohr</name>
</author>
<author>
<name sortKey="Mella, Odile" sort="Mella, Odile" uniqKey="Mella O" first="Odile" last="Mella">Odile Mella</name>
</author>
<author>
<name sortKey="Parlangeau Valles, Nathalie" sort="Parlangeau Valles, Nathalie" uniqKey="Parlangeau Valles N" first="Nathalie" last="Parlangeau-Vallès">Nathalie Parlangeau-Vallès</name>
</author>
</analytic>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="KwdEn" xml:lang="en">
<term>automatic transcription</term>
<term>gmm</term>
<term>mfcc</term>
<term>speech recognition</term>
<term>speech/music segmentation</term>
</keywords>
</textClass>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="fr" wicri:score="-994">Dans cet article nous présentons une étude sur l'utilisation des paramètres MFCC dans la tâche de segmentation parole/musique indispensable dans les applications de transcription automatique d'émissions radiophoniques. Nous avons étudié, l'influence du nombre de coefficients MFCC, celle des paramètres dynamiques et notamment celui de la variance des coefficients MFCC calculée sur une seconde. Les tests ont été effectués sur un corpus radiophonique réel et difficile et sur le corpus de Scheirer.</div>
</front>
</TEI>
<BibTex type="inproceedings">
<ref>razik04a</ref>
<crinnumber>A04-R-036</crinnumber>
<category>3</category>
<equipe>PAROLE</equipe>
<author>
<e>Razik, Joseph</e>
<e>Fohr, Dominique</e>
<e>Mella, Odile</e>
<e>Parlangeau-Vallès, Nathalie</e>
</author>
<title>Segmentation Parole/Musique pour la transcription automatique</title>
<booktitle>{Actes des XXVes Journées d'Etude sur la Parole - JEP'2004, Fès, Maroc}</booktitle>
<year>2004</year>
<month>Apr</month>
<url>http://www.loria.fr/publications/2004/A04-R-036/A04-R-036.ps</url>
<keywords>
<e>speech/music segmentation</e>
<e>speech recognition</e>
<e>automatic transcription</e>
<e>gmm</e>
<e>mfcc</e>
</keywords>
<abstract>Dans cet article nous présentons une étude sur l'utilisation des paramètres MFCC dans la tâche de segmentation parole/musique indispensable dans les applications de transcription automatique d'émissions radiophoniques. Nous avons étudié, l'influence du nombre de coefficients MFCC, celle des paramètres dynamiques et notamment celui de la variance des coefficients MFCC calculée sur une seconde. Les tests ont été effectués sur un corpus radiophonique réel et difficile et sur le corpus de Scheirer.</abstract>
</BibTex>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Lorraine/explor/InforLorV4/Data/Crin/Curation
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 003D25 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Crin/Curation/biblio.hfd -nk 003D25 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Lorraine
   |area=    InforLorV4
   |flux=    Crin
   |étape=   Curation
   |type=    RBID
   |clé=     CRIN:razik04a
   |texte=   Segmentation Parole/Musique pour la transcription automatique
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Mon Jun 10 21:56:28 2019. Site generation: Fri Feb 25 15:29:27 2022