Serveur d'exploration sur la musique en Sarre

Attention, ce site est en cours de développement !
Attention, site généré par des moyens informatiques à partir de corpus bruts.
Les informations ne sont donc pas validées.

The MATE workbench – An annotation tool for XML coded speech corpora

Identifieur interne : 001897 ( Istex/Corpus ); précédent : 001896; suivant : 001898

The MATE workbench – An annotation tool for XML coded speech corpora

Auteurs : David Mckelvie ; Amy Isard ; Andreas Mengel ; Morten Baun M Ller ; Michael Grosse ; Marion Klein

Source :

RBID : ISTEX:EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC

English descriptors

Abstract

This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.
Zusammenfassung: Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.
Résumé: Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.

Url:
DOI: 10.1016/S0167-6393(00)00071-6

Links to Exploration step

ISTEX:EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC

Le document en format XML

<record>
<TEI wicri:istexFullTextTei="biblStruct">
<teiHeader>
<fileDesc>
<titleStmt>
<title>The MATE workbench – An annotation tool for XML coded speech corpora</title>
<author>
<name sortKey="Mckelvie, David" sort="Mckelvie, David" uniqKey="Mckelvie D" first="David" last="Mckelvie">David Mckelvie</name>
<affiliation>
<mods:affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>Corresponding author</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>E-mail: dmck@cogsci.ed.ac.uk</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Isard, Amy" sort="Isard, Amy" uniqKey="Isard A" first="Amy" last="Isard">Amy Isard</name>
<affiliation>
<mods:affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Mengel, Andreas" sort="Mengel, Andreas" uniqKey="Mengel A" first="Andreas" last="Mengel">Andreas Mengel</name>
<affiliation>
<mods:affiliation>Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Germany</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Baun M Ller, Morten" sort="Baun M Ller, Morten" uniqKey="Baun M Ller M" first="Morten" last="Baun M Ller">Morten Baun M Ller</name>
<affiliation>
<mods:affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Grosse, Michael" sort="Grosse, Michael" uniqKey="Grosse M" first="Michael" last="Grosse">Michael Grosse</name>
<affiliation>
<mods:affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Klein, Marion" sort="Klein, Marion" uniqKey="Klein M" first="Marion" last="Klein">Marion Klein</name>
<affiliation>
<mods:affiliation>Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken, Germany</mods:affiliation>
</affiliation>
</author>
</titleStmt>
<publicationStmt>
<idno type="wicri:source">ISTEX</idno>
<idno type="RBID">ISTEX:EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC</idno>
<date when="2001" year="2001">2001</date>
<idno type="doi">10.1016/S0167-6393(00)00071-6</idno>
<idno type="url">https://api.istex.fr/document/EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC/fulltext/pdf</idno>
<idno type="wicri:Area/Istex/Corpus">001897</idno>
<idno type="wicri:explorRef" wicri:stream="Istex" wicri:step="Corpus" wicri:corpus="ISTEX">001897</idno>
</publicationStmt>
<sourceDesc>
<biblStruct>
<analytic>
<title level="a">The MATE workbench – An annotation tool for XML coded speech corpora</title>
<author>
<name sortKey="Mckelvie, David" sort="Mckelvie, David" uniqKey="Mckelvie D" first="David" last="Mckelvie">David Mckelvie</name>
<affiliation>
<mods:affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>Corresponding author</mods:affiliation>
</affiliation>
<affiliation>
<mods:affiliation>E-mail: dmck@cogsci.ed.ac.uk</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Isard, Amy" sort="Isard, Amy" uniqKey="Isard A" first="Amy" last="Isard">Amy Isard</name>
<affiliation>
<mods:affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Mengel, Andreas" sort="Mengel, Andreas" uniqKey="Mengel A" first="Andreas" last="Mengel">Andreas Mengel</name>
<affiliation>
<mods:affiliation>Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Germany</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Baun M Ller, Morten" sort="Baun M Ller, Morten" uniqKey="Baun M Ller M" first="Morten" last="Baun M Ller">Morten Baun M Ller</name>
<affiliation>
<mods:affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Grosse, Michael" sort="Grosse, Michael" uniqKey="Grosse M" first="Michael" last="Grosse">Michael Grosse</name>
<affiliation>
<mods:affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</mods:affiliation>
</affiliation>
</author>
<author>
<name sortKey="Klein, Marion" sort="Klein, Marion" uniqKey="Klein M" first="Marion" last="Klein">Marion Klein</name>
<affiliation>
<mods:affiliation>Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken, Germany</mods:affiliation>
</affiliation>
</author>
</analytic>
<monogr></monogr>
<series>
<title level="j">Speech Communication</title>
<title level="j" type="abbrev">SPECOM</title>
<idno type="ISSN">0167-6393</idno>
<imprint>
<publisher>ELSEVIER</publisher>
<date type="published" when="2001">2001</date>
<biblScope unit="volume">33</biblScope>
<biblScope unit="issue">1–2</biblScope>
<biblScope unit="page" from="97">97</biblScope>
<biblScope unit="page" to="112">112</biblScope>
</imprint>
<idno type="ISSN">0167-6393</idno>
</series>
</biblStruct>
</sourceDesc>
<seriesStmt>
<idno type="ISSN">0167-6393</idno>
</seriesStmt>
</fileDesc>
<profileDesc>
<textClass>
<keywords scheme="Teeft" xml:lang="en">
<term>Abstract data model</term>
<term>Annotation</term>
<term>Annotation scheme</term>
<term>Annotation schemes</term>
<term>Annotation tool</term>
<term>Annotation tools</term>
<term>Chooser menu</term>
<term>Common framework</term>
<term>Communication problem</term>
<term>Computational linguistics</term>
<term>Consortium</term>
<term>Corpus</term>
<term>Corpus annotations</term>
<term>Corpus descriptions</term>
<term>Corpus encoding</term>
<term>Data model</term>
<term>Database</term>
<term>Dialogue move</term>
<term>Display object</term>
<term>Display object types</term>
<term>Display objects</term>
<term>Display processor</term>
<term>Display structure</term>
<term>Display structures</term>
<term>Document structure</term>
<term>Dummy elements</term>
<term>Edinburgh speech tools library</term>
<term>Editing actions</term>
<term>Element names</term>
<term>Elsevier science</term>
<term>Example interfaces</term>
<term>Exible</term>
<term>Exible display</term>
<term>Future work</term>
<term>Hcontrastivei element</term>
<term>Hierarchical structure</term>
<term>Href</term>
<term>Href attributes</term>
<term>Hyperlink</term>
<term>Input document</term>
<term>Interface</term>
<term>Internal database</term>
<term>Internal representation</term>
<term>Java</term>
<term>Java classes</term>
<term>Linguistic annotation</term>
<term>Linguistic annotations</term>
<term>Lore project</term>
<term>Many sound formats</term>
<term>Mate display objects</term>
<term>Mate interface</term>
<term>Mate project</term>
<term>Mate query language</term>
<term>Mate stylesheets</term>
<term>Mate workbench</term>
<term>Mckelvie</term>
<term>Mengel</term>
<term>Node</term>
<term>Other elements</term>
<term>Other nodes</term>
<term>Particular annotation tasks</term>
<term>Particular aspects</term>
<term>Partitur format</term>
<term>Phonetic sciences</term>
<term>Programming language</term>
<term>Query</term>
<term>Query language</term>
<term>Query languages</term>
<term>Query languages workshop</term>
<term>Query results</term>
<term>Relational models</term>
<term>Right pane</term>
<term>Same document</term>
<term>Same format</term>
<term>Same segment</term>
<term>Schema language</term>
<term>Semistructured data</term>
<term>Software</term>
<term>Specialised</term>
<term>Specialised software</term>
<term>Speech communication</term>
<term>Speech corpora</term>
<term>Speech signal</term>
<term>Speech signals</term>
<term>Startup window</term>
<term>Stylesheet</term>
<term>Stylesheet language</term>
<term>Stylesheet processor</term>
<term>Stylesheets</term>
<term>Task corpus</term>
<term>Text encoding initiative</term>
<term>Textual inclusion</term>
<term>Transformation language</term>
<term>Transformation languages</term>
<term>Tree structure</term>
<term>User</term>
<term>User actions</term>
<term>User interface</term>
<term>Workbench</term>
<term>Xslt</term>
</keywords>
</textClass>
<langUsage>
<language ident="en">en</language>
</langUsage>
</profileDesc>
</teiHeader>
<front>
<div type="abstract" xml:lang="en">This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.</div>
<div type="abstract" xml:lang="de">Zusammenfassung: Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.</div>
<div type="abstract" xml:lang="fr">Résumé: Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.</div>
</front>
</TEI>
<istex>
<corpusName>elsevier</corpusName>
<keywords>
<teeft>
<json:string>annotation</json:string>
<json:string>query</json:string>
<json:string>node</json:string>
<json:string>mate workbench</json:string>
<json:string>stylesheet</json:string>
<json:string>database</json:string>
<json:string>speech communication</json:string>
<json:string>stylesheets</json:string>
<json:string>internal representation</json:string>
<json:string>mckelvie</json:string>
<json:string>data model</json:string>
<json:string>exible</json:string>
<json:string>consortium</json:string>
<json:string>hyperlink</json:string>
<json:string>query language</json:string>
<json:string>software</json:string>
<json:string>display objects</json:string>
<json:string>xslt</json:string>
<json:string>mengel</json:string>
<json:string>href</json:string>
<json:string>query languages</json:string>
<json:string>specialised</json:string>
<json:string>speech signal</json:string>
<json:string>stylesheet language</json:string>
<json:string>query results</json:string>
<json:string>display structure</json:string>
<json:string>workbench</json:string>
<json:string>interface</json:string>
<json:string>user</json:string>
<json:string>editing actions</json:string>
<json:string>mate query language</json:string>
<json:string>elsevier science</json:string>
<json:string>annotation schemes</json:string>
<json:string>annotation scheme</json:string>
<json:string>computational linguistics</json:string>
<json:string>particular annotation tasks</json:string>
<json:string>display structures</json:string>
<json:string>display processor</json:string>
<json:string>stylesheet processor</json:string>
<json:string>mate project</json:string>
<json:string>user interface</json:string>
<json:string>same format</json:string>
<json:string>partitur format</json:string>
<json:string>mate display objects</json:string>
<json:string>display object</json:string>
<json:string>linguistic annotation</json:string>
<json:string>corpus</json:string>
<json:string>future work</json:string>
<json:string>speech corpora</json:string>
<json:string>same document</json:string>
<json:string>many sound formats</json:string>
<json:string>edinburgh speech tools library</json:string>
<json:string>hcontrastivei element</json:string>
<json:string>annotation tool</json:string>
<json:string>href attributes</json:string>
<json:string>other elements</json:string>
<json:string>hierarchical structure</json:string>
<json:string>annotation tools</json:string>
<json:string>exible display</json:string>
<json:string>phonetic sciences</json:string>
<json:string>specialised software</json:string>
<json:string>abstract data model</json:string>
<json:string>tree structure</json:string>
<json:string>semistructured data</json:string>
<json:string>same segment</json:string>
<json:string>textual inclusion</json:string>
<json:string>other nodes</json:string>
<json:string>dummy elements</json:string>
<json:string>lore project</json:string>
<json:string>speech signals</json:string>
<json:string>programming language</json:string>
<json:string>relational models</json:string>
<json:string>mate stylesheets</json:string>
<json:string>element names</json:string>
<json:string>common framework</json:string>
<json:string>document structure</json:string>
<json:string>query languages workshop</json:string>
<json:string>text encoding initiative</json:string>
<json:string>schema language</json:string>
<json:string>input document</json:string>
<json:string>corpus annotations</json:string>
<json:string>user actions</json:string>
<json:string>corpus encoding</json:string>
<json:string>java classes</json:string>
<json:string>display object types</json:string>
<json:string>transformation language</json:string>
<json:string>chooser menu</json:string>
<json:string>example interfaces</json:string>
<json:string>startup window</json:string>
<json:string>communication problem</json:string>
<json:string>right pane</json:string>
<json:string>mate interface</json:string>
<json:string>dialogue move</json:string>
<json:string>task corpus</json:string>
<json:string>particular aspects</json:string>
<json:string>linguistic annotations</json:string>
<json:string>corpus descriptions</json:string>
<json:string>transformation languages</json:string>
<json:string>internal database</json:string>
<json:string>java</json:string>
<json:string>format</json:string>
</teeft>
</keywords>
<author>
<json:item>
<name>David McKelvie</name>
<affiliations>
<json:string>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</json:string>
<json:string>Corresponding author</json:string>
<json:string>E-mail: dmck@cogsci.ed.ac.uk</json:string>
</affiliations>
</json:item>
<json:item>
<name>Amy Isard</name>
<affiliations>
<json:string>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</json:string>
</affiliations>
</json:item>
<json:item>
<name>Andreas Mengel</name>
<affiliations>
<json:string>Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Germany</json:string>
</affiliations>
</json:item>
<json:item>
<name>Morten Baun Møller</name>
<affiliations>
<json:string>Natural Interactive Systems Laboratory, Odense University, Denmark</json:string>
</affiliations>
</json:item>
<json:item>
<name>Michael Grosse</name>
<affiliations>
<json:string>Natural Interactive Systems Laboratory, Odense University, Denmark</json:string>
</affiliations>
</json:item>
<json:item>
<name>Marion Klein</name>
<affiliations>
<json:string>Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken, Germany</json:string>
</affiliations>
</json:item>
</author>
<language>
<json:string>eng</json:string>
</language>
<originalGenre>
<json:string>Full-length article</json:string>
</originalGenre>
<abstract>This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.</abstract>
<qualityIndicators>
<score>6.752</score>
<pdfVersion>1.2</pdfVersion>
<pdfPageSize>544 x 743 pts</pdfPageSize>
<refBibsNative>true</refBibsNative>
<keywordCount>0</keywordCount>
<abstractCharCount>974</abstractCharCount>
<pdfWordCount>8053</pdfWordCount>
<pdfCharCount>48551</pdfCharCount>
<pdfPageCount>16</pdfPageCount>
<abstractWordCount>146</abstractWordCount>
</qualityIndicators>
<title>The MATE workbench – An annotation tool for XML coded speech corpora</title>
<pii>
<json:string>S0167-6393(00)00071-6</json:string>
</pii>
<genre>
<json:string>research-article</json:string>
</genre>
<host>
<title>Speech Communication</title>
<language>
<json:string>unknown</json:string>
</language>
<publicationDate>2001</publicationDate>
<issn>
<json:string>0167-6393</json:string>
</issn>
<pii>
<json:string>S0167-6393(00)X0050-7</json:string>
</pii>
<volume>33</volume>
<issue>1–2</issue>
<pages>
<first>97</first>
<last>112</last>
</pages>
<genre>
<json:string>journal</json:string>
</genre>
<conference>
<json:item>
<name>Speech Annotation and Corpus Tools Speech Annotation</name>
</json:item>
</conference>
<editor>
<json:item>
<name>S. Bird and J. Harrington</name>
</json:item>
</editor>
</host>
<categories>
<wos>
<json:string>science</json:string>
<json:string>computer science, interdisciplinary applications</json:string>
<json:string>acoustics</json:string>
</wos>
<scienceMetrix></scienceMetrix>
<inist>
<json:string>sciences humaines et sociales</json:string>
</inist>
</categories>
<publicationDate>2001</publicationDate>
<copyrightDate>2001</copyrightDate>
<doi>
<json:string>10.1016/S0167-6393(00)00071-6</json:string>
</doi>
<id>EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC</id>
<score>1</score>
<fulltext>
<json:item>
<extension>pdf</extension>
<original>true</original>
<mimetype>application/pdf</mimetype>
<uri>https://api.istex.fr/document/EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC/fulltext/pdf</uri>
</json:item>
<json:item>
<extension>zip</extension>
<original>false</original>
<mimetype>application/zip</mimetype>
<uri>https://api.istex.fr/document/EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC/fulltext/zip</uri>
</json:item>
<istex:fulltextTEI uri="https://api.istex.fr/document/EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC/fulltext/tei">
<teiHeader>
<fileDesc>
<titleStmt>
<title level="a">The MATE workbench – An annotation tool for XML coded speech corpora</title>
</titleStmt>
<publicationStmt>
<authority>ISTEX</authority>
<publisher>ELSEVIER</publisher>
<availability>
<p>©2001 Elsevier Science B.V.</p>
</availability>
<date>2001</date>
</publicationStmt>
<notesStmt>
<note type="content">Fig. 1: Internal representation of example with intersecting hierarchies.</note>
<note type="content">Fig. 2: MATE workbench software architecture.</note>
<note type="content">Fig. 3: A partial schema for the MATE internal representation.</note>
<note type="content">Fig. 4: An example Q4M query.</note>
<note type="content">Fig. 5: List of defined Q4M operators.</note>
<note type="content">Fig. 6: An example XML file and associated stylesheet.</note>
<note type="content">Fig. 7: Linking display objects and corpus elements.</note>
<note type="content">Fig. 8: A MATE interface for displaying communication problems markup.</note>
<note type="content">Fig. 9: A MATE interface for annotating and playing Map Task dialogue moves.</note>
</notesStmt>
<sourceDesc>
<biblStruct type="inbook">
<analytic>
<title level="a">The MATE workbench – An annotation tool for XML coded speech corpora</title>
<author xml:id="author-0000">
<persName>
<forename type="first">David</forename>
<surname>McKelvie</surname>
</persName>
<email>dmck@cogsci.ed.ac.uk</email>
<affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</affiliation>
<affiliation>Corresponding author</affiliation>
</author>
<author xml:id="author-0001">
<persName>
<forename type="first">Amy</forename>
<surname>Isard</surname>
</persName>
<affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</affiliation>
</author>
<author xml:id="author-0002">
<persName>
<forename type="first">Andreas</forename>
<surname>Mengel</surname>
</persName>
<affiliation>Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Germany</affiliation>
</author>
<author xml:id="author-0003">
<persName>
<forename type="first">Morten</forename>
<surname>Baun Møller</surname>
</persName>
<affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</affiliation>
</author>
<author xml:id="author-0004">
<persName>
<forename type="first">Michael</forename>
<surname>Grosse</surname>
</persName>
<affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</affiliation>
</author>
<author xml:id="author-0005">
<persName>
<forename type="first">Marion</forename>
<surname>Klein</surname>
</persName>
<affiliation>Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken, Germany</affiliation>
</author>
<idno type="istex">EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC</idno>
<idno type="DOI">10.1016/S0167-6393(00)00071-6</idno>
<idno type="PII">S0167-6393(00)00071-6</idno>
</analytic>
<monogr>
<title level="j">Speech Communication</title>
<title level="j" type="abbrev">SPECOM</title>
<idno type="pISSN">0167-6393</idno>
<idno type="PII">S0167-6393(00)X0050-7</idno>
<meeting>
<addName>Speech Annotation and Corpus Tools</addName>
<addName>Speech Annotation</addName>
</meeting>
<editor xml:id="book-author-0000">
<persName>S. Bird and J. Harrington</persName>
</editor>
<imprint>
<publisher>ELSEVIER</publisher>
<date type="published" when="2001"></date>
<biblScope unit="volume">33</biblScope>
<biblScope unit="issue">1–2</biblScope>
<biblScope unit="page" from="97">97</biblScope>
<biblScope unit="page" to="112">112</biblScope>
</imprint>
</monogr>
</biblStruct>
</sourceDesc>
</fileDesc>
<profileDesc>
<creation>
<date>2001</date>
</creation>
<langUsage>
<language ident="en">en</language>
</langUsage>
<abstract xml:lang="en">
<p>This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.</p>
</abstract>
<abstract xml:lang="de">
<p>Zusammenfassung: Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.</p>
</abstract>
<abstract xml:lang="fr">
<p>Résumé: Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.</p>
</abstract>
</profileDesc>
<revisionDesc>
<change when="2001">Published</change>
</revisionDesc>
</teiHeader>
</istex:fulltextTEI>
<json:item>
<extension>txt</extension>
<original>false</original>
<mimetype>text/plain</mimetype>
<uri>https://api.istex.fr/document/EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC/fulltext/txt</uri>
</json:item>
</fulltext>
<metadata>
<istex:metadataXml wicri:clean="Elsevier, elements deleted: ce:floats; body; tail">
<istex:xmlDeclaration>version="1.0" encoding="utf-8"</istex:xmlDeclaration>
<istex:docType PUBLIC="-//ES//DTD journal article DTD version 4.5.2//EN//XML" URI="art452.dtd" name="istex:docType">
<istex:entity SYSTEM="gr1" NDATA="IMAGE" name="gr1"></istex:entity>
<istex:entity SYSTEM="gr2" NDATA="IMAGE" name="gr2"></istex:entity>
<istex:entity SYSTEM="gr3" NDATA="IMAGE" name="gr3"></istex:entity>
<istex:entity SYSTEM="gr4" NDATA="IMAGE" name="gr4"></istex:entity>
<istex:entity SYSTEM="gr5" NDATA="IMAGE" name="gr5"></istex:entity>
<istex:entity SYSTEM="gr6" NDATA="IMAGE" name="gr6"></istex:entity>
<istex:entity SYSTEM="gr7" NDATA="IMAGE" name="gr7"></istex:entity>
<istex:entity SYSTEM="gr8" NDATA="IMAGE" name="gr8"></istex:entity>
<istex:entity SYSTEM="gr9" NDATA="IMAGE" name="gr9"></istex:entity>
</istex:docType>
<istex:document>
<converted-article version="4.5.2" docsubtype="fla">
<item-info>
<jid>SPECOM</jid>
<aid>1109</aid>
<ce:pii>S0167-6393(00)00071-6</ce:pii>
<ce:doi>10.1016/S0167-6393(00)00071-6</ce:doi>
<ce:copyright type="full-transfer" year="2001">Elsevier Science B.V.</ce:copyright>
</item-info>
<head>
<ce:title>The MATE workbench – An annotation tool for XML coded speech corpora</ce:title>
<ce:author-group>
<ce:author>
<ce:given-name>David</ce:given-name>
<ce:surname>McKelvie</ce:surname>
<ce:cross-ref refid="AFF1">
<ce:sup>a</ce:sup>
</ce:cross-ref>
<ce:cross-ref refid="CORR1">*</ce:cross-ref>
<ce:e-address>dmck@cogsci.ed.ac.uk</ce:e-address>
</ce:author>
<ce:author>
<ce:given-name>Amy</ce:given-name>
<ce:surname>Isard</ce:surname>
<ce:cross-ref refid="AFF1">
<ce:sup>a</ce:sup>
</ce:cross-ref>
</ce:author>
<ce:author>
<ce:given-name>Andreas</ce:given-name>
<ce:surname>Mengel</ce:surname>
<ce:cross-ref refid="AFF2">
<ce:sup>b</ce:sup>
</ce:cross-ref>
</ce:author>
<ce:author>
<ce:given-name>Morten</ce:given-name>
<ce:surname>Baun Møller</ce:surname>
<ce:cross-ref refid="AFF3">
<ce:sup>c</ce:sup>
</ce:cross-ref>
</ce:author>
<ce:author>
<ce:given-name>Michael</ce:given-name>
<ce:surname>Grosse</ce:surname>
<ce:cross-ref refid="AFF3">
<ce:sup>c</ce:sup>
</ce:cross-ref>
</ce:author>
<ce:author>
<ce:given-name>Marion</ce:given-name>
<ce:surname>Klein</ce:surname>
<ce:cross-ref refid="AFF4">
<ce:sup>d</ce:sup>
</ce:cross-ref>
</ce:author>
<ce:affiliation id="AFF1">
<ce:label>a</ce:label>
<ce:textfn>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</ce:textfn>
</ce:affiliation>
<ce:affiliation id="AFF2">
<ce:label>b</ce:label>
<ce:textfn>Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Germany</ce:textfn>
</ce:affiliation>
<ce:affiliation id="AFF3">
<ce:label>c</ce:label>
<ce:textfn>Natural Interactive Systems Laboratory, Odense University, Denmark</ce:textfn>
</ce:affiliation>
<ce:affiliation id="AFF4">
<ce:label>d</ce:label>
<ce:textfn>Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken, Germany</ce:textfn>
</ce:affiliation>
<ce:correspondence id="CORR1">
<ce:label>*</ce:label>
<ce:text>Corresponding author</ce:text>
</ce:correspondence>
</ce:author-group>
<ce:date-accepted day="2" month="8" year="2000"></ce:date-accepted>
<ce:abstract>
<ce:section-title>Abstract</ce:section-title>
<ce:abstract-sec>
<ce:simple-para>This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.</ce:simple-para>
</ce:abstract-sec>
</ce:abstract>
<ce:abstract xml:lang="de">
<ce:section-title>Zusammenfassung</ce:section-title>
<ce:abstract-sec>
<ce:simple-para>Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.</ce:simple-para>
</ce:abstract-sec>
</ce:abstract>
<ce:abstract xml:lang="fr">
<ce:section-title>Résumé</ce:section-title>
<ce:abstract-sec>
<ce:simple-para>Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.</ce:simple-para>
</ce:abstract-sec>
</ce:abstract>
</head>
</converted-article>
</istex:document>
</istex:metadataXml>
<mods version="3.6">
<titleInfo>
<title>The MATE workbench – An annotation tool for XML coded speech corpora</title>
</titleInfo>
<titleInfo type="alternative" contentType="CDATA">
<title>The MATE workbench – An annotation tool for XML coded speech corpora</title>
</titleInfo>
<name type="personal">
<namePart type="given">David</namePart>
<namePart type="family">McKelvie</namePart>
<affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</affiliation>
<affiliation>Corresponding author</affiliation>
<affiliation>E-mail: dmck@cogsci.ed.ac.uk</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Amy</namePart>
<namePart type="family">Isard</namePart>
<affiliation>Language Technology Group, University of Edinburgh, 2 Buccleuch Place, Edinburgh EH8 9LW, UK</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Andreas</namePart>
<namePart type="family">Mengel</namePart>
<affiliation>Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Germany</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Morten</namePart>
<namePart type="family">Baun Møller</namePart>
<affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Michael</namePart>
<namePart type="family">Grosse</namePart>
<affiliation>Natural Interactive Systems Laboratory, Odense University, Denmark</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marion</namePart>
<namePart type="family">Klein</namePart>
<affiliation>Deutsches Forschungszentrum für Künstliche Intelligenz, Saarbrücken, Germany</affiliation>
<role>
<roleTerm type="text">author</roleTerm>
</role>
</name>
<typeOfResource>text</typeOfResource>
<genre type="research-article" displayLabel="Full-length article"></genre>
<originInfo>
<publisher>ELSEVIER</publisher>
<dateIssued encoding="w3cdtf">2001</dateIssued>
<copyrightDate encoding="w3cdtf">2001</copyrightDate>
</originInfo>
<language>
<languageTerm type="code" authority="iso639-2b">eng</languageTerm>
<languageTerm type="code" authority="rfc3066">en</languageTerm>
</language>
<physicalDescription>
<internetMediaType>text/html</internetMediaType>
</physicalDescription>
<abstract lang="en">This paper describes the design and implementation of the MATE workbench, a program which provides support for the annotation of speech and text. It provides facilities for flexible display and editing of such annotations, and complex querying of a resulting corpus. The workbench offers a more flexible approach than most existing annotation tools, which were often designed with a specific annotation scheme in mind. Any annotation scheme can be used with the MATE workbench, provided it is coded using XML markup (linked to the speech signal, if available, using certain conventions). The workbench uses a transformation language to define specialised editors optimised for particular annotation tasks, with suitable display formats and allowable editing operations tailored to the task. The workbench is written in Java, which means that it is platform-independent. This paper outlines the design of the workbench software and compares it with other annotation programs.</abstract>
<abstract lang="de">Zusammenfassung: Dieser Beitrag beschreibt das Design und die Implementierung der MATE Workbench, einem Programm für die Annotation von gesprochener und geschriebener Sprache. Die Workbench bietet Funktionen für die flexible Darstellung und Bearbeitung von Annotationen sowie komplexe Suchanfragen an vorhandene Korpora. Die Workbench hat einen offeneren Ansatz als die meisten existierenden Annotations-Werkzeuge, welche oft auf ein festes Annotationsschema zugeschnitten sind. In der MATE Workbench kann jedes Annotationsschema benutzt werden, so es in XML kodiert und – wenn verfügbar – mit einem Sprachsignal verbunden ist. Die Workbench nutzt eine Transformationssprache für die Definition und Generierung des für die jeweilige Aufgabe angemessenen Editors mit entsprechenden Anzeigeformaten und Bearbeitungsfunktionen. Die Workbench ist in der Programmiersprache Java geschrieben und somit platform-unabhängig. Der Beitrag erläutert das Design der Workbench-Software und vergleicht es mit dem anderer Annotationsprogramme.</abstract>
<abstract lang="fr">Résumé: Nous présentons, dans cet article, la conception et le développement du workbench MATE, un programme pour l'annotation de la parole et des textes écrits. Il facilite la visualisation et l'édition flexibles de telles annotations, et permet des requêtes complexes sur un corpus résultant. Le workbench offre une approche plus souple que la plupart des outils d'annotation, qui ont souvent été conçus pour un jeu d'étiquettes spécifique. Le workbench MATE permet le traitement de tout jeu d'étiquettes pourvu que ce dernier puisse s'exprimer en format XML (rattaché au signal vocal, si disponible, en utilisant certaines conventions). Le workbench utilise un langage de transformation pour définir les éditeurs spécialisés qui sont optimalisés pour des tâches d'annotation particulières avec des visualisations appropriées et des actions permises conçues en fonction de la tâche. Le workbench est écrit dans le langage Java, ce qui le permet d'être indépendant de la plateforme. Cet article décrit l'architecture du logiciel du workbench et le compare à d'autres outils d'annotation.</abstract>
<note type="content">Fig. 1: Internal representation of example with intersecting hierarchies.</note>
<note type="content">Fig. 2: MATE workbench software architecture.</note>
<note type="content">Fig. 3: A partial schema for the MATE internal representation.</note>
<note type="content">Fig. 4: An example Q4M query.</note>
<note type="content">Fig. 5: List of defined Q4M operators.</note>
<note type="content">Fig. 6: An example XML file and associated stylesheet.</note>
<note type="content">Fig. 7: Linking display objects and corpus elements.</note>
<note type="content">Fig. 8: A MATE interface for displaying communication problems markup.</note>
<note type="content">Fig. 9: A MATE interface for annotating and playing Map Task dialogue moves.</note>
<relatedItem type="host">
<titleInfo>
<title>Speech Communication</title>
</titleInfo>
<titleInfo type="abbreviated">
<title>SPECOM</title>
</titleInfo>
<name type="conference">
<namePart>Speech Annotation and Corpus Tools</namePart>
<namePart>Speech Annotation</namePart>
</name>
<name type="personal">
<namePart>S. Bird and J. Harrington</namePart>
<role>
<roleTerm type="text">editor</roleTerm>
</role>
</name>
<genre type="journal">journal</genre>
<originInfo>
<dateIssued encoding="w3cdtf">200101</dateIssued>
</originInfo>
<identifier type="ISSN">0167-6393</identifier>
<identifier type="PII">S0167-6393(00)X0050-7</identifier>
<part>
<date>200101</date>
<detail type="issue">
<title>Speech Annotation and Corpus Tools</title>
</detail>
<detail type="volume">
<number>33</number>
<caption>vol.</caption>
</detail>
<detail type="issue">
<number>1–2</number>
<caption>no.</caption>
</detail>
<extent unit="issue pages">
<start>1</start>
<end>176</end>
</extent>
<extent unit="pages">
<start>97</start>
<end>112</end>
</extent>
</part>
</relatedItem>
<identifier type="istex">EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC</identifier>
<identifier type="DOI">10.1016/S0167-6393(00)00071-6</identifier>
<identifier type="PII">S0167-6393(00)00071-6</identifier>
<accessCondition type="use and reproduction" contentType="copyright">©2001 Elsevier Science B.V.</accessCondition>
<recordInfo>
<recordContentSource>ELSEVIER</recordContentSource>
<recordOrigin>Elsevier Science B.V., ©2001</recordOrigin>
</recordInfo>
</mods>
</metadata>
<serie></serie>
</istex>
</record>

Pour manipuler ce document sous Unix (Dilib)

EXPLOR_STEP=$WICRI_ROOT/Wicri/Sarre/explor/MusicSarreV3/Data/Istex/Corpus
HfdSelect -h $EXPLOR_STEP/biblio.hfd -nk 001897 | SxmlIndent | more

Ou

HfdSelect -h $EXPLOR_AREA/Data/Istex/Corpus/biblio.hfd -nk 001897 | SxmlIndent | more

Pour mettre un lien sur cette page dans le réseau Wicri

{{Explor lien
   |wiki=    Wicri/Sarre
   |area=    MusicSarreV3
   |flux=    Istex
   |étape=   Corpus
   |type=    RBID
   |clé=     ISTEX:EEC7BEC39C30E248E3F1CB6C672727CA35F39CFC
   |texte=   The MATE workbench – An annotation tool for XML coded speech corpora
}}

Wicri

This area was generated with Dilib version V0.6.33.
Data generation: Sun Jul 15 18:16:09 2018. Site generation: Tue Mar 5 19:21:25 2024