H2PTM (2007) Amato

Enjeux, usages et prospective de la vidéo enrichie à caractère scientifique

De la multimédiatisation à l’hypervisionnage

Titre

Enjeux, usages et prospective de la vidéo enrichie à caractère scientifique : De la multimédiatisation à l’hypervisionnage

Auteurs

Étienne Armand Amato⁽ⁱ⁾, Étienne Perény⁽ⁱⁱ⁾

Affiliations

, (i)Doctorant en 71ème section (info-com)

ATER à l'IUT Robert Schuman (67000)

(i)Paragraphe Paris 8, EA 349, Université Paris 8, Saint-Denis,Île-de-France, France

ea.amato@univ-paris8.fr

(ii)MCF en hypermédia

Directeur de l’Atelier de Vidéomatique

En cours d’affiliation à Paragraphe Paris 8, Département Hypermédia, Université Paris 8, 2, rue de la Liberté, 93526 Saint-Denis, Île-de-France, France

pereny@univ-paris8.fr

Dans: actes du colloque H²PTM 2007 Hammamet; publié dans H²PTM07 : Collaborer, échanger, inventer

Sommaire

1 L’injonction paradoxale proposée par les objets temporels AV sur le Web
2 L’audiovisuel à caractère scientifique : un bon terrain pour la vidéo enrichie
3 L’initiative Canali-Medias, de l’archivage à une prospective des usages
- 3.1 CANALI (V.1.) : une vidéothèque interactive et un environnement de travail
- 3.2 CANALI (V.2.) : un site éditorial et un site expérimental de contribution
4 La manipulation de la vidéo : vers un hypervisionnage ?
5 Bibliographie
6 Notes

Résumé: Avec la généralisation du haut débit, la place croissante de la vidéo sur Internet soulève la question des usages spécifiques qu’elle suscite et peut amener. Aussi, dans un premier temps, cet article exposera les problématiques de fond que les contenus audiovisuels posent en termes d’hypermédiatisation, d’adaptation au Web et d’usages. De là, un domaine particulier, celui des vidéos à caractère scientifique, sera analysé, car il constitue un révélateur des traitements multimédia les plus avancés de la vidéo en ligne. Cette compréhension de l’existant permettra de présenter et discuter les scénarios d’usage innovants d’un site expérimental de médiation audiovisuelle scientifique, Canali-médias, qui autorise notamment la constitution de listes de visionnement.
Mots-clés: média enrichi, vidéo enrichie, documents audiovisuels, médiation scientifique, hypermédiatisation, usages innovants, appropriation, liste de visionnement.

English description

Abstract: As the use of broadband becomes more widespread, the growing prominence of video on the Internet raises questions about its specific actual and potential uses. This article will begin with an exploration of the fundamental issues raised by audiovisual content in terms of hypermediatisation, Web adaptation and its applications. Next, the specific domain of scientific videos will be analysed, as these demonstrate the most advanced multimedia processing in terms of online video. This examination of existing technology will give occasion to present and discuss the innovative ways in which it is being used by an experimental scientific audiovisual media site, Canali-médias, notable for its work on the development of video playlists.
Keywords: enriched media, enriched video, audiovisual documents, scientific mediation, hypermediatization, multimediatization, innovative uses, appropriation, playlist.

L’injonction paradoxale proposée par les objets temporels AV sur le Web

La vidéo en ligne sur le Web contraste avec la liberté offerte par le réseau des réseaux, car elle constitue un « tunnel temporel » à emprunter, une linéarité médiatique contraignante et inconnue. (Stiegler, 1998). Sa présence introduit une tension entre deux modes de consultation exclusifs : l’un spatial, l’autre temporel. Dès lors, faire face à une vidéo mise en page-écran pose à l’utilisateur le dilemme cognitif suivant : faut-il quitter le rapport navigationnel au profit d’une consultation AV ? En raison du coût attentionnel et temporel de cet acte, quel sera le gain en termes de connaissance ou de plaisir ? Et en corollaire, comment rentabiliser cet investissement ? Une première réponse est de privilégier des formats brefs et récréatifs : bandes-annonces, clips, sketchs humoristiques, courts-métrages créatifs ou érotiques^[1]. Pour contrer la volatilité de l’audience, il est aussi possible de transformer la vidéo en l’enrichissant d’informations supplémentaires, spécifiques et dynamiques. L’implicite est qu’il faudrait renforcer son attractivité, en la rendant davantage multimédiatique, comme si elle ne suffisait pas à captiver par elle-même.

Promise dès le milieu des années 90, techniquement possible avec le standard ‘’SMIL’’ dès 1998^[2], la vidéo enrichie en ligne reste pourtant marginale. Pour mieux la définir, il s’agit de vidéos ayant subi deux types de traitements, non exclusifs l’un de l’autre et complémentaires (Chamilliard, 2002) ; (Aubert, 2004) :

segmenter la vidéo en unités sémantiques cohérentes, à la façon du chapitrage des DVD. Ce découpage décompose la continuité AV en passages plus courts, permet leur indexation textuelle (titres, parfois résumés et mot-clef), et crée des points d’accès pertinents, car renseignés, pour regarder d’un clic un moment préjugé intéressant. De la sorte, est fourni un équivalent du sommaire paginé des livres.
synchroniser des médias de toute nature au flux AV, une interface Web permettant d’afficher simultanément plusieurs médias et les réseaux étant en mesure d’acheminer en parallèle des données. Ainsi, sur une surface d’affichage proche de la vidéo, apparaissent et disparaissent, au fil du déroulement AV, illustrations, photographies, diapositives, schémas, explications, définitions, citations, etc.

Un tel dispositif multimédia parie sur les effets de contextualisation, de redondance ou de complémentarité permis par la juxtaposition du « média temporel » principal, la vidéo, avec les « médias instantanés^[3] » secondaires (Amato, 2002). Ce parti pris fait débat, puisqu’il exige de l’internaute une forte attention, au risque de le saturer en lui infligeant une pénible surcharge cognitive (voir l’étude de qualité sur la focalisation attentionnelle AV (Aubert, 2004). Cependant, bien conçu, l’enrichissement multimédia peut susciter une focalisation perceptive et intellectuelle favorable à la compréhension. Il maintient alors attentif un spectateur satisfait de cette richesse et impatient de découvrir les informations intéressantes à venir, que rythment et polarisent différents canaux sensoriels.

L’audiovisuel à caractère scientifique : un bon terrain pour la vidéo enrichie

Une offre bien développée sur le Web francophone existe dans le domaine de la médiation scientifique, grâce à des services audiovisuels compétents et des politiques d’état volontaristes. Le savoir scientifique, jugé ardu et inaccessible, devient plus attrayant et plus humain via la vidéo en ligne. Ces programmes AV, souvent longs, attirent une audience assez curieuse pour prendre le temps de les visionner. En outre, ils sont propices aux opérations d’enrichissement. Côté segmentation, ces discours scientifiques bien structurés facilitent l’opération de découpage temporel et sémantique. Côté multimédiatisation^[4], la relative pauvreté visuelle de l’image, qui montre surtout l’orateur^[5], évite la surcharge visuelle et cognitive entre médias juxtaposés. Enfin, les propos savants se prêtent aux apports de médias synchronisés didactiques et à l’ajout de références documentaires.

Les Archives Audiovisuelles de la Recherche de l’ESCoM et de la FMSH^[6]

Avec une offre de 738 films d’entretiens, séminaires, conférences et reportages classés dans 29 disciplines des sciences humaines et sociales, cette vidéothèque arborescente systématise le recours au découpage, ce premier niveau de l’enrichissement. Pour identifier un film, la navigation se fait par disciplines, noms de chercheurs, formats ou collections, jusqu’à offrir une succession de brèves cartouches informatives. Chacune renvoie à une fiche documentaire plus complète qui précise les crédits, les mots-clefs thématiques, la biographie de l’orateur et le sujet traité^[7]. Quant à la photo miniature du scientifique, elle donne accès à une nouvelle interface dédiée au visionnage, qui place la vidéo à gauche et propose à droite une liste de parties titrées et minutées. Un clic sur l’une d’elles fait jouer le fragment AV souhaité, extrait de la vidéo initiale. La granularité moyenne de ce découpage, de quelques minutes, répond à la contrainte de brièveté du Web et offre une bonne finesse de segmentation temporelle. Le moteur de recherche est l’autre voie d’accès aux contenus, pour découvrir une vidéo entière ou un extrait précis. Ainsi sont exploités les contenus textuels des titres et résumés, en l’occurrence une indexation sémantique initialement réalisée pour les besoins de la navigation. Enfin, les possibilités de l’enrichissement vidéo n’ont pas encore été explorées par ce site.

Canal-U : un portail explorant les possibilités de la vidéo enrichie

Sous l’égide de Canal-U, « Webtélévision de l’enseignement supérieur », douze chaînes thématiques proposent un riche corpus diversifié. Plus que de restituer la variété des interfaces et propositions, il s’agit ici de cerner l’emploi des enrichissements synchronisés. Un mot tout de même sur le découpage. Il aboutit là aussi à des mini-vidéos issues de la vidéo initiale. Elles sont, selon les cas, résumées, minutées, titrées ou seulement numérotées^[8]. Parfois, le découpage se complexifie^[9] en deux niveaux : des parties rassemblent les passages vidéo allant de pair, mais sans former des chapitres consultables en eux-mêmes. D’autre part, un effort de documentation multiplie les références aidant à approfondir un sujet. Venons-en à la multimédiatisation. Sur Les Amphis de France 5 ou sur Entretiens, la synchronisation charrie respectivement des textes explicatifs ou des photographies. Cette dernière chaîne présente d’ailleurs un remarquable travail d’enrichissements visuels utilisant à plein les possibilités du SMIL^[10], y compris pour expérimenter des dispositifs originaux et créatifs. Installations paysagères^[11] fait ainsi s’alterner deux vidéos autour d’une succession de photographies placées au centre de l’écran. Un autre exemple est l’entretien avec Peter Grenaway, où vidéo et traduction française des paroles sont synchronisées dans les deux sens, avec en plus une navigation hypertextuelle interne au texte, le tout au sein de la fenêtre vidéo Real Vidéo. Sur Canal U/Médecine et sur Canalc2.tv^[12], les diapositives de l’intervenant se succèdent au fil d’un discours qu’elles aident à comprendre lorsqu’il s’y réfère. Il aurait fallu sinon les intégrer au film, quitte à supprimer l’image de l’orateur. Ici, la rythmique audiovisuelle produite par les changements de diapos, de plans et de propos, soutient une attention stimulée par les trois linéarités médiatiques offertes (diapo, vidéo, son) qui triangulent et focalisent la pensée, tout en laissant libre de les parcourir et de privilégier celui qui favorise le mieux la compréhension. Une difficulté demeure : avoir une idée de la densité et fréquence des médias synchrones. Si ce n’était les latences d’affichage, il suffirait de s’en remettre à un usage détourné : faire glisser la tête de lecture sur la ligne temporelle pour aller en quête de l’affichage des médias synchrones disponibles^[13]. Canalc2.tv évite ce recours en affichant toutes les diapos en vignettes. Ses vidéos étant dépourvues de découpage rédactionnel, les diapositives en font office en se faisant marqueurs de navigation : cliquer dessus fait se jouer le passage auquel la diapo est synchronisée. Ce principe conteste l’idée que les médias secondaires n’auraient pas d’autres fonctions que d’être vus^[14] et montre qu’ils peuvent être intégrés à un usage. Pour conclure sur Canal-U, les formes de synchronisation multimédiatique qui y sont développées préfigurent des usages qui se serviraient de la linéarité AV comme d’un fil conducteur agrégeant de nombreuses informations pertinentes. Dans ce milieu ouvert, éclaté et hétérogène qu’est le Web, la vidéo enrichie pourrait être le moyen de proposer des parcours structurés articulant discursivement des domaines du savoir difficiles à cerner et à rapprocher. Elle participerait ainsi d’une utile « retemporalisation » d’une spatialité hypermédia^[15] parfois génératrice de confusion.

L’INA et la vidéo enrichie par le texte : la synchronisation semi-automatique

L’INA a choisi de miser sur les rapports de la vidéo et du texte. Cinq émissions thématiques^[16] rassemblent les entretiens réalisés auprès de grandes figures intellectuelles. Dans un module Shockwave, ces longues vidéos bénéficient d’un traitement identique au sein d’une interface homogène. Bien documentées, elles sont découpées en chapitres hyperliés à la vidéo, dont la durée relative est aussi indiquée graphiquement. Durant le visionnage d’un chapitre, l’onglet Entretien permet d’afficher la retranscription écrite du discours de l’orateur. Cependant, étrangement, le texte ne s’actualise pas au fur et à mesure que la vidéo se joue. La commande Afficher la phrase sert justement à mettre à jour ponctuellement le texte. Dans l’autre sens, cliquer sur un paragraphe de la retranscription écrite va actualiser la vidéo sur la parole voulue. Cette formule de synchronisation, parce qu’elle laisse l’internaute libre de voir ou non simultanément le média d’enrichissement, ici du texte, peut être qualifiée de « semi-automatique ». Signalons aussi la possibilité de créer des signets pour soi ou pour autrui, afin de garder trace des passages appréciés. Ces fonctionnalités vont dans le sens d’une meilleure rentabilisation du visionnage, comme d’une prise en compte des potentiels d’Internet en termes de communication virale. Sur le fond, il semble que l’INA ait repris ici certains principes directeurs du DVD, 1+1, une histoire naturelle du sexe^[17], développé par le même Studio Hypermédia. Une retranscription intégrale servait déjà de complément à la vidéo et était utilisée par le moteur de recherche, tandis que le découpage était de même visuellement restitué sous la forme graphique de bandes proportionnelles.

Bilan de l’analyse des sites de médiation des connaissances en vidéo enrichie

Les sites de vidéo scientifique en ligne tirent parti de la capacité de stockage et d’accès du Web, en offrant un large choix de contenus AV. Le parcours de l’utilisateur suit quatre étapes : sélection parmi les catégories proposées, choix de la vidéo au sein d’une liste, accès à une fiche documentaire et visionnage. Domine donc une interactivité de sélection allant du général au particulier. Une fois qu’une vidéo a été visionnée, le site et son environnement présentent des apports spécifiques limités : soit l’internaute va à la recherche d’un autre film, soit il se dirige ailleurs sur le Web. De plus, les interfaces sont centrées sur la consultation, avec peu de fonctionnalités dédiées, hormis celles communes à tous les lecteurs de vidéo. Quant à la mémorisation d’une vidéo ou d’une séquence pour y revenir ultérieurement, voire la partager, elle est déléguée^[18] au navigateur et à ses signets. La posture de l’internaute suscitée par ces sites équivaut donc à celle de l’auditeur libre, qu’il s’agit de maintenir attentif par un foisonnement médiatique, par le nombre de films, mais aussi par les informations annexes. Ainsi, depuis quelque temps, la part des enrichissements tend à se développer, notamment avec les diaporamas, tandis que le découpage se généralise pour offrir à la fois une indexation de la durée et cette forte granularité caractéristique de la consultation brève propre à Internet. Cependant, cette sémantisation de vidéos de mieux en mieux renseignées ne va pas encore dans le sens du « Web sémantique ». En outre, alors que s’imposent les logiques d’usage d’un Web dit 2.0, caractérisé par la participation des internautes sous diverses formes, comme la production de contenus, la contribution ou encore l’évaluation, une limite de l’ensemble de ces systèmes semble être le défaut d’implication de l’utilisateur, qui est, de fait, peu mobilisé. Aucune activité cognitive productrice de sens formalisée ne lui est demandée : il lui suffit de trouver et de consommer la bonne vidéo (Yamamoto, 2005). Cependant, les progrès réalisés sur support local semblent progressivement migrer vers le Réseau, comme s’y efforce l’INA. La marge de progression reste grande pour atteindre la maturité d’un 1+1 : quid de la mise en rapport des passages vidéo, de la mémorisation du parcours, de l’appropriation personnelle^[19], avec la prise de note et l’organisation d’extraits ? Une explication tient à la difficile maîtrise technologique du Web, avec des standards, normes et solutions propriétaires évolutives et instables, et aux forts coûts de développement et de maintenance.

L’initiative Canali-Medias, de l’archivage à une prospective des usages

L’analyse de deux prototypes fonctionnels va permettre d’exposer des voies exploratoires essayant de dépasser ces limitations. Résultant d’une recherche-action menée depuis 4 ans par l’Atelier de Vidéomatique^[20] du LEDEN^[21], ces dispositifs audiovisuels interactifs mettent en place des fonctionnalités avancées, s’appuyant sur une prospective des usages de la vidéo interactive. En plus de valoriser des vidéos de médiation scientifique se consacrant au multimédia, les deux versions successives de Canali-médias^[22] abordent deux axes principaux : instrumenter une meilleure appropriation des vidéos par les internautes (Bachimont, 1998) ; créer une circulation en ligne entre activités de visionnage, de lecture et de contribution.

CANALI (V.1.) : une vidéothèque interactive et un environnement de travail

Cette version initiale, réalisée entre 2002 et 2005, utilise une solution Shockwave (comme le font les entretiens de l’INA) pour mettre à disposition une vidéothèque interactive en ligne qui s’articule autour de trois visualiseurs complémentaires, servant à sélectionner, à visionner et à rechercher les vidéos. D’abord, i-Select aide à découvrir des vidéos réparties par formats (Conférences, Interventions, Interviews, Démos), contextes de réalisation (Rencontres Médias de Paris 8 ou Prix Möbius) et années. Basé sur ces catégories, un menu de sélection affiche les vignettes des vidéos correspondantes dans un bandeau horizontal. En plus d’informations concises, à leur survol du pointeur, un bref résumé précise la nature du sujet traité, invitant à faire un clic. Lorsqu’une vidéo est choisie, l’interface de i-Consult apparaît. Avec la fenêtre vidéo placée à gauche et le contenu rédactionnel à droite, l’internaute comprend qu’il a affaire à un film segmenté en chapitres et subdivisé en séquences titrées et résumées. Il s’aperçoit vite qu’il existe une synchronisation bidirectionnelle entre la vidéo et le texte. L’avancement du film met automatiquement à jour le texte à chaque changement de séquence, alors que cliquer sur le texte d’une autre séquence repositionne la vidéo sur celle-ci. En outre, le plan de la conférence peut rapidement être survolé en faisant défiler verticalement la partie textuelle. Quant à lui, le lecteur vidéo est démuni des commandes habituelles, pour être seulement encadré de deux lignes verticales. L’une fait office de niveau sonore, l’autre, de ligne temporelle, sur laquelle descend la tête de lecture à mesure du déroulement. Ne pas disposer cette ligne à l'horizontale provient d’une volonté de rompre avec l’ergonomie classique et avec l’instinctif réflexe consistant à repositionner la tête de lecture ailleurs pour voir la suite. Il s’agit aussi de montrer, par la régulière remontée en haut de la ligne de temps verticale que fait la tête de lecture à chaque changement de séquence, que les unités AV s’enchaînent les unes après les autres et que l’intégrité de la vidéo est entière. Enfin, le module i-Recherche aide à identifier des vidéos pertinentes selon deux modes : par des requêtes rédigées qui utilisent les retranscriptions en texte intégral des discours stockées dans une base de données ou par la sélection de mots-clefs au sein de trois critères possibles, Orateur, Genre, Thème indexant les vidéos. Jusque-là, hormis les rapports textes-images et les interfaces déclinées selon une même charte graphique et ergonomique, ce site est à première vue dans la continuité de l’existant. Mais à y regarder de plus près, au sein du module de visionnage i-Consult, une zone intitulée constitution de listes signale une fonctionnalité transversale qui sert de base à plusieurs modes d’appropriation plus avancés. Il s’agit de la possibilité de prélever d’un clic, soit la vidéo entière, soit le chapitre, soit la séquence visionnée, pour les intégrer dans une liste de visionnement^[23] qui les juxtapose dans l’ordre de leur capture, grâce à des données XML cachées. Une fois entamée, la collecte de passages vidéo peut concerner toutes les vidéos du corpus, sans aucune limitation, à la façon d’un panier de téléachat^[24]. Dès qu’il a complété son recueil vidéo, l’utilisateur l’enregistre à l’aide d’un gestionnaire de listes et crée à cette occasion son compte personnel. Par la suite, il pourra à loisir charger dans i-Consult l’une de ses listes. Celle-ci se jouera alors en enchaînant les diverses unités AV prélevées, toujours accompagnées de leur enrichissement textuel synchrone. Ces listes de visionnements audiovisuelles réalisent donc un véritable montage virtuel, servant à de nombreux usages, allant de la simple conservation du parcours de visionnage effectif, au réagencement de discours tenus par différents intervenants selon un thème ou une problématique les articulant ou les confrontant. Dans ce dernier cas, voir l’un des « films » produits par ses propres soins revient à s’émanciper de la linéarité AV de la vidéo d’origine et à exploiter pleinement les potentialités du découpage, base de toute appropriation de longs discours AV. ‘’Un peu de travail personnel ? Fabrication de notes, d’albums et de présentations’’ Allant plus loin vers une appropriation productive, un environnement de travail intitulé i-T est téléchargeable en local. Il aura cependant besoin d’une connexion à Internet pour dialoguer avec le serveur de vidéos et de données XML. Il présente une interface dérivée de celle du site en ligne, qui en reprend les principes. Toujours selon la même logique modulaire, où le fruit des précédentes activités est réutilisé, le module i-Note sert d’abord à charger une liste pour visionner son film virtuel et prendre à son sujet des notes au fil du flux. En plus du rédactionnel des séquences, i-Note affiche des images fixes ou textes (citations, définitions) d’enrichissement synchronisés au flux vidéo. L’ergonomie du travail se base ici sur la notion de capture. Une séquence regardée, une image ou un texte synchrone, une note rédigée peuvent être prélevés pour être mémorisés au sein d’une colonne les figurant. Cette succession de captures est bien sûr enregistrable et rechargeable, pour reprise ultérieure. À l’issue de cette étape, le module i-Album sert à finaliser les annotations brutes pour les corriger et les améliorer, tout en réagençant l’ordre des composants médiatiques capturés auxquelles elles se réfèrent. Plusieurs sessions de prises de notes peuvent aussi être chargées en même temps, pour rassembler et fusionner des notes et extraits basés sur des montages virtuels différents, en visionner le contenu et vérifier la pertinence de leur enchaînement. Une fois mis au propre et réorganisé, un album achevé peut être exporté vers le dernier module, i-Present, qui le transforme en une série de diapositives. Ce diaporama place à gauche les notes rédigées et à droite la séquence vidéo ou l’enrichissement y correspondant. Ces diapositives permettront de mettre en écran le texte et l’image^[25] et de régler des extraits déterminés au sein d’une séquence, pour faire une citation audiovisuelle. Quatre phases d’appropriation sont donc scénarisées : fabrication de vidéos virtuelles grâce aux listes de visionnement, saisie de notes et de captures, organisation d’albums et finalisation sous la forme de diaporamas partageables. À travers ces étapes, s’opère un renversement de la position d’usage. Au départ spectateur, l’usager a butiné le découpage des films pour composer sous la forme de listes sa sélection de passages AV. Durant la prise de note, l’usager subit encore le défilement de sa vidéo virtuelle pour la commenter par écrit. En plus, il capture, outre ses propres notes, des séquences et enrichissements visuels ou textuels. Avec les albums intervient le moment de bascule : ce n’est plus la vidéo qui est centrale et qui guide le travail, mais bien la succession des annotations et captures. Enfin, la présentation en diaporama finit de mettre en avant les notes, devenues le fil conducteur d’un discours illustré par les extraits vidéo et images capturés. Partant du site en ligne pour conduire à l’environnement téléchargeable, ce processus d’appropriation canalise l’activité de l’internaute, qui peut approfondir d’étape en étape, comme s’arrêter au niveau qui lui convient. Ce scénario finalisé et prescriptif s’avère bien adapté au contexte pédagogique lors, par exemple, d’un exercice commandité de prise de note avec des enjeux réels, comme réussir la présentation publique d’un travail de réflexion personnelle mené sur tout ou partie du corpus. Outre le fait d’autoriser une appropriation effective des savoirs, les essais réalisés avec ce prototype opérationnel autorisent à envisager une valorisation collective des activités individuelles allant dans le sens des logiques de partages propres au Web 2.0. Les vidéos virtuelles, comme les notes, albums ou présentations, toutes traités en fichiers XML indépendants, pourraient profiter à la communauté des usagers. Ces productions personnelles signifiantes (Weissberg, 2002) seraient même réinjectables au sein du système pour être mises en rapport entre elles, autant qu’avec le contenu éditorial^[26] du site. Parce que ces parcours d’usage indexent à leur façon les contenus et concrétisent les plus-values de sens résultant des interactions avec le dispositif audiovisuel interactif (Aubert, 2005), ils sont capables de servir de base à l’émergence d’une Matrice des Connaissances Appropriées, dont la sémantique s’auto-organiserait à l’aide des intrants et des extrants produits par les membres. Cela est loin d’être utopique, en témoignent les méthodes de qualification des contenus déléguées aux audiences, déjà en place sur les sites de partage de vidéo en ligne, avec les statistiques de visites et de votes^[27].

CANALI (V.2.) : un site éditorial et un site expérimental de contribution

Parmi les limites constatées de la version 1, les expérimentations ont montré que la variété des contenus présents était insuffisamment perceptible en raison d’une vidéothèque interactive trop axée sur des mécanismes temporels. Ainsi, les contenus rédactionnels synchronisés à la vidéo ne sont accessibles qu’au sein du module de consultation et il semblait utile de les « mettre à plat » pour les valoriser. Un site éditorial Web de type dynamique, intitulé i-Info, a été créé pour mettre en fiches documentaires les vidéos, leurs textes et leurs références (biographie, bibliographie et webographie) et pour assurer une navigation hypertextuelle. La documentation concerne, en plus du corpus des vidéos éditées, la prise en main du système et la recherche-action elle-même (enjeux, moyens, objectifs, résultats). Gardant ses principes fondamentaux, la vidéothèque interactive profite d’une adaptation plus actuelle en Flash de ses trois visualiseurs basiques et du flux vidéo mis en flv. Le moteur de recherche offre des résultats plus fins, à la séquence près, qui facilitent la constitution rapide de listes de visionnement pertinentes. L’environnement de travail i-T lui a été ramené au rang de module expérimental accessible sur demande, en raison d’un constat de résistance à son usage trop finalisé. L’ensemble devient du coup d’un abord plus simple et plus classique. Par ailleurs, l’apport majeur de ce déploiement Web consiste à autoriser une circulation entre le site éditorial et la vidéothèque. Ainsi, la fiche documentaire Web peut lancer le module i-Consult pour un visionnage, de même qu’un menu info+ renvoie depuis la vidéothèque interactive vers la fiche et ses nombreuses références, parmi lesquelles les « vidéos connexes » du corpus, qui sont en rapport avec le sujet scientifique traité. L’autre développement encore expérimental attaque le volet contributif. La partie du site Web appelée i-Contrib implémente un WikiMédia adapté à l’enrichissement de vidéos déjà temporellement découpées, mais encore à compléter. Il s’agit de leur apporter un rédactionnel pertinent (titre et résumé des chapitres et séquences) ainsi que des références documentaires, pour que chacun puisse, y compris les intervenants filmés, documenter la vidéo. Cette ouverture est une réponse au problème récurrent du coût de production de la vidéo enrichie et du travail éditorial qu’il faut partager au sein d’une communauté la plus large possible pour qu’il devienne simplement possible. Cette deuxième version ainsi restructurée est en passe de devenir un site d’expérimentation pour tester les techniques et les usages de l’approche contributive et communautaire. Il évaluera le degré de maturité des fonctionnalités avancées au regard des besoins et motivations de milieux scientifiques qui s’en empareraient, celui du multimédia ou des sciences humaines, et la capacité des destinataires à proposer des contributions AV et rédactionnelles.

La manipulation de la vidéo : vers un hypervisionnage ?

Ce panorama analytique de la vidéo en ligne met en évidence la lenteur avec laquelle se définissent les nouveaux usages dans le cas de médias subissant de forts déterminismes historiques et socioculturels. Les médias enregistrés demeurent encore souvent intacts sur le Web, car toujours auréolés des usages respectueux qu’ils suscitaient sur leur médium d’expression d’origine. Leur intégrité est préservée : il s’agit de voir une photo, d’écouter une musique, de regarder une vidéo. S’illustre là l’analyse faite par Mc Luhan (McLuhan, 1977) qui estimait qu’un nouveau médium absorbe d’abord le précédent en en conservant dans un premier temps les caractéristiques initiales, avant de l’adapter progressivement à ses nouvelles possibilités, ce dont cet article cherche à donner des aperçus concrets. Si la vidéo enrichie est une forme spécifique du Web, elle n’exprime encore que faiblement ses capacités, tout en commençant à doter la vidéo de trois apports sur lesquels de nouveaux usages peuvent se fonder : le découpage, la synchronisation et la documentation. Notamment pour des raisons économiques, elle arrive péniblement, mais sûrement, à ce stade multimédiatique qu’est l’enrichissement AV. Pour aller vers une hypermédiatisation plus poussée, la vidéo enrichie ne peut que se fonder sur ses traits saillants, qui tiennent dans une gestion de l’attention, de l’information et du temps. Les avancées produites par l’initiative Canali-médias peuvent inspirer des suites allant dans le sens d’une implication plus concrète et finalisée envers la vidéo. Avec une simple logique de panier et quelques principes de manipulation simples, il apparaît d’ores et déjà possible de proposer des fonctionnalités poussées, et compréhensibles, car en phase avec les pratiques entourant les objets temporels numériques (musique, vidéos récréatives). De la sorte, en créant les moyens d’opérer des rapprochements et enchaînements entre des passages audiovisuels issus de différentes vidéos, ce n’est pas tant la figure de l’hypervidéo qui se dessine (Aubert, 20045) que celle d’un hypervisionnage, défini comme mise en rapport de contenus audiovisuels distincts ou hétérogènes assurée par l’utilisateur afin de les visionner selon une logique sémantique finalisée. Qu’une réception de type « hyper » soit possible à partir d’un média linéaire, dès lors qu’il a été fragmenté, indexé, enrichi et adapté au médium informatique en réseau paraît naturel, car ce sont là quatre étapes permettant une hypermédiatisation poussée, entendue comme mise en réseau de médias interactivement manipulables. Resterait à dépasser le paradigme « hyper », fondé sur la liaison entre des données hétérogènes, au profit d’un retour éclairé au paradigme « cyber », centré sur la notion de contrôle systémique, comme les chercheurs de l’hypertexte l’ont fait en parlant de « cybertexte » et de « cyberlittérature » (Clément, 2000). Cela permettrait une meilleure prise en compte de l’ensemble des modifications qu’un média subit dès lors qu’il est simulé par un ordinateur connecté. Il bénéficie alors non seulement d’une puissance de calcul, de visualisation, de manipulation, mais aussi des effets intersubjectifs et intermachiniques du réseau. Décidément, la simple sélection et le pointage actif de contenus hypermédiatiques ne peut résumer les riches interactivités autorisées par les deux rapports cybermédiatiques en jeu, l’un logiciel et endogène, l’autre humain et exogène, qui chacun détermine par rétroaction la forme de l’échange réflexif noué entre l’humain et la machine universelle qu’est l’ordinateur.

Bibliographie

[Amato, 2002] ↑ Amato E.A., « De la consultation à la production de contenus en vidéo interactive enrichie sur Internet », Compte-rendu de rapport de recherche, Projet MOTIF, partenariat Wanadoo Edition/Paris 8, Réseau RNTL n°99T 0536, novembre 2002

[Aubert, 2005] ↑ Aubert O. et Prie Y., « Des hypervidéos pour créer et échanger des analyses de documents audiovisuels », in I.SALEH et J.CLEMENT (Dir) Créer, jouer, échanger, expériences de réseaux, actes du colloque H2PTM’05, Hermès, Paris, 2005, pp 409-420

[Aubert, 2004] ↑ Aubert O. et Prie Y., « Documents audiovisuels instrumentés – Temporalités et détemporalisations dans les hypervidéos », Documents Numérique : numéro spécial Temps et document numérique, 2004, p. 143-168.

[Bachimont, 1998] ↑ Bachimont B., « Bibliothèques numériques audiovisuelles : des enjeux scientifiques et techniques », Document numérique, 2-3, pp. 219-242

[Chamilliard, 2002] ↑ Chamilliard D., « La vidéo sur le web (streaming, webcasting et rich media) », CampusPress, Paris, 2002

[Clément, 2000] ↑ Clément J., « Hypertexte et Complexité », in Internet et littérature, nouveaux espaces d'écritures, Montréal, Études Françaises, Mars 2000, pp. 39-57

[McLuhan, 1977] ↑ McLuhan M., « D’œil à oreille : la nouvelle galaxie », Denoël, Paris, 1977

[Pereny, 1988] ↑ Pereny E. et Mazeau J.-P., « Mise en œuvre et évaluation de fonctionnalités multi-sources/multi-médias », rapport d’étude, CCETT-Centre de Recherches Paris 8, Rennes-Saint-Denis, 1988

[Rieder, 2006] ↑ Rieder B., « Métatechnologies et délégation. Pour un design orienté-société dans l'ère du Web 2.0 », Thèse de doctorat en Sciences de l’Information et de la Communication, Paris 8, 2006

[Simondon, 1989] ↑ Simondon G., « Du mode d’existence des objets techniques », Aubier Paris, 1989

[Stiegler, 1998] ↑ Stiegler B., « Les enjeux de la numérisation des objets temporels », in Beau F., Dubois P.; et Leblanc G. (dir.), Cinéma et dernières technologies, 1998, p. 83-102

[Weissberg, 2002] ↑ Weissberg J.-L., « Couper-coller n'est pas plagier », revue Critique, n°663-664 août-sept 2002, pp.713-724

[Yamamoto, 2005] ↑ Yamamoto Y. et all, « The Landscape of Time-based Visual Presentation Primitives for Richer Video », in Experience INTERACT 2005, M.F. Costabile, F. Paterno (Dir.), Rome, Italie, Springer, septembre 2005, pp.795-808

Notes

↑ L’histoire des médias montre que la pornographie est à la pointe au niveau technique, grâce à des investissements garantis par des audiences élevées et solvables.
↑ Le Synchronised Multimédia Integration Language date du 15 juin 1998 (http://www.w3.org/TR/REC-smil) et en est bientôt à sa V. 3.0
↑ La notion de médias instantanés (texte, image fixe) s’oppose à celle de média temporel (vidéo), à moins de se baser sur la distinction espace/temps et les appeler médias spatiaux.
↑ Contrairement à l'hypermédiatisation, qui procède par intégration d’ancres et de liens entre médias de tout type, la multimédiatisation s’en tient à combiner texte, image et son. http://perso.limsi.fr/jacquemi/COGNITIQUE02/entVisuTextes-definitif.html [18/06/07]
↑ Quoique de plus en plus de montages alternent diaporama, vues de la salle et orateur.
↑ http://semioweb.msh-paris.fr/AAR/FR/ [site consulté le 20 mars 2007]
↑ À quelques exceptions près, elle est dépourvue de références complémentaires
↑ Certaines chaînes renoncent au découpage, comme Canal U/Médecine
↑ Sur les chaînes Entretiens et Science en cours
↑ Langage de description temporel bien exploité par les solutions logicielles de Real Vidéo
↑ http://www.canal-u.education.fr/entretiens/1785092967/html/index_ns.htm [le 15/04/07]
↑ Abréviation de la chaîne Colloques et Conférences, traitant de multiples disciplines.
↑ Ce défaut de signalisation des enrichissements légitime presque la solution minimaliste adoptée par BioTV et Canal Géo : les diapositives et illustrations sont asynchrones et affichées dans un cadre. C’est à l’internaute d’établir mentalement leur rapport avec la vidéo.
↑ Le problème d’une telle option est que de nombreuses vidéos n’ont pas de diaporama et n’offrent de ce fait aucun découpage, ce qui limite la généralisation de ce parti pris.
↑ Cette idée générale avait déjà été évoquée au cours des journées d’étude « Réseaux d’information et non-linéarité » du groupe Réseaux de la SFSIC, qui s’est tenue à Bordeaux le 21 septembre 2001. (Actes parus aux éditions de la MSH Aquitaine)
↑ http://www.ina.fr/archivespourtous/index.php?vue=entretien [page lue le 20/06/07] (rq : cette offre très intéressante est peu visible dans le foisonnement des contenus du site ina.fr.)
↑ Pour une présentation détaillée de ce titre paru en 2003, avec quelques captures d’écran : http://www.hyptique.net/hnet3/catalogue/prod5.php [page lue le 20/06/07]
↑ Dans le sens analysé par Bernhard Rieder dans sa thèse centrée sur ce concept (Rieder, 2006)
↑ 1+1 permet de composer des commentaires personnels et de sélectionner des extraits dans la banque vidéo. Un développement vers un système distribué de pratique en réseau du type d’Advene (Aubert, 2005) serait pertinent pour partager ses apports individuels
↑ Structure de recherche appliquée et technologique (http://videomatique.univ-paris8.fr)
↑ Laboratoire d’Evaluation et de Développement pour l’Edition Numérique, dirigé par Ghislaine Azémard, professeur des universités en Hypermédia à Paris 8.(www.leden.org)
↑ www.canali-medias.net, avec le soutien de la Direction de la Technologie du Ministère de la Recherche (appel à projet 2004 : « Création de produits de médiation scientifique en libre accès sur l'Internet »), se fait en partenariat avec la MSH Paris Nord (www.mshparisnord.org) et avec la plate-forme Arts, Sciences, Technologies (www.plate-forme-ast.mshparisnord.org).
↑ Le visionnement évoque davantage le regard critique et l’implication technique envers le film, c’est-à-dire ici la manipulation instrumentale. (www.granddictionnaire.com)
↑ Ce prototype a été modélisé à partir d’une solution OSCommerce en partie détournée
↑ Juliette Raabe et Étienne Pereny, « De la page écran à l'écran texte/image » in Laufer, Roger (dir), Le Texte et son inscription, Éditions du CNRS, 1989, pp.207-221
↑ Par l’adjectif éditorial, il faut entendre tout ce qui a été édité par l’instance de publication.
↑ Les références que sont devenus dans ce domaine youtube et dailymotion en systématisent l’emploi, avec la création automatique de liens produits par l’agrégation d’avis subjectifs

[1] L’histoire des médias montre que la pornographie est à la pointe au niveau technique, grâce à des investissements garantis par des audiences élevées et solvables.

[2] Le Synchronised Multimédia Integration Language date du 15 juin 1998 (http://www.w3.org/TR/REC-smil) et en est bientôt à sa V. 3.0

[3] La notion de médias instantanés (texte, image fixe) s’oppose à celle de média temporel (vidéo), à moins de se baser sur la distinction espace/temps et les appeler médias spatiaux.

[4] Contrairement à l'hypermédiatisation, qui procède par intégration d’ancres et de liens entre médias de tout type, la multimédiatisation s’en tient à combiner texte, image et son. http://perso.limsi.fr/jacquemi/COGNITIQUE02/entVisuTextes-definitif.html [18/06/07]

[5] Quoique de plus en plus de montages alternent diaporama, vues de la salle et orateur.

[6] ttp://semioweb.msh-paris.fr/AAR/FR/ [site consulté le 20 mars 2007]

[7] À quelques exceptions près, elle est dépourvue de références complémentaires

[8] Certaines chaînes renoncent au découpage, comme Canal U/Médecine

[9] Sur les chaînes Entretiens et Science en cours

[10] Langage de description temporel bien exploité par les solutions logicielles de Real Vidéo

[11] ttp://www.canal-u.education.fr/entretiens/1785092967/html/index_ns.htm [le 15/04/07]

[12] Abréviation de la chaîne Colloques et Conférences, traitant de multiples disciplines.

[13] Ce défaut de signalisation des enrichissements légitime presque la solution minimaliste adoptée par BioTV et Canal Géo : les diapositives et illustrations sont asynchrones et affichées dans un cadre. C’est à l’internaute d’établir mentalement leur rapport avec la vidéo.

[14] Le problème d’une telle option est que de nombreuses vidéos n’ont pas de diaporama et n’offrent de ce fait aucun découpage, ce qui limite la généralisation de ce parti pris.

[15] Cette idée générale avait déjà été évoquée au cours des journées d’étude « Réseaux d’information et non-linéarité » du groupe Réseaux de la SFSIC, qui s’est tenue à Bordeaux le 21 septembre 2001. (Actes parus aux éditions de la MSH Aquitaine)

[16] ttp://www.ina.fr/archivespourtous/index.php?vue=entretien [page lue le 20/06/07] (rq : cette offre très intéressante est peu visible dans le foisonnement des contenus du site ina.fr.)

[17] Pour une présentation détaillée de ce titre paru en 2003, avec quelques captures d’écran : http://www.hyptique.net/hnet3/catalogue/prod5.php [page lue le 20/06/07]

[18] Dans le sens analysé par Bernhard Rieder dans sa thèse centrée sur ce concept (Rieder, 2006)

[19] 1+1 permet de composer des commentaires personnels et de sélectionner des extraits dans la banque vidéo. Un développement vers un système distribué de pratique en réseau du type d’Advene (Aubert, 2005) serait pertinent pour partager ses apports individuels

[20] Structure de recherche appliquée et technologique (http://videomatique.univ-paris8.fr)

[21] Laboratoire d’Evaluation et de Développement pour l’Edition Numérique, dirigé par Ghislaine Azémard, professeur des universités en Hypermédia à Paris 8.(www.leden.org)

[22] www.canali-medias.net, avec le soutien de la Direction de la Technologie du Ministère de la Recherche (appel à projet 2004 : « Création de produits de médiation scientifique en libre accès sur l'Internet »), se fait en partenariat avec la MSH Paris Nord (www.mshparisnord.org) et avec la plate-forme Arts, Sciences, Technologies (www.plate-forme-ast.mshparisnord.org).

[23] Le visionnement évoque davantage le regard critique et l’implication technique envers le film, c’est-à-dire ici la manipulation instrumentale. (www.granddictionnaire.com)

[24] Ce prototype a été modélisé à partir d’une solution OSCommerce en partie détournée

[25] Juliette Raabe et Étienne Pereny, « De la page écran à l'écran texte/image » in Laufer, Roger (dir), Le Texte et son inscription, Éditions du CNRS, 1989, pp.207-221

[26] Par l’adjectif éditorial, il faut entendre tout ce qui a été édité par l’instance de publication.

[27] Les références que sont devenus dans ce domaine youtube et dailymotion en systématisent l’emploi, avec la création automatique de liens produits par l’agrégation d’avis subjectifs

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

H2PTM (2007) Amato

Sommaire

L’injonction paradoxale proposée par les objets temporels AV sur le Web

L’audiovisuel à caractère scientifique : un bon terrain pour la vidéo enrichie

Les Archives Audiovisuelles de la Recherche de l’ESCoM et de la FMSH^[6]

Canal-U : un portail explorant les possibilités de la vidéo enrichie

L’INA et la vidéo enrichie par le texte : la synchronisation semi-automatique

Bilan de l’analyse des sites de médiation des connaissances en vidéo enrichie

L’initiative Canali-Medias, de l’archivage à une prospective des usages

CANALI (V.1.) : une vidéothèque interactive et un environnement de travail

CANALI (V.2.) : un site éditorial et un site expérimental de contribution

La manipulation de la vidéo : vers un hypervisionnage ?

Bibliographie

Notes

Menu de navigation

Affichages

Outils personnels

Navigation

Rechercher

Outils

H2PTM (2007) Amato

Sommaire

L’injonction paradoxale proposée par les objets temporels AV sur le Web

L’audiovisuel à caractère scientifique : un bon terrain pour la vidéo enrichie

Les Archives Audiovisuelles de la Recherche de l’ESCoM et de la FMSH[6]

Canal-U : un portail explorant les possibilités de la vidéo enrichie

L’INA et la vidéo enrichie par le texte : la synchronisation semi-automatique

Bilan de l’analyse des sites de médiation des connaissances en vidéo enrichie

L’initiative Canali-Medias, de l’archivage à une prospective des usages

CANALI (V.1.) : une vidéothèque interactive et un environnement de travail

CANALI (V.2.) : un site éditorial et un site expérimental de contribution

La manipulation de la vidéo : vers un hypervisionnage ?

Bibliographie

Notes

Menu de navigation

Rechercher

Les Archives Audiovisuelles de la Recherche de l’ESCoM et de la FMSH^[6]