Chapitre I : Introduction
Depuis une décennie, les progrès en informatique sont tels que le monde du
multimédia a pris un essor considérable. Avec l'avènement du Web, l'évolution
du matériel, les besoins en traitement et en diffusion de l'information sont
de plus en plus importants. De nombreux travaux portent aujourd'hui autour de
ces thèmes. Ils concernent la création de périphériques adaptés à la
présentation de ces informations, la définition de réseaux haut débit pour
transporter l'information ou la spécification de standards pour encoder
l'information et favoriser ainsi les échanges entre les personnes.
Mais, paradoxalement, peu de travaux portent sur l'édition de ces
informations. L'édition consiste à agencer et intégrer un ensemble de données
numériques, appelées médias, de nature diverse (son, vidéo, image,). Un
tel processus est nécessaire lorsqu'une personne souhaite créer ou télécharger
des médias puis les assembler pour écrire, par exemple, une page Web. De la
même manière, un institut ou une entreprise qui veut utiliser le Web pour
diffuser de l'information sera confronté à une phase d'édition. On comprend
alors que dans de nombreuses situations, l'information doit être structurée et
mise à jour régulièrement.
Avec l'apparition d'informations de plus en plus riches, les documents qui
les contiennent deviennent de plus en plus complexes et difficiles à
spécifier. De documents purement textuels il y a quelques années, on est
arrivé aujourd'hui à des documents interactifs et temporisés. Par la suite,
nous appellerons document multimédia tout document composé de médias de
différents types, et dont la présentation comporte une composante spatiale,
hypertexte mais aussi temporelle. Il devient donc indispensable que l'auteur
soit aidé dans cette tâche d'édition par un logiciel. Ces logiciels seront
appelés par la suite environnements auteur ou environnements
d'édition.
Afin de rendre la création de documents multimédias accessible à tous, il
est nécessaire de proposer des environnements auteur permettant à tout
un chacun (sans supposer de compétences informatiques particulières) d'éditer
des documents multimédias.
2. Conception et édition de documents
multimédias
Le processus d'élaboration d'un document multimédia que ce soit dans un
contexte professionnel ou familial suit les mêmes étapes [Bollard99], même si
certaines de ces étapes sont plus ou moins complexes et développées en
fonction du contexte. Par exemple, si nous faisons le parallèle avec
l'écriture de documents HTML, dans un contexte familial l'auteur crée
empiriquement la structure de son document alors que dans le cas d'un site
professionnel cette structure est formalisée préalablement.
De façon générale, le processus de conception d'un document multimédia
nécessite la participation de plusieurs personnes : les personnes du marketing
qui décident du contenu à mettre en avant, les graphistes qui réalisent les
illustrations, et enfin les techniciens qui mettent en oeuvre le document. Plus
précisément, ce processus de conception peut être décomposé en sept étapes
:
- Apparition d'une idée de document à produire ou commande d'un
document.
- Clarification de cette idée : à partir de l'idée initiale il
faut dégager des informations comme les objectifs de la présentation, le
type de public concerné, les fonctionnalités attendues, le choix de
support de communication utilisé. Un synopsis permet de mettre en
forme l'ensemble des réponses aux questions précédentes.
- Ecriture du scénario : une fois que l'on a décrit l'objectif du
document, il faut préciser les moyens et les méthodes pour y arriver :
quelle stratégie utiliser pour l'exploration des informations ou la
navigation dans le document.
- Ecriture du scénarimage (story-board) : il décrit de manière
visuelle le résultat graphique attendu. Il permet d'identifier les
médias utilisés ainsi que l'interactivité à attacher à ces médias.
- Réalisation de la maquette : à la fin de l'écriture du
scénarimage, on réalise une maquette qui permet de tester un scénario et
d'avoir une première idée du document dans sa forme finale. À partir de
cette maquette, on peut choisir de remettre en cause des choix faits
précédemment. Actuellement dans un contexte commercial la réalisation de
cette maquette est laissée aux soins des informaticiens et nécessite une
description très précise du scénarimage et du scénario.
- Production du document: une fois les choix faits, il ne reste
plus qu'à produire le document. Cette phase se décompose en deux
sous-tâches :
- Création ou collecte des médias qui composeront le document, cette
phase est généralement réalisée par des graphistes.
- Assemblage des différents médias pour constituer le document.
- Diffusion: une fois le document produit, il est diffusé. Cette
diffusion peut être réalisée par l'intermédiaire de CDROM ou via le
Web.
Au cours de cette thèse nous nous intéresserons essentiellement aux trois
dernières étapes de ce processus, c'est-à-dire à la production du document
proprement dite. Nous n'oublierons cependant pas, qu'au cours de cette
production, des remises en cause du scénario ou du scénarimage peuvent arriver
à tout moment. Un des objectifs de la thèse sera de rendre accessible la
réalisation de la maquette à des non-informaticiens et plus particulièrement
aux personnes qui écrivent le scénarimage.
3.Représentation d'un document multimédia
dans un contexte d'édition
Avant d'aller plus loin dans cette thèse nous allons décrire les différentes
représentations que peut prendre un document au cours du processus d'édition :
- La structure interne du document: elle représente le document
au sein de l'environnement auteur. Le système d'édition permettra à
l'auteur de manipuler cette structure de données au travers de fonctions
d'édition. Nous appellerons par la suite formalisme d'édition
l'ensemble des informations que l'auteur perçoit de la structure interne
du document.
- Format de sauvegarde: il permet de stocker le document dans un
fichier. Ce format peut être un format propriétaire du système auteur
(Madeus [Layaïda97], Director [Macromédia-Director00]) ou il peut être
un des standards de sauvegarde (SMIL [SMIL98]). Ce fichier contient les
informations liées à l'édition du document et à l'environnement auteur,
mais il peut aussi contenir les informations de présentation du
document.
- Format de restitution: représente le document dans une (ou
plusieurs) forme(s) distribuée(s) aux lecteurs. Dans le cas d'une
diffusion pour plusieurs périphériques (téléphones mobiles, ordinateurs,
assistants personnels) deux types de distribution sont possibles :
- la première solution consiste à distribuer un fichier par
périphérique, c'est la solution communément utilisée aujourd'hui
;
- la deuxième solution consiste à fournir un fichier qui contient
les informations pour plusieurs périphériques, on dit dans ce cas,
que le document est adaptable.
Le fichier de restitution peut être :
- Un programme directement exécutable par le système d'exploitation de
la machine ou interprétable par une machine virtuelle (Java).
- Un fichier interprétable par un logiciel spécifique :
- Un fichier textuel, écrit dans une forme déclarative (HTML,
SMIL, Madeus) ou non (Postscript). L'émergence de standards comme
XML permet d'homogénéiser la manière de décrire des structures de
données et en particulier des documents. Ceci afin de faciliter le
partage des données.
- Un fichier binaire (AVI, MPEG).
Ce fichier de présentation doit contenir les informations de présentation,
mais il peut aussi contenir les informations d'édition qui ont mené à
cette présentation de manière à permettre la réédition.
Equivalence de représentation
Par la suite nous dirons que deux représentations du document sont
équivalentes pour l'édition, si l'auteur a le même pouvoir d'édition
avec les deux représentations. C'est-à-dire qu'il peut réaliser la même
opération d'édition élémentaire (ajout d'objet, changement d'attribut) sur les
deux représentations, tout en obtenant la même présentation finale. Dans le
cadre des logiciels propriétaires les trois représentations sont équivalentes
et/ou confondues, c'est le cas du format interne de Word et du format de
fichier ".doc". Par contre, un utilisateur de Word qui a exporté son
document en HTML n'aura pas le même pouvoir d'édition suivant qu'il édite le
document au format HTML ou le document au format Word. En effet, s'il insère
une figure au début de son document Word, tous ses numéros et ses références
de figures seront mis à jour, ce qui n'est pas le cas s'il édite son document
HTML. En effet, lors de l'export du document Word en HTML, il a perdu des
informations propres à l'édition. Dans ce cas on dit qu'il n'y a pas
d'équivalence entre le format de sauvegarde (".doc") et le format de
restitution (HTML).
Figure I-1 : les différentes représentations physiques d'un
document
Dans la Figure I-1, on peut voir l'enchaînement de ces différentes
représentations au cours de l'édition. Dans la majorité des environnements
auteur actuels (Director [Macromedia00c], ICON-Author [AimTech96]), il y a une
équivalence entre les deux premières représentations mais pas avec la
troisième. L'auteur, au moment de distribuer son document, l'exporte
vers un format de restitution, perdant ainsi certaines informations liées au
processus d'édition et donc, perdant aussi l'équivalence avec les structures
précédentes. Les deux inconvénients majeurs de cette approche sont :
- la limitation de l'édition à un seul outil, du fait que les formats de
sauvegarde manipulés sont souvent propriétaires, ce qui rend l'échange
de données (avec conservation du potentiel d'édition) limité. De plus,
la pérennité du document est très liée à celle de l'environnement
auteur.
- La version distribuée aux lecteurs ne contient plus les informations
permettant une réédition. De ce fait, l'auteur doit maintenir deux
versions de son document, la version qu'il peut éditer, et la version
qu'il distribue.
Ces limitations étant très contraignantes, certaines approches (CMIFed
[Hardman93], Madeus-97 [Layaïda-97]) ont essayé de maintenir une équivalence
entre les trois entités de représentation du document multimédia. L'intérêt
majeur est de permettre une distribution du document tout en gardant le
potentiel d'édition. L'émergence de nouveaux standards de présentation (par
exemple SMIL) fait penser qu'il sera possible de faire cohabiter l'exigence
d'avoir une pérennité dans l'édition et celle d'avoir un format de restitution
normalisé. Cela permettra par exemple, une réédition du document avec un autre
environnement auteur que celui qui a permis l'édition initiale du document.
Le rôle d'un environnement d'édition est donc d'offrir des représentations
les plus proches possibles les unes des autres pour permettre une édition
simple tout en favorisant la pérennité du document. Au cours du processus
d'édition, les auteurs pourront manipuler et éditer chacune de ces
représentations. Dans chacune de ces représentations on peut distinguer deux
entités : une entité donnée (ou contenu) et une entité présentation (ou
composition).
- Donnée : elle comprend différents médias qui peuvent être
statiques ou dynamiques, structurés (SMIL, HTML) ou non. La collecte ou
la création de ces médias se fait lors de la phase de production du
document.
- Présentation : cette entité définit les interactions des
différents médias les uns avec les autres ainsi qu'avec l'utilisateur.
Cette entité comprend la synchronisation spatiale, temporelle et
hypermédia mais aussi les interactions du lecteur avec le document. Lors
du processus d'édition ces informations sont initialement décrites dans
le scénario et le scénarimage avant d'être traduites dans le langage
utilisé lors de la phase de production.
Dans le cadre de cette thèse nous nous placerons essentiellement dans le cadre
de l'édition des informations de présentation du document.
4. Contexte de la thèse
Cette thèse s'est déroulée au sein du projet OPERA de l'INRIA Rhône-Alpes.
Cette équipe travaille depuis de nombreuses années dans le cadre de l'édition
de documents. Des travaux ont été menés selon plusieurs axes de recherche :
- L'édition structurée ([Quint87], [Bonhomme99]), dans laquelle
il y a une distinction très forte entre le contenu et la présentation du
document. Cela permet d'avoir plusieurs présentations pour un même
document. L'éditeur Thot a permis de valider différents paradigmes
d'édition. Pour cela, il fournit une édition structurée, cela signifie,
par exemple, que chaque élément d'un texte est typé (liste, paragraphe,
titre, sous-titre) et qu'il existe des règles de composition entre ces
différents types comme le fait qu'il n'y ait pas de titre dans une
liste. L'éditeur utilise ce typage pour présenter le document mais aussi
pour faire un ensemble de vérifications automatiques (les listes ont au
moins deux éléments, les sous-titres sont précédés de titres,). De plus,
l'éditeur Thot [Quint99] permet à l'auteur de définir un modèle de
documents indépendant de la présentation, ainsi que différents modèles
de présentation pour ce modèle. Cela permet par exemple de définir un
modèle de "référence bibliographique", et de définir plusieurs mises en
page pour celui-ci.
- L'édition coopérative, dans laquelle l'intérêt est de permettre
à plusieurs auteurs de collaborer pour écrire des documents. Les
éditeurs Alliance [Decouchant96] et Byzance [Byzance00] permettent par
exemple une telle coopération dans l'édition de documents. Le premier a
été réalisé dans le cadre de l'édition de documents structurés, le
deuxième dans le cadre de l'édition hypertexte.
- L'édition multimédia, dans laquelle l'objectif est d'intégrer
une dimension temporelle aux documents. Les thèses de Nabil Layaïda
[Layaïda97] et Loay Sabry-Ismail [Sabry99] ont permis dans un premier
temps de définir un modèle d'expression de documents multimédias riche
et souple, et, dans un deuxième temps, de réaliser un environnement
auteur appelé Madeus-97 validant ce modèle et intégrant des fonctions de
présentation. Notons que l'effort dans ces deux thèses a surtout porté
sur la définition du modèle de document ainsi que sur les services de
présentation et peu sur les services d'édition.
Ceci explique pourquoi à partir de ces travaux nous avons voulu mener une
réflexion générale sur les problèmes liés à l'édition de documents
multimédias.
5. Objectifs de la thèse
Le premier objectif de la thèse sera donc de dégager les besoins de l'auteur
au cours du processus d'édition et d'apporter une réponse à ces besoins sous
la forme d'une spécification détaillée des fonctions nécessaires dans un
environnement auteur de documents multimédia s.
La volonté de valider ces idées nous a amené à avoir une réflexion sur
l'architecture d'un environnement d'édition et à proposer une boîte à outils
pour faciliter la création d'environnements auteur.
Le deuxième objectif de la thèse sera de concevoir et réaliser cette boîte
à outils puis de la valider au travers de la réalisation de différents
environnements auteur.
6. Plan de la thèse
Cette thèse est organisée de la manière suivante :
Dans le chapitre II, je présenterai dans un premier temps une
classification des différents besoins d'un auteur de documents multimédias.
Dans un deuxième temps, je présenterai le cycle d'édition d'un document
multimédia. Je me baserai sur cette classification et sur ce cycle pour
présenter et analyser les différents formats permettant de spécifier de tels
documents. Dans une troisième étape, je présenterai les différents outils
d'édition existants aujourd'hui.
Dans le chapitre III, je ferai une proposition d'environnement d'édition
idéal permettant à l'auteur de suivre le cycle d'édition proposé dans le
chapitre II. La description de cet environnement auteur se fera en plusieurs
étapes. Pour chacun des besoins identifiés dans le chapitre précédent
j'essayerai d'apporter une réponse pertinente en m'inspirant de ce qui existe
aujourd'hui dans différents domaines liés ou non à celui du multimédia.
Dans le chapitre IV, je présenterai Kaomi. Kaomi est une boîte à outils qui
permet de construire des environnements auteur de documents multimédias
conformes aux idées décrites dans le chapitre précédent. Je présenterai
l'architecture de cette boîte à outils ainsi que les différents services
qu'elle offre.
Dans le chapitre V, je m'intéresserai plus particulièrement aux mécanismes
sous-jacents qui ont permis de réaliser cette boîte à outils. Les techniques
utilisées sont essentiellement des techniques à base de contraintes.
L'objectif de ce chapitre sera de trouver un mécanisme de résolution de
contraintes adapté à nos besoins. Pour cela, je présenterai différentes
techniques permettant de résoudre des spécifications à base de contraintes. Je
ferai cette analyse en fonction du contexte dans lequel j'utiliserai ces
techniques. Je présenterai ensuite l'intégration de ces techniques dans Kaomi
et l'évaluation des différents résolveurs de contraintes dans le cadre de
l'édition de documents multimédias. Je profiterai de cette analyse pour faire
part de certaines réflexions prospectives sur l'utilisation possible de ces
techniques et de leur apport dans un contexte comme le multimédia qui reste en
constante évolution.
Dans le chapitre VI, je présenterai les différents environnements auteur
construits à partir de Kaomi. Je conclurai ce chapitre en faisant un bilan des
différentes expériences d'utilisation de Kaomi.
Enfin, en conclusion, je tirerai un bilan de ces trois années de thèse et
je donnerai quelques pistes de recherche.
Afin de faciliter la lecture, je précise que l'état de l'art se retrouve à
trois niveaux :
- dans le chapitre II pour l'analyse des besoins de l'auteur ;
- dans le chapitre III pour l'étude des besoins en visualisation ;
- dans le chapitre V pour les mécanismes à base de contraintes.
et mes contributions se trouvent à quatre niveaux :
- la spécification d'un environnement auteur idéal, dans le chapitre III
;
- la réalisation de la boîte à outils Kaomi présentée dans le chapitre
IV ;
- l'évaluation et l'implantation de résolveurs de contraintes adaptés
aux besoins des auteurs de documents multimédias présentée dans le
chapitre V ;
- la participation à la réalisation de différents environnements auteur
présentés dans le chapitre VI.